Tudo o que você precisa saber sobre aprendizado de máquina [entrevista com cientista de dados]

Publicados: 2022-05-25

A ficção científica pintou muitos quadros de terror do futuro das máquinas dominando o mundo. Essas visões sombrias de máquinas todo-poderosas são alguns dos muitos equívocos que as pessoas têm sobre IA e aprendizado de máquina.

Neste artigo, nosso especialista em aprendizado de máquina Juuso Lassila responde às perguntas mais frequentes sobre aprendizado de máquina e nos diz por que as máquinas não estão prontas para dominar o mundo.

Aprendizado de máquina

1. O que é aprendizado de máquina?

Aprendizado de máquina significa que uma máquina pode aprender sem ser programada. Aprendizado de máquina e IA são frequentemente usados ​​erroneamente como sinônimos, mas não são a mesma coisa. O aprendizado de máquina é na verdade um subconjunto da IA.

“IA é um termo bastante mal definido. Pode significar qualquer coisa”, explica Lassila.

A grande diferença entre aprendizado de máquina e IA é que a IA nem sempre precisa de dados. Por exemplo, alguns dizem que encontrar uma rota ideal em um mapa é IA. Este processo não é baseado em dados, mas um algoritmo .

O aprendizado de máquina, por outro lado, é a IA que usa dados para aprender. O benefício do aprendizado de máquina é que o programador não precisa saber como o modelo resolve o problema. Isso significa que a máquina pode usar técnicas que o programador não conhecia. Hoje, o aprendizado de máquina desempenha um papel importante em muitos setores.

2. Como o Machine Learning é usado?

O aprendizado de máquina tenta entender os dados e as estruturas neles. Para simplificar, vamos pegar algo que a internet adora: fotos de gatos e cachorros! Portanto, se você tiver centenas de imagens de seus amigos peludos favoritos em uma ordem aleatória, poderá usar o aprendizado de máquina para diferenciar essas imagens. A máquina pode organizar os dados para que você fique apenas com fotos de gatos, por exemplo.

“O aprendizado de máquina prevê valores dos dados que você alimenta e dá sentido a esses dados”, diz Lassila.

Uma maneira comum de usar o aprendizado de máquina é para a classificação de dados, como no nosso exemplo com as fotos de cães e gatos acima. No entanto, o aprendizado de máquina também é usado em chatbots de IA e para fazer diferentes tipos de previsões. Por exemplo, o aprendizado de máquina pode ser usado para estimar o valor de uma casa com base no tamanho, localização, ano em que foi construída entre outras informações.

3. Como as máquinas aprendem?

O aprendizado de máquina geralmente tenta minimizar os erros de um modelo. Primeiro, começa com respostas aleatórias. Então os humanos dão as respostas corretas, explica Lassila.

Existe uma maneira de medir o quanto a máquina estava errada com as respostas que deu. Em alguns modelos de aprendizado de máquina, a diferenciação é usada para minimizar os erros.

Com a diferenciação, você pode calcular em que direção os parâmetros devem ser alterados para diminuir o valor da função de erro.

“Então você sabe como alterar seus parâmetros para que o valor da função diminua. Você então dá um pequeno passo em direção a um erro menor alterando os parâmetros. Dessa forma, você minimiza os erros”, diz Lassila.

4. Uma máquina pode estar livre de erros?

Em teoria, é possível que não haja erros, mas no mundo real, isso não está realmente acontecendo. Mesmo nos melhores casos, a máquina pode obter apenas 99,9% dos dados corretos.

“Para classificação, podemos medir a precisão”, diz Lassila. Normalmente, a precisão de 90-95% é considerada muito boa. Quando as margens de erro são baixas o suficiente, a máquina está pronta para entrar em produção. Quão baixa a margem de erro deve ser antes que o produto possa entrar em operação depende da tarefa que a máquina deve realizar.

Ao falar sobre chatbots de IA, é difícil dizer quando o bot será mais útil do que irritante, pois os chatbots de IA podem ter o maior número possível de perguntas de exemplo. A máquina sempre tem que escolher a melhor das respostas disponíveis. O quanto a máquina está correta depende de quantas perguntas de exemplo existem.

“Se você tem uma pergunta, a máquina está sempre correta. Se você tiver duas, espera-se que esteja correto com bastante frequência, mas se você tiver 100 perguntas, é provável que a máquina escolha a resposta errada”, explica Lassila.

5. O que é aprendizagem profunda?

O aprendizado profundo é um método de aprendizado de máquina que usa camadas nos modelos. Uma camada produz uma saída e essa saída é transferida para a segunda camada e assim por diante. O aprendizado profundo geralmente é feito em redes neurais .

“As redes neurais são bastante úteis porque se adaptam bem a diferentes formatos de entrada e saída”, diz Lassila.

As redes neurais são muito versáteis e, por isso, têm muitos casos de uso. Os chatbots de IA geralmente também usam redes neurais.

“Criamos esses embeddings de frases a partir de mensagens que são apenas pontos vetoriais no espaço. Em seguida, medimos suas semelhanças. Ele usa uma rede neural. Tem muitas camadas e dá saída no final”, explica Lassila.

Existem também muitos métodos de aprendizado de máquina que não são profundos. Como máquinas de vetor de suporte ou árvores de decisão .

6. Quais são os gargalos do aprendizado de máquina?

Os dados são uma daquelas coisas que causam limitações ao aprendizado de máquina. Se você não tiver dados, o aprendizado de máquina não funcionará. Você também precisa de recursos computacionais. Muitas vezes, os modelos também causam limitações.

“Para tarefas básicas, como classificação, os modelos são bons. E nesses casos, você está limitado apenas por dados e recursos computacionais. Mas em alguns domínios, os modelos ainda não são tão bons”, diz Lassila.

Quanto mais dados, melhor, desde que você tenha os recursos para computar esses dados. Mas, os dados têm que ser de boa qualidade. Além disso, os modelos precisam ser grandes para que o modelo seja capaz de lidar com todas as entradas complexas que ele possa obter. Você precisa de muito poder de processamento para a máquina lidar com esses dados.

“Você pode ter acesso a muitos dados. Esse não é o problema realmente.” diz Lassila. “A questão são os modelos e o tempo que leva para treiná-los. É necessária muita memória para armazenar esses modelos.”

Outra armadilha do aprendizado de máquina é a arquitetura de modelo atualmente disponível para algumas tarefas. Não há uma boa arquitetura de modelo para incorporação de sentenças no momento.

“Ainda é uma pesquisa em andamento para encontrar um modelo realmente bom”, diz Lassila.

7. Como você ensina uma máquina?

Primeiro, você precisa de muitos dados, e os dados que você usa para treinar os modelos precisam de rótulos humanos.

“Grandes empresas que usam aprendizado de máquina têm exércitos de pessoas que apenas rotulam os dados”, explica Lassila.

Mesmo que o bot possa começar a rotular os dados com o tempo, você não deseja usar as respostas que o modelo fornece como dados de treinamento. Os modelos cometem mais erros do que os humanos. Se você usar a rotulagem da máquina como dados de treinamento, você ensinará esses erros novamente aos modelos.

“Isso fará com que os erros cresçam cada vez mais. “

Também é possível usar o aprendizado ativo onde os modelos podem dizer que tipo de pontos de dados seria útil rotular. Isso pode tornar o aprendizado mais eficiente. “A máquina pode orientar o processo de rotulagem. Ainda assim, os humanos devem fazer a rotulagem para que os erros não se propaguem. “

Uma vez que os humanos tenham treinado um modelo com os dados, a máquina deve ser capaz de reproduzir essa rotulagem para as entradas invisíveis. Mas se você precisar de novas respostas, os dados precisam ser rotulados novamente por humanos.

O futuro da IA

8. Qual é o futuro do aprendizado de máquina?

O aprendizado de máquina está se desenvolvendo muito rápido no momento. Há alguns anos, outro modelo de aprendizado profundo, o modelo do transformador, foi introduzido. A descoberta do modelo do transformador teve um enorme impacto no aprendizado de máquina.

“Estamos reconstruindo todo o campo de pesquisa em torno dessa descoberta. Realmente funcionou bem”, explica Lassila.

O modelo de transformador também é usado em chatbots de IA com Processamento de Linguagem Natural. “Mas em algum momento, chegaremos ao fim do caminho sobre o quão bem podemos usar essa arquitetura”, diz Lassila. “Espero que encontremos algo novo que dê resultados ainda melhores.”

9. As máquinas vão dominar o mundo?

As pessoas esperam muito ou pouco da IA ​​e do aprendizado de máquina.

“Há uma falta de compreensão das capacidades da IA”, diz Lassila.

Então parece que as máquinas ainda não vão dominar o mundo. Os bots têm alguns obstáculos a superar antes que isso aconteça.

“Os modelos e a arquitetura ainda não estão lá. Temos os dados e os recursos computacionais para fazer uma boa IA, mas ainda precisamos dessas boas arquiteturas para que os robôs assumam o controle.”

Mesmo que a IA ainda não esteja pronta para dominar o mundo, ela assumirá alguns empregos.

“Alguns trabalhos podem ser substituídos por IA em alguns pontos. Esses seriam trabalhos repetitivos que não exigem muito raciocínio”, diz Lassila.

Existem duas maneiras de pensar sobre como a IA mudará o mercado de trabalho. Uma é que a IA substitui os empregos, mas também pode melhorar os empregos. Ele pode trabalhar ao lado de humanos. Um bom exemplo disso são os chatbots , que podem se conectar a um agente ao vivo quando não conseguem ajudar o visitante do site.

“A IA pode melhorar a eficiência de muitos trabalhos.”

No entanto, você ainda precisa de recursos humanos para combater as imprecisões. A IA não pensa como um humano. Ele usa métodos diferentes. E às vezes não faz sentido para nós porque mostra alguma coisa.

“Um dos maiores problemas com a IA é que a máquina não explica por que criou uma determinada saída. Pode fazer sentido para o modelo, mas não para humanos.”

Se você quiser saber mais sobre aprendizado de máquina e IA, confira nosso guia de chatbot de IA .