Tout ce que vous devez savoir sur le Machine Learning [Interview de Data Scientist]
Publié: 2022-05-25La science-fiction a peint de nombreuses images d'horreur de l'avenir des machines conquérant le monde. Ces sombres visions de machines toutes-puissantes font partie des nombreuses idées fausses que les gens ont sur l'IA et l'apprentissage automatique.
Dans cet article, notre spécialiste de l'apprentissage automatique Juuso Lassila répond aux questions les plus fréquemment posées sur l'apprentissage automatique et nous explique pourquoi les machines ne sont pas tout à fait prêtes à conquérir le monde.
1. Qu'est-ce que l'apprentissage automatique ?
L'apprentissage automatique signifie qu'une machine peut apprendre sans être programmée. L'apprentissage automatique et l'IA sont souvent utilisés à tort comme des synonymes, mais ils ne sont pas identiques. L'apprentissage automatique est en fait un sous-ensemble de l'IA.
« L'IA est un terme assez mal défini. Cela peut signifier n'importe quoi », explique Lassila.
La grande différence entre l'apprentissage automatique et l'IA est que l'IA n'a pas toujours besoin de données. Par exemple, certains disent que trouver un itinéraire optimal sur une carte relève de l'IA. Ce processus n'est pas basé sur des données mais sur un algorithme .
L'apprentissage automatique, quant à lui, est une IA qui utilise des données pour apprendre. L'avantage de l'apprentissage automatique est que le programmeur n'a pas besoin de savoir comment le modèle résout le problème. Cela signifie que la machine peut utiliser des techniques dont le programmeur n'était pas conscient. Aujourd'hui, l'apprentissage automatique joue un rôle important dans de nombreuses industries.
2. Comment l'apprentissage automatique est-il utilisé ?
L'apprentissage automatique essaie de comprendre les données et les structures qu'elles contiennent. Pour faire simple, prenons quelque chose qu'Internet adore : les photos de chats et de chiens ! Ainsi, si vous avez des centaines d'images de vos amis à fourrure préférés dans un ordre aléatoire, vous pouvez utiliser l'apprentissage automatique pour différencier ces images. La machine peut organiser les données de sorte que vous vous retrouviez avec uniquement des photos de chats, par exemple.
"L'apprentissage automatique prédira les valeurs des données que vous lui fournissez et donnera un sens à ces données", explique Lassila.
Une façon courante d'utiliser l'apprentissage automatique consiste à classer les données, comme dans notre exemple avec les images de chats et de chiens ci-dessus. Cependant, l'apprentissage automatique est également utilisé dans les chatbots IA et pour faire différents types de prédictions. Par exemple, l'apprentissage automatique peut être utilisé pour estimer la valeur d'une maison en fonction de la taille, de l'emplacement, de l'année de construction, entre autres informations.
3. Comment les machines apprennent-elles ?
L'apprentissage automatique essaie généralement de minimiser les erreurs d'un modèle. Tout d'abord, cela commence par des réponses aléatoires. Ensuite, les humains lui donnent les bonnes réponses, explique Lassila.
Il existe un moyen de mesurer à quel point la machine s'est trompée avec les réponses qu'elle a données. Dans certains modèles d'apprentissage automatique, la différenciation est utilisée pour minimiser les erreurs.
Avec la différenciation, vous pouvez calculer dans quelle direction les paramètres doivent être modifiés afin de diminuer la valeur de la fonction d'erreur.
« Ensuite, vous savez comment modifier vos paramètres pour que la valeur de la fonction diminue. Vous faites alors un petit pas vers une erreur plus petite en modifiant les paramètres. De cette façon, vous minimisez les erreurs », explique Lassila.
4. Une machine peut-elle être sans erreur ?
En théorie, il est possible qu'il n'y ait pas d'erreurs mais dans le monde réel, cela ne se produit pas vraiment. Même dans le meilleur des cas, la machine ne peut obtenir que 99,9 % des données correctes.
"Pour la classification, nous pouvons mesurer la précision", explique Lassila. Habituellement, une précision de 90 à 95 % est considérée comme assez bonne. Lorsque les marges d'erreur sont suffisamment faibles, la machine est prête à entrer en production. La marge d'erreur doit être faible avant que le produit puisse être mis en ligne dépend de la tâche que la machine est censée effectuer.
Quand on parle de chatbots IA, il est difficile de dire quand le bot sera plus utile qu'ennuyeux puisque les chatbots IA peuvent avoir autant d'exemples de questions que possible. La machine doit toujours choisir la meilleure des réponses disponibles. La précision de la machine dépend du nombre d'exemples de questions.
« Si vous avez une question, la machine a toujours raison. Si vous en avez deux, c'est, espérons-le, assez souvent correct, mais si vous avez 100 questions, la machine risque fort de choisir la mauvaise réponse », explique Lassila.
5. Qu'est-ce que l'apprentissage en profondeur ?
L'apprentissage en profondeur est une méthode d'apprentissage automatique qui utilise des couches dans les modèles. Une couche produit une sortie et cette sortie est transférée à la deuxième couche et ainsi de suite. L'apprentissage en profondeur se fait généralement dans des réseaux de neurones .
"Les réseaux de neurones sont très pratiques car ils s'adaptent bien aux différents formats d'entrée et de sortie", explique Lassila.
Les réseaux de neurones sont très polyvalents, et c'est pourquoi ils ont de nombreux cas d'utilisation. Les chatbots IA utilisent également généralement des réseaux de neurones.
« Nous créons ces incorporations de phrases à partir de messages qui ne sont que des points vectoriels dans l'espace. Ensuite, nous mesurons leurs similitudes. Il utilise un réseau de neurones. Il a beaucoup de couches et ça donne un résultat à la fin », explique Lassila.
Il existe également de nombreuses méthodes d'apprentissage automatique qui ne sont pas profondes. Tels que les machines à vecteurs de support ou les arbres de décision .
6. Quels sont les goulots d'étranglement de l'apprentissage automatique ?
Les données sont l'une de ces choses qui limitent l'apprentissage automatique. Si vous n'avez pas de données, l'apprentissage automatique ne fonctionnera pas. Vous avez également besoin de ressources informatiques. Souvent, les modèles entraînent également des limitations.

« Pour les tâches de base, comme la classification, les modèles sont bons. Et dans ces cas, vous êtes simplement limité par les données et les ressources informatiques. Mais dans certains domaines, les modèles ne sont pas encore aussi bons », dit Lassila.
Plus il y a de données, mieux c'est, tant que vous disposez des ressources nécessaires pour calculer ces données. Mais les données doivent être de bonne qualité. De plus, les modèles doivent être volumineux pour que le modèle soit capable de gérer toutes les entrées complexes qu'il pourrait recevoir. Vous avez besoin de beaucoup de puissance de traitement pour que la machine gère ces données.
« Vous pouvez avoir accès à beaucoup de données. Là n'est pas vraiment le problème. » dit Lassila. « Le problème, ce sont les modèles et le temps qu'il faut pour les former. Il faut beaucoup de mémoire pour stocker ces modèles.
Un autre écueil de l'apprentissage automatique est l'architecture de modèle actuellement disponible pour certaines tâches. Il n'y a pas de bonne architecture de modèle pour les incorporations de phrases pour le moment.
"La recherche est toujours en cours pour trouver un très bon modèle", déclare Lassila.
7. Comment enseigner une machine ?
Tout d'abord, vous avez besoin de beaucoup de données, et les données que vous utilisez pour former les modèles ont besoin d'étiquettes humaines.
"Les grandes entreprises qui utilisent l'apprentissage automatique ont des armées de personnes qui se contentent d'étiqueter les données", explique Lassila.
Même si le bot peut commencer à étiqueter les données avec le temps, vous ne voulez pas utiliser les réponses que le modèle vous donne comme données d'entraînement. Les modèles font plus d'erreurs que les humains. Si vous utilisez l'étiquetage de la machine comme données d'apprentissage, vous réenseignez ces erreurs aux modèles.
« Cela rendra les erreurs de plus en plus grosses. "
Il est également possible d'utiliser l'apprentissage actif où les modèles peuvent indiquer le type de points de données qu'il serait utile d'étiqueter. Cela peut rendre l'apprentissage plus efficace. « La machine peut guider le processus d'étiquetage. Pourtant, les humains devraient faire l'étiquetage afin que les erreurs ne se propagent pas. "
Une fois que les humains ont formé un modèle avec les données, la machine devrait être capable de reproduire cet étiquetage pour les entrées invisibles. Mais si vous avez besoin de nouvelles réponses, les données doivent être à nouveau étiquetées par des humains.
8. Quel est l'avenir de l'apprentissage automatique ?
L'apprentissage automatique se développe très rapidement en ce moment. Il y a quelques années, un autre modèle d'apprentissage en profondeur, le modèle du transformateur, a été introduit. La découverte du modèle de transformateur a eu un impact énorme sur l'apprentissage automatique.
«Nous avons reconstruit tout le domaine de la recherche autour de cette découverte. Cela a vraiment bien fonctionné », explique Lassila.
Le modèle de transformateur est également utilisé dans les chatbots IA avec traitement du langage naturel. "Mais à un moment donné, nous atteindrons la fin de la route sur la façon dont nous pouvons utiliser cette architecture", déclare Lassila. "J'espère que nous trouverons quelque chose de nouveau qui donne des résultats encore meilleurs."
9. Les machines vont-elles conquérir le monde ?
Les gens attendent trop ou pas assez de l'IA et de l'apprentissage automatique.
"Il y a un manque de compréhension des capacités de l'IA", déclare Lassila.
Il semble donc que les machines ne domineront pas encore le monde. Les robots ont quelques obstacles à surmonter avant que cela ne se produise.
« Les modèles et l'architecture ne sont pas encore là. Nous avons les données et les ressources de calcul pour créer une bonne IA, mais nous avons toujours besoin de ces bonnes architectures pour que les robots prennent le relais. »
Même si l'IA n'est pas encore prête à conquérir le monde, elle prendra en charge certains emplois.
"Certains emplois pourraient être remplacés par l'IA à certains moments. Ce seraient des tâches répétitives qui ne nécessitent pas beaucoup de réflexion », explique Lassila.
Il y a deux façons de penser à la manière dont l'IA va changer le marché du travail. La première est que l'IA remplace les emplois, mais elle pourrait également améliorer les emplois. Il peut travailler aux côtés des humains. Un bon exemple de cela sont les chatbots , qui peuvent se connecter à un agent en direct lorsqu'ils ne sont pas en mesure d'aider le visiteur du site Web.
"L'IA peut améliorer l'efficacité de nombreux travaux."
Cependant, vous avez encore besoin de ressources humaines pour lutter contre les inexactitudes. L'IA ne pense pas comme un humain. Il utilise différentes méthodes. Et parfois, cela n'a pas de sens pour nous pourquoi cela montre quelque chose.
"L'un des plus gros problèmes avec l'IA est que la machine n'explique pas pourquoi elle a créé une certaine sortie. Cela pourrait avoir du sens pour le modèle, mais pas pour les humains.“
Si vous souhaitez en savoir plus sur l'apprentissage automatique et l'IA, consultez notre guide du chatbot sur l'IA .