Todo lo que necesita saber sobre el aprendizaje automático [Entrevista al científico de datos]
Publicado: 2022-05-25La ciencia ficción ha pintado muchas imágenes de terror del futuro de las máquinas que se apoderan del mundo. Estas sombrías visiones de máquinas todopoderosas son algunos de los muchos conceptos erróneos que la gente tiene sobre la IA y el aprendizaje automático.
En este artículo, nuestro especialista en aprendizaje automático, Juuso Lassila , responde las preguntas más frecuentes sobre el aprendizaje automático y nos explica por qué las máquinas aún no están listas para dominar el mundo.
1. ¿Qué es el aprendizaje automático?
El aprendizaje automático significa que una máquina puede aprender sin ser programada. El aprendizaje automático y la IA a menudo se usan erróneamente como sinónimos, pero no son lo mismo. El aprendizaje automático es en realidad un subconjunto de la IA.
“IA es un término bastante mal definido. Puede significar cualquier cosa”, explica Lassila.
La gran diferencia entre el aprendizaje automático y la IA es que la IA no siempre necesita datos. Por ejemplo, algunos dicen que encontrar una ruta óptima en un mapa es IA. Este proceso no está basado en datos sino en un algoritmo .
El aprendizaje automático, por otro lado, es IA que usa datos para aprender. El beneficio del aprendizaje automático es que el programador no necesita saber cómo el modelo resuelve el problema. Esto significa que la máquina puede usar técnicas que el programador no conocía. Hoy en día, el aprendizaje automático juega un papel importante en muchas industrias.
2. ¿Cómo se utiliza el aprendizaje automático?
El aprendizaje automático intenta comprender los datos y las estructuras que contienen. En pocas palabras, tomemos algo que ama Internet: ¡fotos de gatos y perros! Entonces, si tiene cientos de imágenes de sus amigos peludos favoritos en un orden aleatorio, puede usar el aprendizaje automático para diferenciar entre estas imágenes. La máquina puede organizar los datos para que termines con solo imágenes de gatos, por ejemplo.
“El aprendizaje automático predecirá valores a partir de los datos que le proporciones y dará sentido a esos datos”, dice Lassila.
Una forma común de usar el aprendizaje automático es para la clasificación de datos, como en nuestro ejemplo con las imágenes de gatos y perros de arriba. Sin embargo, el aprendizaje automático también se usa en chatbots de IA y para hacer diferentes tipos de predicciones. Por ejemplo, el aprendizaje automático se puede utilizar para estimar el valor de una casa en función del tamaño, la ubicación, el año en que se construyó, entre otra información.
3. ¿Cómo aprenden las máquinas?
El aprendizaje automático generalmente intenta minimizar los errores de un modelo. Primero, comienza con respuestas aleatorias. Luego, los humanos le dan las respuestas correctas, explica Lassila.
Hay una forma de medir qué tan equivocada estaba la máquina con las respuestas que daba. En algunos modelos de aprendizaje automático, se utiliza la diferenciación para minimizar los errores.
Con la diferenciación, puede calcular en qué dirección se deben cambiar los parámetros para disminuir el valor de la función de error.
“Entonces sabes cómo cambiar tus parámetros para que el valor de la función disminuya. Luego da un pequeño paso hacia un error más pequeño cambiando los parámetros. De esa forma minimizas los errores”, dice Lassila.
4. ¿Puede una máquina estar libre de errores?
En teoría, es posible que no haya errores, pero en el mundo real, realmente no está sucediendo. Incluso en los mejores casos, la máquina solo puede obtener quizás el 99,9% de los datos correctos.
“Para la clasificación, podemos medir la precisión”, dice Lassila. Por lo general, una precisión del 90-95 % se considera bastante buena. Cuando los márgenes de error son lo suficientemente bajos, la máquina está lista para entrar en producción. Qué tan bajo debe ser el margen de error antes de que el producto pueda funcionar depende de la tarea que se supone que debe hacer la máquina.
Cuando se habla de chatbots de IA, es difícil decir cuándo el bot será más útil que molesto, ya que los chatbots de IA pueden tener tantas preguntas de ejemplo como sea posible. La máquina siempre tiene que elegir la mejor de las respuestas disponibles. La precisión de la máquina depende de cuántas preguntas de ejemplo haya.
“Si tiene una pregunta, la máquina siempre tiene la razón. Si tiene dos, es de esperar que sea correcto con bastante frecuencia, pero si tiene 100 preguntas, es muy probable que la máquina elija la respuesta incorrecta”, explica Lassila.
5. ¿Qué es el aprendizaje profundo?
El aprendizaje profundo es un método de aprendizaje automático que utiliza capas en los modelos. Una capa produce una salida y esa salida se transfiere a la segunda capa y así sucesivamente. El aprendizaje profundo generalmente se realiza en redes neuronales .
“Las redes neuronales son bastante útiles porque se adaptan bien a diferentes formatos de entrada y salida”, dice Lassila.
Las redes neuronales son muy versátiles, y por eso tienen muchos casos de uso. Los chatbots de IA también suelen utilizar redes neuronales.
“Creamos esas incrustaciones de oraciones a partir de mensajes que son solo puntos vectoriales en el espacio. Luego medimos sus similitudes. Utiliza una red neuronal. Tiene muchas capas y da resultados al final”, explica Lassila.
También hay muchos métodos de aprendizaje automático que no son profundos. Tales como máquinas de vectores de soporte o árboles de decisión .
6. ¿Cuáles son los cuellos de botella del aprendizaje automático?
Los datos son una de esas cosas que causan limitaciones al aprendizaje automático. Si no tiene datos, el aprendizaje automático no funcionará. También necesita recursos computacionales. A menudo, los modelos también causan limitaciones.

“Para tareas básicas, como clasificación, los modelos son buenos. Y en esos casos, solo está limitado por los datos y los recursos computacionales. Pero en algunos dominios, los modelos aún no son tan buenos”, dice Lassila.
Cuantos más datos, mejor, siempre que tenga los recursos para calcular esos datos. Pero, los datos tienen que ser de buena calidad. Además, los modelos deben ser grandes para que el modelo pueda manejar todas las entradas complejas que pueda recibir. Necesita mucha potencia de procesamiento para que la máquina maneje esos datos.
“Puedes tener acceso a una gran cantidad de datos. Ese no es el problema realmente”. dice Lassila. “El tema son los modelos y el tiempo que lleva entrenarlos. Se necesita mucha memoria para almacenar estos modelos”.
Otro escollo del aprendizaje automático es la arquitectura modelo actualmente disponible para algunas tareas. No existe una buena arquitectura modelo para incrustaciones de oraciones en este momento.
“Todavía es una investigación en curso para encontrar un modelo realmente bueno”, dice Lassila.
7. ¿Cómo se enseña a una máquina?
En primer lugar, necesita una gran cantidad de datos, y los datos que usa para entrenar los modelos necesitan etiquetas humanas.
“Las grandes empresas que utilizan el aprendizaje automático tienen ejércitos de personas que simplemente etiquetan los datos”, explica Lassila.
Incluso si el bot puede comenzar a etiquetar los datos con el tiempo, no desea utilizar las respuestas que le brinda el modelo como datos de entrenamiento. Los modelos cometen más errores que los humanos. Si usa el etiquetado de la máquina como datos de entrenamiento, vuelve a enseñar esos errores a los modelos.
“Eso hará que los errores sean cada vez más grandes. “
También es posible utilizar el aprendizaje activo donde los modelos pueden decir qué tipo de puntos de datos sería útil etiquetar. Esto puede hacer que el aprendizaje sea más eficiente. “La máquina puede guiar el proceso de etiquetado. Aún así, los humanos deberían hacer el etiquetado para que los errores no se propaguen. “
Una vez que los humanos hayan entrenado un modelo con los datos, la máquina debería poder reproducir ese etiquetado para las entradas invisibles. Pero si necesita nuevas respuestas, los humanos deben etiquetar nuevamente los datos.
8. ¿Cuál es el futuro del aprendizaje automático?
El aprendizaje automático se está desarrollando muy rápido en este momento. Hace unos años se introdujo otro modelo de aprendizaje profundo, el modelo transformador. El descubrimiento del modelo de transformador ha tenido un gran impacto en el aprendizaje automático.
“Hemos estado reconstruyendo todo el campo de investigación en torno a ese descubrimiento. Ha funcionado realmente bien”, explica Lassila.
El modelo de transformador también se usa en chatbots de IA con procesamiento de lenguaje natural. “Pero en algún momento, llegaremos al final del camino sobre qué tan bien podemos usar esa arquitectura”, dice Lassila. “Ojalá encontremos algo nuevo que dé aún mejores resultados”.
9. ¿Se apoderarán las máquinas del mundo?
La gente espera demasiado o no lo suficiente de la IA y el aprendizaje automático.
“Hay una falta de comprensión de las capacidades de la IA”, dice Lassila.
Así que parece que las máquinas no dominarán el mundo todavía. Los bots tienen algunos obstáculos que superar antes de que eso suceda.
“Los modelos y la arquitectura aún no están allí. Tenemos los datos y los recursos computacionales para hacer una buena IA, pero aún necesitamos esas buenas arquitecturas para que los robots tomen el control”.
Aunque la IA aún no está lista para dominar el mundo, se hará cargo de algunos trabajos.
“Algunos trabajos pueden ser reemplazados por IA en algunos puntos. Estos serían trabajos repetitivos que no requieren pensar mucho”, dice Lassila.
Hay dos formas de pensar en cómo la IA cambiará el mercado laboral. Una es que la IA reemplaza los trabajos, pero también podría mejorarlos. Puede funcionar junto con los humanos. Un buen ejemplo de esto son los chatbots , que pueden conectarse a un agente en vivo cuando no pueden ayudar al visitante del sitio web.
“La IA puede mejorar la eficiencia de muchos trabajos”.
Sin embargo, aún necesita recursos humanos para combatir las imprecisiones. La IA no piensa como un humano. Utiliza diferentes métodos. Y a veces no tiene sentido para nosotros por qué muestra algo.
“Uno de los mayores problemas con la IA es que la máquina no explica por qué creó una determinada salida. Podría tener sentido para el modelo, pero no para los humanos.“
Si desea obtener más información sobre el aprendizaje automático y la IA, consulte nuestra guía de chatbot de IA .