Cómo el sesgo en la IA puede dañar los datos de marketing y qué puede hacer al respecto
Publicado: 2023-02-23Los algoritmos están en el corazón del marketing y martech. Se utilizan para el análisis de datos, la recopilación de datos, la segmentación de la audiencia y mucho, mucho más. Eso es porque están en el corazón de la inteligencia artificial que se basa en ellos. Los especialistas en marketing confían en los sistemas de inteligencia artificial para proporcionar datos neutrales y confiables. Si no es así, puede desviar sus esfuerzos de marketing.
Nos gusta pensar en los algoritmos como conjuntos de reglas sin prejuicios ni intenciones. En sí mismos, eso es exactamente lo que son. No tienen opiniones.. Pero esas reglas están construidas sobre las suposiciones y valores de su creador. Esa es una forma en que el sesgo entra en la IA. La otra forma, y quizás más importante, es a través de los datos con los que se entrena.
Excavar más hondo: Bard y ChatGPT finalmente mejorarán la experiencia de búsqueda
Por ejemplo, los sistemas de reconocimiento facial se entrenan en conjuntos de imágenes de personas en su mayoría de piel más clara. Como resultado, son notoriamente malos para reconocer a las personas de piel más oscura. En un caso, 28 miembros del Congreso, en su mayoría personas de color, fueron emparejados incorrectamente con imágenes de fichas policiales. El fracaso de los intentos de corregir esto ha llevado a algunas empresas, sobre todo Microsoft, a dejar de vender estos sistemas a los departamentos de policía.
ChatGPT, Bard de Google y otros chatbots impulsados por IA son modelos de lenguaje autorregresivos que utilizan aprendizaje profundo para producir texto. Ese aprendizaje se basa en un gran conjunto de datos, que posiblemente abarque todo lo publicado en Internet durante un período de tiempo determinado: un conjunto de datos plagado de errores, desinformación y, por supuesto, sesgo.
Tan bueno como los datos que obtiene
“Si le das acceso a Internet, inherentemente tiene cualquier sesgo que exista”, dice Paul Roetzer, fundador y director ejecutivo de The Marketing AI Institute. “Es solo un espejo de la humanidad en muchos sentidos”.
Los constructores de estos sistemas son conscientes de ello.
"En las divulgaciones y descargos de responsabilidad [del creador de ChatGPT] OpenAI, dicen que el sentimiento negativo está más asociado con los nombres de mujeres afroamericanas que cualquier otro nombre establecido allí", dice Christopher Penn, cofundador y científico jefe de datos de TrustInsights.ai. “Entonces, si tiene algún tipo de modelo de sentimiento de caja negra completamente automatizado y está juzgando los nombres de pila de las personas, si Letitia obtiene una puntuación más baja que Laura, tiene un problema. Estás reforzando estos sesgos”.
Los documentos de mejores prácticas de OpenAI también dicen: "Desde alucinaciones de información inexacta hasta resultados ofensivos, sesgos y mucho más, los modelos de lenguaje pueden no ser adecuados para todos los casos de uso sin modificaciones significativas".
¿Qué debe hacer un vendedor?
Mitigar el sesgo es esencial para los especialistas en marketing que desean trabajar con los mejores datos posibles. Eliminarlo será para siempre un objetivo en movimiento, un objetivo a perseguir pero no necesariamente alcanzar.
“Lo que deberían estar pensando los especialistas en marketing y las empresas de tecnología de punta es: '¿Cómo aplicamos esto en los datos de capacitación que ingresan para que el modelo tenga menos sesgos para empezar que tenemos que mitigar más adelante?'”, dice Christopher Penn. “No pongas basura, no tienes que filtrar la basura”.
Hay herramientas que pueden ayudarte a hacer esto. Aquí están los cinco más conocidos:
- What-If de Google es una herramienta de código abierto para ayudar a detectar la existencia de sesgo en un modelo mediante la manipulación de puntos de datos, la generación de gráficos y la especificación de criterios para probar si los cambios afectan el resultado final.
- AI Fairness 360 de IBM es un conjunto de herramientas de código abierto para detectar y eliminar sesgos en los modelos de aprendizaje automático.
- Aprendizaje justo de Microsoft diseñado para ayudar a navegar por las compensaciones entre la equidad y el rendimiento del modelo.
- Modelo Local Interpretable-Explicaciones Agnósticas (LIME) creado por el investigador Marco Tulio Ribeiro permite a los usuarios manipular diferentes componentes de un modelo para comprender mejor y poder señalar la fuente del sesgo, si existe.
- FairML de Julius Adebayo del MIT es una caja de herramientas integral para auditar modelos predictivos mediante la cuantificación de la importancia relativa de las entradas del modelo.
“Son buenos cuando sabes lo que estás buscando”, dice Penn. “Son menos buenos cuando no estás seguro de lo que hay en la caja”.
Juzgar las entradas es la parte fácil
Por ejemplo, dice, con AI Fairness 360, puede darle una serie de decisiones de préstamo y una lista de clases protegidas: edad, género, raza, etcétera. Luego puede identificar cualquier sesgo en los datos de entrenamiento o en el modelo y hacer sonar una alarma cuando el modelo comienza a desviarse en una dirección sesgada.
“Cuando estás haciendo generación, es mucho más difícil hacer eso, especialmente si estás haciendo copias o imágenes”, dice Penn. "Las herramientas que existen en este momento están destinadas principalmente a datos rectangulares tabulares con resultados claros que intenta mitigar".
Los sistemas que generan contenido, como ChatGPT y Bard, son increíblemente intensivos en computación. Agregar salvaguardas adicionales contra el sesgo tendrá un impacto significativo en su desempeño. Esto se suma a la ya difícil tarea de construirlos, así que no espere una resolución pronto.
no puedo permitirme esperar
Debido al riesgo de la marca, los especialistas en marketing no pueden darse el lujo de sentarse y esperar a que los modelos se arreglen solos. La mitigación que deben hacer para el contenido generado por IA es preguntarse constantemente qué podría salir mal. Las mejores personas para preguntar son de los esfuerzos de diversidad, equidad e inclusión.

“Las organizaciones hablan mucho de las iniciativas de DEI”, dice Penn, “pero aquí es donde DEI realmente puede brillar. [Haga que] el equipo de diversidad… inspeccione los resultados de los modelos y diga: 'Esto no está bien o esto está bien'. Y luego hacer que eso se integre en los procesos, como si DEI le hubiera dado su sello de aprobación”.
La forma en que las empresas definan y mitiguen el sesgo en todos estos sistemas serán marcadores importantes de su cultura.
“Cada organización tendrá que desarrollar sus propios principios sobre cómo desarrollar y utilizar esta tecnología”, dice Paul Roetzer. "Y no sé de qué otra manera se resuelve, aparte de ese nivel subjetivo de 'esto es lo que consideramos que es el sesgo y usaremos, o no, herramientas que permitan que esto suceda".
¡Consigue MarTech! A diario. Gratis. En tu bandeja de entrada.
Ver términos.

Historias relacionadas
Nuevo en MarTech