Vídeo de la intervención de Israel Muñoz Moreno en el Congreso Internacional ACE de la Enología y el Cava 2024 el 15 de noviembre de 2024, y resumen de su ponencia.

El ponente es investigador del IRTA, empresa pública de la Generalitat de Catalunya dedicada a la investigación del sector alimentario. Es una entidad “hermana” del INCAVI (sector del vino), ya que dependen del mismo departamento y colaboran con él. Trabaja en proyectos en los que obtiene información de grupos de discusión en redes sociales. Estudian tres grandes áreas: la producción vegetal, la producción animal y la industria alimentaria. Y es en esta última donde el ponente ha adquirido experiencia: en la investigación e innovación en el procesado de alimentos y en el tema de consumidores.

La presentación tiene como objetivo indicar cómo la IA puede ayudarnos a conocer a nuestros consumidores a partir de lo que hablan, por ejemplo, del “mundo del vino”, sobre todo en redes sociales.

“¿Cómo podemos, a partir de la información que hay en las redes, obtener datos valiosos? El mundo del marqueting ha cambiado mucho, ahora ya no solo es cuestión de hacer una campaña publicitaria, sino que hay que tener en cuenta los famosos “influencer”, que tienen un poder de convocatoria superior a los demás.”

“El uso de la IA tal como la conocemos hoy está contribuyendo de forma importante al análisis de todo tipo de información. Pero solo hace 10 años, un equipo desarrolló una serie de redes, aunque nadie sabía cómo ‘entrenarlas’. Presentaron el análisis por computador, así como sus algoritmos y arrasaron. Mediante una serie de grupos matemáticos, extremadamente sencillos y simples, lograron una revolución que conocemos ahora.”

Presenta el procesamiento del lenguaje natural, que es la gran revolución: “Hace seis o siete años en cuanto al tema de texto, había una serie de redes que ya se utilizaban para algunos problemas, y eran las redes recurrentes o los LSTM que eran capaces de generar texto, pero lo generaban de forma que no tenía sentido. Llegó esta tecnología, que se denomina transformers, y revolucionó todo y permite lo que hoy es ChatGPT.”

Hay dos tecnologías, la Encoder (Bert) y la Decoder (que es el ChatGPT). La tecnología Encoder sirve para clasificar textos, importante cuando se tiene un gran volumen de información. El procesamiento del lenguaje natural, Bert training, se basa en una serie de sumas, restas, multiplicaciones y divisiones; se trata de millones de parámetros.
A pesar de que es un tema que no desarrollará en esta ponencia, explica  un poco lo que es el Decoder.

“En la tecnología Decoder, al sistema se le enseña el lenguaje de manera que sea capaz de predecir las palabras que le faltan. Se tiene un texto con una serie de palabras y le decimos: busca qué palabra le toca aquí. Entonces se le enseña diciéndole la palabra que falta. Con ello aprende el lenguaje. Este sistema tiene cientos o miles de millones de parámetros. Lo que se hace en el proceso de aprendizaje es ajustar los valores de los parámetros. Una vez entrenado, le pregunto ¿qué palabra va aquí? De las probabilidades que tiene, él elige la que utiliza. Cuando utilizáis el ChatGPT, puede suceder que a una misma pregunta dé dos respuestas diferentes entre sí, como opciones posibles de respuesta del sistema.“
“El ejemplo más típico del ChatGTP, que ya no se utiliza, seria ‘resúmeme esto’ y arriba le doy la solución. Entonces el sistema, en cierta manera, aprende a resumir (se trata de miles y miles de parámetros internos que se van ajustando). Posee una serie de ‘becarios’ que le hacen una pregunta y si el sistema contesta con una respuesta un poco rara, entonces tenemos a ‘alguien’ que se dedica a decirle que esta respuesta debe ser exactamente así, y el sistema se va reajustando a dar una respuesta más acorde con la pregunta.”

Hace un pequeño inciso antes de entrar en la temática que desea explicar.
Redes Sociales. Enseña un post de Instagram, pero que puede valer para Twitter o para grupos de discusión, en el que se ve una foto de una persona con una copa de vino (imagen), un post (texto) y comentarios de los usuarios sobre el post.

“Toda esta información se puede explotar de varias maneras para obtener datos valiosos. Por ejemplo, si somos una bodega, saber qué están diciendo nuestros clientes o nuestros consumidores sobre nuestros vinos.”
“Estudiemos el análisis de la información. Lo primero que hay que hacer es seleccionar la información que nos interesa, luego hay que buscar ‘palabras clave’, aunque no siempre es el mejor sistema para obtener la respuesta que nos interesa.”
“Si, por ejemplo, quiero hablar de La Rioja, le pido a Google que todo lo que tenga que ver con La Rioja, lo baje. Pero puede ser que el 95% de toda la información no sirva para nada. Así, pues, lo primero a tener en cuenta es ser capaces de agrupar la información que nos interesa. Con esta información clasificada podemos saber en qué forma están respondiendo los consumidores (positiva/negativa/neutra). También podemos analizar la red que se establece entre los consumidores del vino de La Rioja, y dentro de esta comunidad, ver si hay personas que llevan la voz cantante o tener información de las fotos que publican.”

“Veamos un primer ejemplo con la clasificación de la información relevante. El primer transformer famoso de esta técnica fue BERT. Lo que hacemos es ir al sistema, le introducimos una serie de informaciones que están relacionadas con mi tema e informaciones que no lo están. En este punto, el trabajo humano es bastante importante. Utilizo este modelo, usamos una serie de valores matemáticos que me devuelve y lo que hago es un clasificador, de forma que le digo esto es correcto, … esto no es correcto… El sistema se va ajustando internamente hasta que es capaz de clasificar la información. Con ello podemos clasificar la información en positiva y negativa y pasarla al sistema hasta que sepa distinguirlas. Así, pues, hemos pasado una primera etapa que es clasificar la información.”

“A continuación explicamos un ejemplo que realizamos sobre el beneficio de un producto que contiene ‘algas’. Existe una técnica que consiste en agrupar información muy semejante (aunque es un poco prehistórica, se sigue utilizando hoy en día) y me devuelve información con las palabras clave (detección de temáticas) que deben aparecer de forma conjunta en cuanto al aspecto de la salud, composición y características del producto, propiedades organolépticas, etc. En este estudio también se valoró los aspectos negativos, para ello entrenamos un clasificador para que encontrase la información negativa. Ya tenemos la información clasificada utilizando una IA, una técnica que es la base del chatGPT, Imaginemos que tenemos una red, ya sea Instagram/twitter, en la que se observan los nodos, que son los usuarios, y las flechas que salen que relacionan lo que el usuario contesta a otros posts, y el grosor de la flecha, que indica el número de interacciones. Esta información puede ser muy útil. Todo ello entra en un ámbito denominado Social Netwok Analysis y sirve para analizar este tipo de redes. Para saber el punto de vista de los consumidores hay que saber los grupos que se forman en torno a varias personas que discuten mucho sobre un tema. Y también saber quiénes lideran estas discusiones en las redes.”

Para realizar el estudio de las redes sociales existen dos técnicas: las históricas de grafos y la Graph Neural Networks (GNN), es decir, redes neuronales adaptadas a grafos. La información que facilitan es mucho más exacta que las otras técnicas, aunque ello requiera un esfuerzo de entrenamiento y ajuste.

“Veamos un gráfico de un trabajo que estamos realizando actualmente con organismos modificados genéticamente (OMG). Se ha buscado en una red de discusión toda la información respecto de este tema. Primero se ha filtrado la información que me interesa, veo los temas de los que discuten, pero también paso a analizar la red. Cada punto del gráfico es un usuario/consumidor (casi 150 000 consumidores). En el gráfico se ve una corona exterior que son consumidores que opinan de 1 a 5 veces (estos consumidores no nos interesan). Luego, si nos fijamos en el centro, vemos muchísimas interacciones, de 50 a 60 veces. Si se realiza un zoom del centro del gráfico, se ven las comunidades que aparecen y que interactúan mucho. Estas comunidades no están aisladas, sino que tienen lazos de unión entre ellas. De este modo, hemos sido capaces de detectar el usuario líder (comenta y recibe comentarios). Todo ello se realiza con las técnicas mencionadas anteriormente y se obtiene la información.”

La revolución actual de la IA tiene su origen en el procesamiento de imágenes, que facilitan la resolución de problemas muy complejos. Se pueden identificar objetos, marcas, logos, etc. en la imagen, así como las emociones expresadas en los rostros humanos y describir las escenas representadas.

Así, pues, podemos obtener tanto de los textos como de las imágenes, una información muy valiosa con el fin de entender a nuestros consumidores o potenciales consumidores, e identificar también quienes son los líderes de opinión. Todo ello con el objetivo de desarrollar campañas de márqueting mucho más efectivas a la hora de posicionar nuestros vinos.

 

Volver a Congreso Internacional ACE de la Enología y el Cava 2024