¿Por qué se necesitan lingüistas, filólogos, traductores o psicólogos en la Inteligencia artificial? ¿En qué consiste el Procesamiento del lenguaje natural?
El campo de la Inteligencia artificial aborda muchos ámbitos. Hace algunos años era impensable imaginar que las herramientas tecnológicas iban a estar tan presentes en nuestras vidas como lo están en la actualidad. ¿Quién no utiliza la geolocalización, aplicaciones de ligoteo, asistentes de voz, chatbots, redes sociales, emails…? De forma silenciosa, la inteligencia artificial nos asiste en nuestro día a día para tratar de facilitarnos las cosas.
Ahora bien, para que estas estupendas tecnologías sean útiles de verdad deben poder entender lo que los usuarios necesitan y, por supuesto, devolver una respuesta entendible por dichos humanos.
Las personas nos comunicamos a través de una herramienta compleja, asombrosa y sobre todo, cambiante: el lenguaje natural, nuestra forma de hablar. Las máquinas utilizan un sistema binario que siempre pasa por formato texto.
El campo profesional que se ocupa de investigar cómo conseguir que estos dos mundos conecten y se entiendan se conoce como Procesamiento del lenguaje natural.
¿Por qué es interesante contar con un equipo mixto de ciencias y letras a la hora de trabajar en Inteligencia artificial?
El Procesamiento del lenguaje natural es un campo dentro de las ciencias computacionales y de la inteligencia artificial que busca proporcionar a las máquinas herramientas que les permitan comprender y procesar el lenguaje humano. Es decir, que a través de texto (o voz) podamos comunicarnos con ellas. Y en algunas aplicaciones, es también imprescindible que la comunicación se dé en la otra dirección: de la máquina a la persona, es decir, que, del mismo modo, se necesitan herramientas que generen lenguaje natural (en formato de texto o de voz).
Como ya avanzábamos, el sistema de comunicación humano es complejo y asombroso. Además, los “formatos” de expresión que utilizamos van más allá del texto: el tono de voz, el lenguaje corporal e incluso los silencios pueden cambiar el sentido del mensaje.
Los perfiles de humanidades son imprescindibles a la hora de “desambiguar” nuestro lenguaje y hacerlo accesible a la máquina. Y viceversa, para que el sistema muestre respuestas comprensibles, eficaces y, sobre todo, relevantes para los usuarios. Para ello es fundamental una comprensión profunda de la semántica, la pragmática y la sintaxis. Por si esto fuera poco, el lenguaje evoluciona y cambia cada día aparecen nuevos términos, nuevas expresiones, nuevos conceptos, nuevas formas de decir algo: la mano humana es imprescindible para desenmarañar todo esto.
Entender y generar este lenguaje natural y permitir la comunicación humano-máquina ha permitido el desarrollo de múltiples aplicaciones como la traducción (voz y texto), el reconocimiento de voz, el análisis de texto o los chatbots.
¿Qué hace un humanista que trabaja en Procesamiento de Lenguaje Natural (PLN)?
Las tareas son múltiples y variadas. En realidad, depende de la formación de base y el grado de especialidad o las necesidades del proyecto. En cualquier caso, y porque nos gustan los listados, aquí tienes algunas de las tareas de PLN más habituales en las que participan los humanistas:
- Tokenización: Consiste en dividir o segmentar el texto en frases o palabras, en tokens (o ngrams) o unidades de significado. Parece simple pero no lo es. Por ejemplo, “La Rioja” podrían ser 2 tokens, pero al ser un nombre propio, y para no perder su significado, se agrupa en lo que se conoce como un “2-ngram” o bigrama.
- Named Entity Recognition (NER): Detección de entidades. Consiste en localizar y clasificar aquellas palabras de un texto que tengan categorías predefinidas. Pueden ser personas, empresas o instituciones, lugares, marcas, cantidades…
- Part-of-Speech Tagging (POS): Consiste en identificar y asignar (o etiquetar) la categoría gramatical adecuada a cada token. Este proceso se puede realizar de acuerdo con la definición de la palabra o en función al contexto que la rodee, ya sea una frase o un párrafo.
- Clasificación automática: Tarea típica de PLN que asigna categorías predefinidas (etiquetas) a un texto, basándose en su contenido.
- Question answering: Motores de búsqueda que devuelven respuestas a preguntas.
- Análisis de sentimiento: Consiste en identificar y categorizar las opiniones expresadas en un texto como positivas, negativas o neutrales.
- Análisis de emoción: Donde, dada una oración, el modelo lingüístico trata de establecer si existe una emoción de felicidad, tristeza, sorpresa, enfado…
- Generación de resúmenes: Crear versiones más concisas de textos que conserven la información más relevante.
- Generación de lenguaje: Producir automáticamente textos en lenguaje natural.
¡Y otras muchas tareas y subtareas que hacen posibles la explotación y gestión inteligente de contenidos!
En todas ellas, las principales responsabilidades de los humanistas suelen radicar en el etiquetado de información, la evaluación de salidas, la asesoría para la optimización de resultados y, en general, el mantenimiento de recursos y modelos lingüísticos.
El enfoque Human-in-the-loop (HITL), la cooperación entre la IA y el ser humano
Actualmente, a los trabajos de supervisión humana que permiten alcanzar a la máquina los estándares de calidad necesarios en un circuito de mejora continua se los conocen en el sector como procesos Human-in-the-loop (HITL).
El modelo Human-in-the-loop (humano en el bucle) refiere a la suma de inteligencias: la artificial y la humana en busca de una retroalimentación constante para evaluar la salida de algoritmos, determinar su validez y lograr, por tanto, mayor precisión y mejores resultados. Cuando se trata de evaluar la calidad de la comunicación se buscan principalmente expertos en Humanidades.
Si bien es cierto que son tareas que vienen acompañando históricamente los desarrollos de PLN, actualmente, con la irrupción de los grandes modelos de lenguaje (Large Language Models, LLMs) como GPT, esta tarea se vuelve fundamental como única forma de localizar posibles “alucinaciones”, o errores relacionados con que la IA dé como verdadera una información que, pudiendo parecer verosímil, no es real. El humano en el bucle interviene para indicar al sistema qué signos distintivos debe buscar y guiarle para que proporcione respuestas más precisas.
La creación de sistemas basados en LLM y su puesta en producción hoy es técnicamente muy rápido y sus resultados, aparentemente sorprendentes. Pero un desarrollo responsable hace imprescindibles grandes esfuerzos de testing, revisión, tareas de afinamiento (finetuning)… que forman parte del enfoque HITL.
Por supuesto, el Procesamiento del lenguaje natural no es el único ámbito donde las humanidades son necesarias dentro de la Inteligencia artificial. Estos perfiles se buscan también para tratar el abordaje de la autoridad de los contenidos, la privacidad o los datos personales con los que entrenamos esas máquinas, el impacto social de la desinformación y los derechos de autoría. En definitiva, la ética es una disciplina imprescindible en la creación, alimentación y desarrollo de todas las nuevas herramientas de Inteligencia artificial.