Experto en Procesamiento del Lenguaje Natural
El título de Experto en Procesamiento del Lenguaje Natural, homologado por la UDIMA, busca formar a las personas con perfiles humanistas (filólogos, traductores, lingüistas, etc.) en un marco de nuevas profesiones en torno a la inteligencia artificial en español.
Título de la UDIMA incluido en el precio.
Concepción Polo Bayo
Profesora de PLN
Julio Villena Román
Profesor de PLN
Janine García Morena
Profesora de PLN
Rubén de la Fuente
Profesor de PLN
Luca de Filippis
Profesor de PLN
Grupos limitados
Próxima convocatoria
Fecha límite de matrícula:
16 de enero
Fecha de inicio:
31 de enero
2200 €
MÁS INFORMACIÓN
Se requiere titulación universitaria
Tutorizado
Online
12 meses (400 horas)
16 créditos ECTS
Orientación profesional
Portal de ofertas de empleo
Gastos de matrícula (30€) no incluidos en el precio del curso. Consulta descuentos.
Consulta nuestras facilidades de pago sin intereses
Tecnologías del lenguaje para lingüistas humanistas. UNIDAD DIDÁCTICA 1. INTRODUCCIÓN AL SECTOR
0. Objetivos de la unidad
1. Introducción
2. Definiciones y conceptos
2.1. Inteligencia artificial
2.2. Computación cognitiva
2.3. Procesamiento del lenguaje natural (PLN)
3. El sector de las tecnologías del lenguaje
3.1. Historia y evolución
3.1.1. Tareas de PLN casi resueltas
3.1.2. Tareas de PLN que demuestran un rápido avance
3.1.3. Tareas de PLN con grado de madurez limitado
3.2. Tendencias y futuro
3.2.1. Tecnologías del lenguaje en español
4. Barreras y retos
4.1. Barreras
4.2. Retos
UNIDAD DIDÁCTICA 2. EL LINGÜISTA EN PLN
0. Objetivos de la unidad
1. Introducción
2. El lingüista en PLN. Perfiles profesionales
3. Conocimientos y habilidades requeridos
3.1. Conocimientos
3.2. Destrezas
3.3. Competencias transversales
4. Funciones del lingüista en proyectos PLN
4.1. Creación y mantenimiento de recursos léxico-semánticos
4.2. Diseño de ontologías y modelos lingüísticos
4.3. Etiquetado de corpus y control de calidad
4.4. Ajuste y/o asesoría lingüística para optimización de software
4.5. Dirección de proyectos
Ejercicio 1: Optimización de softwares de corrección
Ejercicio 2: Etiquetado de corpus de entrenamiento
UNIDAD DIDÁCTICA 3. NIVELES LINGÜÍSTICOS: DEL ANÁLISIS A LA COMPRENSIÓN
0. Objetivos de la unidad
1. Introducción
2. Niveles de procesamiento lingüístico
2.1. Análisis fonético-fonológico
2.2. Análisis morfológico / léxico
2.3. Análisis sintáctico
2.4. Análisis semántico
2.5. Integración del discurso
2.6. Análisis pragmático
3. Tareas PLN vs. aplicaciones
Ejercicio 3: Uso de aplicaciones para la desambiguación léxica
Parte 1: Trabajar con WordNet
Parte 2: Trabajar con NLTK
UNIDAD DIDÁCTICA 4. TÉCNICAS DE PROCESAMIENTO DEL LENGUAJE NATURAL
0. Objetivos de la unidad
1. Introducción
2. Sistemas de reglas
2.1. Fundamentos
2.2. Proceso de ejecución de las reglas
2.3. Ejemplos de aplicación
3. Aprendizaje automático
3.1. Fundamentos
3.2. Proceso de aprendizaje supervisado
4. Aprendizaje profundo (deep learning)
4.1. Fundamentos de las redes neuronales
4.2. Deep learning
4.3. El aprendizaje por transferencia
5. Métricas para control de calidad
6. Modelos de representación del texto
6.1. Bolsa de palabras
6.2. Vectores de embeddings
Ejercicio 4: Representación de conocimiento con bolsa de palabras
UNIDAD DIDÁCTICA 5. EL CORPUS EN PLN
0. Objetivos de la unidad
1. Introducción
2. El corpus en proyectos de PLN
2.1. Tipos de corpus
2.2. Uso del corpus en desarrollos PLN
3. Lingüística de corpus
3.1. Recopilación y diseño
3.2. Codificación y anotación de corpus
3.2.1. La codificación
3.2.2. La anotación o etiquetado
3.3. Gestión y explotación. Análisis de concordancias
3.3.1. Ejemplo 1
3.3.2. Ejemplo 2
4. Corpus compensado, algoritmo ético
4.1. La ética del dato
4.1.1. Ejemplo 1
4.1.2. Ejemplo 2
4.1.3. Ejemplo 3
4.2. Detección y compensación de sesgos
Ejercicio 5: Explotación de corpus propios
UNIDAD DIDÁCTICA 6. EXTRACCIÓN Y GENERACIÓN DE INFORMACIÓN
0. Objetivos de la unidad
1. Introducción
1.1. Orígenes de la extracción de información
1.2. Información estructurada vs. información no estructurada
2. Tareas de extracción de información
2.1. Reconocimiento de entidades
2.2. Clasificación automática
2.3. Extracción de información elaborada
2.4. Recuperación de información
2.5. Respuesta a preguntas
2.6. Extracción de resúmenes
3. Generación automática de texto
3.1. Fundamentos
3.2. Grandes Modelos del Lenguaje (LLMs)
UNIDAD DIDÁCTICA 7. CORRECCIÓN AUTOMÁTICA
0. Objetivos de la unidad
1. Introducción
2. Verificación automática vs. autocorrección vs. texto predictivo
3. Técnicas de corrección automática
3.1. Técnicas de bajo nivel
3.1.1. Corrección ortográfica basada en diccionarios
3.1.2. Corrección basada en corpus y estadística de n-gramas
3.1.3. Corrección basada en reconocimiento de patrones
3.2. Técnicas de alto nivel
3.2.1. Corrección basada en parser
3.2.2. Enfoque neuronal aplicado a la corrección
3.2.3. Redacción predictiva inteligente
4. Capacidades de la corrección automática
4.1. Verificación ortográfica
4.2. Verificación gramatical
4.3. Verificación ortotipográfica
4.4. Verificación de estilo
5. Corrector automático y corrector humano
Ejercicio 6: Reglas de verificación ortográfica
UNIDAD DIDÁCTICA 8. TRADUCCIÓN AUTOMÁTICA
0. Objetivos de la unidad
1. Introducción
2. Técnicas de traducción automática (TA)
2.1. TA basada en reglas
2.2. TA estadística
2.3. TA neuronal
2.4. Sistemas híbridos
3. Traductor automático y traductor humano
3.1. Capacidades de la traducción automática
3.2. Oportunidades del traductor humano poseditor
3.2.1. Posedición de traducción automática
3.2.2. Evaluación de sistemas TA y asesoría
3.2.3. Optimización de software
UNIDAD DIDÁCTICA 9. TECNOLOGÍAS DEL HABLA. RECONOCIMIENTO Y SÍNTESIS DE VOZ
0. Objetivos de la unidad
1. Introducción a las tecnologías del habla
2. Sistemas de reconocimiento de voz
2.1. Dificultades asociadas al reconocimiento de voz
2.2. Tipos de reconocedores de habla
2.3. Componentes y arquitectura
2.4. Técnicas
3. Sistemas de síntesis de voz
3.1. Procedimiento
3.2. Técnicas
4. El lingüista en tecnologías del habla
Ejercicio 7: Análisis del servicio de voz a texto
UNIDAD DIDÁCTICA 10. INTERFACES CONVERSACIONALES
0. Objetivos de la unidad
1. Introducción
1.1. Historia
1.2. Aplicaciones
1.3. Terminología
1.4. Tipos principales de sistemas conversacionales
2. Funcionamiento de un sistema conversacional
3. Diseño de un asistente y el papel del lingüista
4. Ecosistema tecnológico
5. La revolución ChatGPT
UNIDAD DIDÁCTICA 11. PRÁCTICA FINAL
1. Planteamiento
2. Descripción de la práctica
2.1. Escenario
2.2. Propuesta
3. Rúbrica de evaluación
Programación para humanistas. UNIDAD DIDÁCTICA 1. PROGRAMACIÓN PARA GENTE DE LETRAS: INTRODUCCIÓN
1. Presentación
2. ¿De qué me sirve programar?
3. Perderle el miedo a la programación
4. Datos textuales, importantísimos pero sin estructura
5. Ejemplos de uso de programación en humanidades
5.1. Periodismo
5.2. Literatura
5.3. Historia
5.4. Derecho
6. Entorno de trabajo
Ejercicio 1: “Programar” sin necesidad de código
UNIDAD DIDÁCTICA 2. TERMINAL DE UNIX Y BASH SCRIPTING
1. Introducción: practicar es fundamental
2. Entorno de trabajo e instrucciones
2.1. En el principio fue la línea de comandos
2.2. Comandos de Unix
2.2.1. Obtener ayuda: man
2.2.2. Trabajar con directorios: mkdir, cd, ls, pwd
2.2.3. Descargar ficheros: wget
2.2.4. Renombrar, copiar y eliminar ficheros: mv, cp, rm
2.2.5. Explorar ficheros: less, tail, head, wc
2.2.6. Combinar comandos y guardar resultados: | y >
2.2.7. Contar y ordenar: sort, uniq
2.2.8. Buscar y reemplazar: grep, sed
2.2.9. Otros comandos útiles: cut, cat, wdiff
2.3. Scripts
Ejercicio 2: Escribir código para explorar un archivo
UNIDAD DIDÁCTICA 3. FUNDAMENTOS DE PYTHON
1. Introducción
2. Objetos y variables
3. Objetos para el tratamiento de textos
3.1. Cadenas
3.2. Listas
3.3. Diccionarios
4. Operadores
4.1. Comparaciones
4.2. Booleanos
5. Funciones integradas
5.1. Ayuda
5.2. Conversión de tipos
5.3. Funciones útiles para trabajar con textos
6. Estructuras de control de flujo
6.1. If… else
6.2. For
6.3. While
6.4. Try… except
7. Funciones personalizadas
8. Paquetes de Python
9. Trabajar con ficheros
10. Scripts
Ejercicio 3: Generar una lista de palabras
UNIDAD DIDÁCTICA 4. BÚSQUEDAS: EXPRESIONES REGULARES, BÚSQUEDAS APROXIMADAS, BÚSQUEDAS SEMÁNTICAS
1. Introducción
2. Expresiones regulares
2.1. re
3. Búsquedas aproximadas
3.1. Fuzzy wuzzy
4. Búsquedas semánticas
4.1. Gensim
4.1.1. Word2Vec
4.1.2. Indexación semántica latente
Ejercicio 4: Escribir una expresión regular
UNIDAD DIDÁCTICA 5. PROCESAMIENTO DE LENGUAJE NATURAL Y APRENDIZAJE AUTOMÁTICO
1. Introducción
2. Procesamiento de lenguaje natural
2.1. Spacy
2.2. Summa
2.3. Stylecloud
2.4. Huggingface
3. Aprendizaje automático
3.1. Recomendaciones generales
3.2. Aprendizaje supervisado
3.3. Aprendizaje no supervisado
Ejercicio 5: Entrenar un modelo con algoritmos
UNIDAD DIDÁCTICA 6. PROMPT ENGINEERING
1. Introducción: una nueva disciplina con mucho mercado
2. Casos de uso de los grandes modelos de lenguaje
3. OpenAI Playground
3.1. Creación de cuenta
3.2. Ajustes
3.3. Otras consideraciones
4. Estrategias
4.1. Instrucciones claras y detalladas
4.2. Prueba y error
4.3. Uso de ejemplos
4.4. Roles
4.5. Combinación de técnicas
4.6. Obligar al modelo a “pensar”
4.7. Conocimiento generado
4.8. Autoconsistencia
4.9. Técnicas avanzadas
5. Aplicaciones en programación
5.1. Escribir código
5.2. Explicar código
5.3. Documentar código
5.4. Optimizar o corregir código
5.5. Traducir código
5.6. Escribir expresiones regulares
6. Recursos
6.1. Otros modelos de lenguaje
6.2. Herramientas
6.3. Cursos abiertos de ingeniería de prompt
Ejercicio 6: Trabajar con prompt engineering
UNIDAD DIDÁCTICA 7. INTERFACES DE PROGRAMACIÓN DE APLICACIONES (API)
1. Introducción
2. Un poco de teoría
3. Postman
4. Language Tool
5. Tweepy
6. Wikifier
7. APIs de Microsoft y Google
7.1. Microsoft
7.2. Google
8. Creación de aplicaciones web propias
8.1. Elementos de la aplicación
8.1.1. Formulario web
8.1.2. Script
8.2. Publicación de la aplicación
Ejercicio 7: Trabajar con la aplicación web Resumiendo
UNIDAD DIDÁCTICA 8. PRÁCTICA FINAL: ESCRIBE TU PROPIA AVENTURA
Tecnologías del lenguaje para la extracción de información. UNIDAD DIDÁCTICA 1. INTRODUCCIÓN
0. Objetivos de la unidad
1. Introducción
1.1. Orígenes de la extracción de información
1.2. Información estructurada vs. información no estructurada
2. Tareas de extracción de información
2.1. Reconocimiento de entidades
2.2. Clasificación automática
2.3. Extracción de información elaborada
2.4. Recuperación de información
2.5. Respuesta a preguntas
2.6. Extracción de resúmenes
3. Generación automática de texto
3.1. Fundamentos
3.2. Modelos GPT
4. Métricas de evaluación
5. Aprendizaje automático y deep learning
5.1. Aprendizaje automático
5.2. Redes neuronales y deep learning
5.2.1. Redes neuronales convolucionales
5.2.2. Capa de atención
5.2.3. Redes neuronales recurrentes
5.2.4. Arquitectura encoder-decoder
5.2.5. Modelo de transformer
5.2.6 Ventajas e inconvenientes
5.3. Vectores de embeddings
UNIDAD DIDÁCTICA 2. RECONOCIMIENTO DE ENTIDADES
0. Objetivos de la unidad
1. Introducción
1.1. Fundamentos y conceptos básicos
1.2. Proceso de reconocimiento de entidades
1.3. Representación del texto como secuencias
1.4. Entity linking
1.5. Aplicaciones
2. Métricas de evaluación
3. Técnicas de reconocimiento de entidades
3.1. Modelos clásicos de procesamiento del lenguaje natural
3.1.1. Características para reconocer/clasificar entidades
3.1.2. Tarea del lingüista
3.2. Técnicas de aprendizaje automático
3.2.1. Algoritmos de aprendizaje automático
3.2.2. Deep learning
3.2.3. Tarea del lingüista
Ejercicio 1: Reconocimiento de entidades con un sistema real
1. Introducción
2. IBM Watson Natural Language Understanding
3. Google Cloud Natural Language
Ejercicio 2: Funcionalidades para la tarea de reconocimiento de entidades
1. Introducción
2. Google Colaboratory
3. Creación de un cuaderno nuevo
4. Reconocimiento de entidades con NLTK
5. Reconocimiento de entidades con spaCy
UNIDAD DIDÁCTICA 3. CLASIFICACIÓN AUTOMÁTICA
0. Objetivos de la unidad
1. Introducción
1.1. Fundamentos y conceptos básicos
1.2. Tipos de clasificación
1.2.1. Clasificación binaria (binary)
1.2.2. Clasificación multiclase (multiclass)
1.2.3. Clasificación single-label vs. multi-label
1.3. Aplicaciones
2. Métricas de evaluación
2.1. Escenarios single-label
2.2. Escenarios multi-label
3. Técnicas de clasificación automática
3.1. Modelos basados en reglas
3.1.1. Tarea del lingüista
3.2. Técnicas de aprendizaje automático
3.2.1. Tarea del lingüista
3.3. Modelos híbridos
4. Tipos específicos de clasificación
4.1 Análisis de sentimientos
4.2. Análisis de emoción
4.3. Análisis de reputación
4.4. Detección de idioma
4.5. Detección de intenciones
Ejercicio 3: Clasificación de textos con un sistema real
1. Introducción
2. IBM Watson Natural Language Understanding
3. Google Cloud Natural Language
Ejercicio 4: Entrenamiento de un modelo de clasificación
1. Introducción
2. Modelo de clasificación de intenciones
3. Entrenamiento
4. Ejecución
UNIDAD DIDÁCTICA 4. EXTRACCIÓN DE INFORMACIÓN COMPLEJA
0. Objetivos de la unidad
1. Introducción
2. Modelo de grafo semántico
3. Tarea de extracción de información
3.1. Modelos de reglas de extracción
3.2. Técnicas de aprendizaje automático
3.3. Tarea del lingüista
UNIDAD DIDÁCTICA 5. RECUPERACIÓN DE INFORMACIÓN
0. Objetivos de la unidad
1. Fundamentos y conceptos
2. Modelos de recuperación de información
2.1. Modelo booleano
2.2. Modelo de espacio vectorial
2.3. Modelo probabilístico
3. Similitud semántica
3.1. Conceptos
3.2. Búsqueda semántica
4. Métricas de evaluación
5. Tarea del lingüista
Ejercicio 5: Similitud semántica y búsqueda semántica
1. Búsqueda semántica
2. Búsqueda de duplicados
UNIDAD DIDÁCTICA 6. RESPUESTA A PREGUNTAS
0. Objetivos de la unidad
1. Introducción
1.1. Conceptos y fundamentos
1.2. Historia
2. Proceso de respuesta a preguntas
2.1. Fundamentos
2.2. Análisis de la pregunta
2.3. Recuperación de contextos
2.4. Extracción de la respuesta
2.5. Ejemplo
3. Extractive question answering
4. Tarea del lingüista
UNIDAD DIDÁCTICA 7. EXTRACCIÓN DE RESÚMENES
0. Objetivos de la unidad
1. Introducción
2. Resúmenes extractivos
2.1. Conceptos
2.2. Proceso clásico
2.3. Modelos basados en aprendizaje automático
2.4. Escenarios específicos
2.5. Tarea del lingüista
3. Resúmenes abstractivos
3.1. Conceptos
3.2. Modelos
3.3. Tarea del lingüista
Ejercicio 6: Extracción de resúmenes extractivos y abstractivos
1. Resúmenes extractivos
2. Resúmenes abstractivos
UNIDAD DIDÁCTICA 8. PRÁCTICA FINAL
1. Objetivos
2. Desarrollo del ejercicio
2.1. Diseño del escenario
2.2. Desarrollo del escenario
3. Informe de resultados
4. Rúbrica de evaluación
Tecnologías del lenguaje para desarrollo de interfaces conversacionales. UNIDAD DIDÁCTICA 1. INTRODUCCIÓN
Presentación del curso
0. Objetivos de la unidad
1. Las primeras interfaces conversacionales
2. Tipos de interfaces conversacionales en la actualidad
3. Conceptos básicos y terminología específica
4. Casos de uso, canales y plataformas de desarrollo
UNIDAD DIDÁCTICA 2. DISEÑO DE INTERFACES CONVERSACIONALES
0. Objetivos de la unidad
1. Introducción al proceso de diseño
2. El concepto de user persona
3. Diseño de la conversación: situaciones y experiencia de usuario
4. Personalidad del asistente virtual y tono de la conversación
Paso 1
Paso 2
Paso 3
Paso 4
5. Nombre e identidad visual
Ejercicio 1: Características del chatbot
Ejercicio 2: Situaciones de diálogo del chatbot
Ejercicio 3: Perfil completo del chatbot
UNIDAD DIDÁCTICA 3. BASE DE CONOCIMIENTO
0. Objetivos de la unidad
1. Recopilación y extracción de la información
2. Identificación de las intenciones y de los flujos de diálogo
3. Gestión del contenido
4. Redacción de los mensajes
UNIDAD DIDÁCTICA 4. CREACIÓN DE UN ASISTENTE CONVERSACIONAL EN DIALOGFLOW
0. Objetivos de la unidad
1. Dialogflow: presentación de la plataforma y creación de un agente
2. Creación de una cuenta y de un agente
2.1. General
2.2. Languages
2.3. ML Settings
2.4. Export and Import
2.5. Environments
2.6. Speech
2.7. Share
2.8. Advanced
3. Creación de la base de conocimiento
4. Entidades
5. Creación de flujos de diálogo utilizando contextos
Ejercicio 4: Creación de un agente conversacional
UNIDAD DIDÁCTICA 5. INTEGRACIONES Y MENSAJES ENRIQUECIDOS
0. Objetivos de la unidad
1. Integración de un agente conversacional en Telegram
2. Configuración de mensajes enriquecidos en Telegram
2.1. Estilos del texto e hipervínculos
2.2. Mensajes enriquecidos preconfigurados
3. Mensajes enriquecidos en Dialogflow Messenger
UNIDAD DIDÁCTICA 6. VALIDACIÓN Y ENTRENAMIENTO
0. Objetivos de la unidad
1. Autovalidación del asistente
2. Validación con usuarios
3. Revisión de las conversaciones y entrenamiento
4. Analíticas de uso
ANEXO. Inteligencia artificial generativa y prompt engineering
UNIDAD DIDÁCTICA 7. PRÁCTICA FINAL
1. Práctica 1: Crea tu propio chatbot
Requisitos y entregables
2. Práctica 2: Test de redacción
3. Criterios de evaluación
-
Tecnologías del lenguaje para lingüistas humanistas
Online
Nuestro curso de Tecnologías del lenguaje para lingüistas humanistas busca formar profesionales del lenguaje para las áreas principales de trabajo en Procesamiento del Lenguaje Natural (PLN).
-
Programación para humanistas
Online
En el curso de Programación para humanistas aprenderás a desenvolverte con Python, expresiones regulares, UNIX y demás interfaces de programación para aplicaciones de Procesamiento del Lenguaje Natural. Todo dirigido a humanistas que deseen trabajar en este sector.
-
Tecnologías del lenguaje para la extracción de información
Online
El curso de Tecnologías del lenguaje para la extracción de información busca proporcionar habilidades al lingüista/humanista para el desarrollo de una carrera laboral dentro del Procesamiento del Lenguaje Natural.
-
Tecnologías del lenguaje para desarrollo de interfaces conversacionales
Online
En el curso de Tecnologías del lenguaje para desarrollo de interfaces conversacionales aprenderás a diseñar y desarrollar chatbots según los diferentes casos de uso y aplicaciones. Practicarás con sistemas reales como Dialogflow.
[cerrar]