Experto en Procesamiento del Lenguaje Natural

El título de Experto en Procesamiento del Lenguaje Natural, homologado por la UDIMA, busca formar a las personas con perfiles humanistas (filólogos, traductores, lingüistas, etc.) en un marco de nuevas profesiones en torno a la inteligencia artificial en español.

Título de la UDIMA incluido en el precio.

Concepción Polo Bayo

Concepción Polo Bayo

Profesora de PLN

Julio Villena Román

Julio Villena Román

Profesor de PLN

Janine García Morena

Janine García Morena

Profesora de PLN

Rubén de la Fuente

Rubén de la Fuente

Profesor de PLN

Luca de Filippis

Luca de Filippis

Profesor de PLN

Grupos limitados



Próxima convocatoria

Fecha límite de matrícula:
16 de septiembre

Fecha de inicio:
30 de septiembre

2200 €

MÁS INFORMACIÓN

Udima y Cálamo y Cran



Se requiere titulación universitaria



Tutorizado



Online



12 meses (400 horas)



16 créditos ECTS



Orientación profesional



Portal de ofertas de empleo



Gastos de matrícula (30€) no incluidos en el precio del curso. Consulta descuentos.



Consulta nuestras facilidades de pago sin intereses

Contenido

Tecnologías del lenguaje para lingüistas humanistas. UNIDAD DIDÁCTICA 1. INTRODUCCIÓN AL SECTOR

0. Objetivos de la unidad

1. Introducción

2. Definiciones y conceptos

2.1. Inteligencia artificial

2.2. Computación cognitiva

2.3. Procesamiento del lenguaje natural (PLN)

3. El sector de las tecnologías del lenguaje

3.1. Historia y evolución

3.1.1. Tareas de PLN casi resueltas

3.1.2. Tareas de PLN que demuestran un rápido avance

3.1.3. Tareas de PLN con grado de madurez limitado

3.2. Tendencias y futuro

3.2.1. Tecnologías del lenguaje en español

4. Barreras y retos

4.1. Barreras

4.2. Retos

UNIDAD DIDÁCTICA 2. EL LINGÜISTA EN PLN

0. Objetivos de la unidad

1. Introducción

2. El lingüista en PLN. Perfiles profesionales

3. Conocimientos y habilidades requeridos

3.1. Conocimientos

3.2. Destrezas

3.3. Competencias transversales

4. Funciones del lingüista en proyectos PLN

4.1. Creación y mantenimiento de recursos léxico-semánticos

4.2. Diseño de ontologías y modelos lingüísticos

4.3. Etiquetado de corpus y control de calidad

4.4. Ajuste y/o asesoría lingüística para optimización de software

4.5. Dirección de proyectos

Ejercicio 1: Optimización de softwares de corrección

Ejercicio 2: Etiquetado de corpus de entrenamiento

UNIDAD DIDÁCTICA 3. NIVELES LINGÜÍSTICOS: DEL ANÁLISIS A LA COMPRENSIÓN

0. Objetivos de la unidad

1. Introducción

2. Niveles de procesamiento lingüístico

2.1. Análisis fonético-fonológico

2.2. Análisis morfológico / léxico

2.3. Análisis sintáctico

2.4. Análisis semántico

2.5. Integración del discurso

2.6. Análisis pragmático

3. Tareas PLN vs. aplicaciones

Ejercicio 3: Uso de aplicaciones para la desambiguación léxica

Parte 1: Trabajar con WordNet

Parte 2: Trabajar con NLTK

UNIDAD DIDÁCTICA 4. TÉCNICAS DE PROCESAMIENTO DEL LENGUAJE NATURAL

0. Objetivos de la unidad

1. Introducción

2. Sistemas de reglas

2.1. Fundamentos

2.2. Proceso de ejecución de las reglas

2.3. Ejemplos de aplicación

3. Aprendizaje automático

3.1. Fundamentos

3.2. Proceso de aprendizaje supervisado

4. Aprendizaje profundo (deep learning)

4.1. Fundamentos de las redes neuronales

4.2. Deep learning

4.3. El aprendizaje por transferencia

5. Métricas para control de calidad

6. Modelos de representación del texto

6.1. Bolsa de palabras

6.2. Vectores de embeddings

Ejercicio 4: Representación de conocimiento con bolsa de palabras

UNIDAD DIDÁCTICA 5. EL CORPUS EN PLN

0. Objetivos de la unidad

1. Introducción

2. El corpus en proyectos de PLN

2.1. Tipos de corpus

2.2. Uso del corpus en desarrollos PLN

3. Lingüística de corpus

3.1. Recopilación y diseño

3.2. Codificación y anotación de corpus

3.2.1. La codificación

3.2.2. La anotación o etiquetado

3.3. Gestión y explotación. Análisis de concordancias

3.3.1. Ejemplo 1

3.3.2. Ejemplo 2

4. Corpus compensado, algoritmo ético

4.1. La ética del dato

4.1.1. Ejemplo 1

4.1.2. Ejemplo 2

4.1.3. Ejemplo 3

4.2. Detección y compensación de sesgos

Ejercicio 5: Explotación de corpus propios

UNIDAD DIDÁCTICA 6. EXTRACCIÓN Y GENERACIÓN DE INFORMACIÓN

0. Objetivos de la unidad

1. Introducción

1.1. Orígenes de la extracción de información

1.2. Información estructurada vs. información no estructurada

2. Tareas de extracción de información

2.1. Reconocimiento de entidades

2.2. Clasificación automática

2.3. Extracción de información elaborada

2.4. Recuperación de información

2.5. Respuesta a preguntas

2.6. Extracción de resúmenes

3. Generación automática de texto

3.1. Fundamentos

3.2. Grandes Modelos del Lenguaje (LLMs)

UNIDAD DIDÁCTICA 7. CORRECCIÓN AUTOMÁTICA

0. Objetivos de la unidad

1. Introducción

2. Verificación automática vs. autocorrección vs. texto predictivo

3. Técnicas de corrección automática

3.1. Técnicas de bajo nivel

3.1.1. Corrección ortográfica basada en diccionarios

3.1.2. Corrección basada en corpus y estadística de n-gramas

3.1.3. Corrección basada en reconocimiento de patrones

3.2. Técnicas de alto nivel

3.2.1. Corrección basada en parser

3.2.2. Enfoque neuronal aplicado a la corrección

3.2.3. Redacción predictiva inteligente

4. Capacidades de la corrección automática

4.1. Verificación ortográfica

4.2. Verificación gramatical

4.3. Verificación ortotipográfica

4.4. Verificación de estilo

5. Corrector automático y corrector humano

Ejercicio 6: Reglas de verificación ortográfica

UNIDAD DIDÁCTICA 8. TRADUCCIÓN AUTOMÁTICA

0. Objetivos de la unidad

1. Introducción

2. Técnicas de traducción automática (TA)

2.1. TA basada en reglas

2.2. TA estadística

2.3. TA neuronal

2.4. Sistemas híbridos

3. Traductor automático y traductor humano

3.1. Capacidades de la traducción automática

3.2. Oportunidades del traductor humano poseditor

3.2.1. Posedición de traducción automática

3.2.2. Evaluación de sistemas TA y asesoría

3.2.3. Optimización de software

UNIDAD DIDÁCTICA 9. TECNOLOGÍAS DEL HABLA. RECONOCIMIENTO Y SÍNTESIS DE VOZ

0. Objetivos de la unidad

1. Introducción a las tecnologías del habla

2. Sistemas de reconocimiento de voz

2.1. Dificultades asociadas al reconocimiento de voz

2.2. Tipos de reconocedores de habla

2.3. Componentes y arquitectura

2.4. Técnicas

3. Sistemas de síntesis de voz

3.1. Procedimiento

3.2. Técnicas

4. El lingüista en tecnologías del habla

Ejercicio 7: Análisis del servicio de voz a texto

UNIDAD DIDÁCTICA 10. INTERFACES CONVERSACIONALES

0. Objetivos de la unidad

1. Introducción

1.1. Historia

1.2. Aplicaciones

1.3. Terminología

1.4. Tipos principales de sistemas conversacionales

2. Funcionamiento de un sistema conversacional

3. Diseño de un asistente y el papel del lingüista

4. Ecosistema tecnológico

5. La revolución ChatGPT

UNIDAD DIDÁCTICA 11. PRÁCTICA FINAL

1. Planteamiento

2. Descripción de la práctica

2.1. Escenario

2.2. Propuesta

3. Rúbrica de evaluación

Programación para humanistas. UNIDAD DIDÁCTICA 1. PROGRAMACIÓN PARA GENTE DE LETRAS: INTRODUCCIÓN

1. Presentación

2. ¿De qué me sirve programar?

3. Perderle el miedo a la programación

4. Datos textuales, importantísimos pero sin estructura

5. Ejemplos de uso de programación en humanidades

5.1. Periodismo

5.2. Literatura

5.3. Historia

5.4. Derecho

6. Entorno de trabajo

Ejercicio 1: “Programar” sin necesidad de código

UNIDAD DIDÁCTICA 2. TERMINAL DE UNIX Y BASH SCRIPTING

1. Introducción: practicar es fundamental

2. Entorno de trabajo e instrucciones

2.1. En el principio fue la línea de comandos

2.2. Comandos de Unix

2.2.1. Obtener ayuda: man

2.2.2. Trabajar con directorios: mkdir, cd, ls, pwd

2.2.3. Descargar ficheros: wget

2.2.4. Renombrar, copiar y eliminar ficheros: mv, cp, rm

2.2.5. Explorar ficheros: less, tail, head, wc

2.2.6. Combinar comandos y guardar resultados: | y >

2.2.7. Contar y ordenar: sort, uniq

2.2.8. Buscar y reemplazar: grep, sed

2.2.9. Otros comandos útiles: cut, cat, wdiff

2.3. Scripts

Ejercicio 2: Escribir código para explorar un archivo

UNIDAD DIDÁCTICA 3. FUNDAMENTOS DE PYTHON

1. Introducción

2. Objetos y variables

3. Objetos para el tratamiento de textos

3.1. Cadenas

3.2. Listas

3.3. Diccionarios

4. Operadores

4.1. Comparaciones

4.2. Booleanos

5. Funciones integradas

5.1. Ayuda

5.2. Conversión de tipos

5.3. Funciones útiles para trabajar con textos

6. Estructuras de control de flujo

6.1. If… else

6.2. For

6.3. While

6.4. Try… except

7. Funciones personalizadas

8. Paquetes de Python

9. Trabajar con ficheros

10. Scripts

Ejercicio 3: Generar una lista de palabras

UNIDAD DIDÁCTICA 4. BÚSQUEDAS: EXPRESIONES REGULARES, BÚSQUEDAS APROXIMADAS, BÚSQUEDAS SEMÁNTICAS

1. Introducción

2. Expresiones regulares

2.1. re

3. Búsquedas aproximadas

3.1. Fuzzy wuzzy

4. Búsquedas semánticas

4.1. Gensim

4.1.1. Word2Vec

4.1.2. Indexación semántica latente

Ejercicio 4: Escribir una expresión regular

UNIDAD DIDÁCTICA 5. PROCESAMIENTO DE LENGUAJE NATURAL Y APRENDIZAJE AUTOMÁTICO

1. Introducción

2. Procesamiento de lenguaje natural

2.1. Spacy

2.2. Summa

2.3. Stylecloud

2.4. Huggingface

3. Aprendizaje automático

3.1. Recomendaciones generales

3.2. Aprendizaje supervisado

3.3. Aprendizaje no supervisado

4. Prompt engineering

4.1. Introducción: una nueva disciplina con mucho mercado

4.2. Casos de uso de los grandes modelos de lenguaje

4.3. OpenAI Playground

4.3.1. Creación de cuenta

4.3.2. Ajustes

4.3.3. Otras consideraciones

4.4. Estrategias

4.4.1. Instrucciones claras y detalladas

4.4.2. Prueba y error

4.4.3. Uso de ejemplos

4.4.4. Roles

4.4.5. Combinación de técnicas

4.4.6. Obligar al modelo a “pensar”

4.4.7. Conocimiento generado

4.4.8. Autoconsistencia

4.4.9. Técnicas avanzadas

4.5. Aplicaciones en programación

4.5.1. Escribir código

4.5.2. Explicar código

4.5.3. Documentar código

4.5.4. Optimizar o corregir código

4.5.5. Traducir código

4.5.6. Escribir expresiones regulares

4.6. Recursos

4.6.1. Otros modelos de lenguaje

4.6.2. Herramientas

4.6.3. Cursos abiertos de ingeniería de prompt

Ejercicio 5: Entrenar un modelo con algoritmos

Ejercicio 6: Trabajar con prompt engineering

UNIDAD DIDÁCTICA 6. INTERFACES DE PROGRAMACIÓN DE APLICACIONES (API)

1. Introducción

2. Un poco de teoría

3. Postman

4. Language Tool

5. Tweepy

6. Wikifier

7. APIs de Microsoft y Google

7.1. Microsoft

7.2. Google

8. Creación de aplicaciones web propias

8.1. Elementos de la aplicación

8.1.1. Formulario web

8.1.2. Script

8.2. Publicación de la aplicación

Ejercicio 7: Trabajar con la aplicación web Resumiendo

UNIDAD DIDÁCTICA 7. PRÁCTICA FINAL: ESCRIBE TU PROPIA AVENTURA

Tecnologías del lenguaje para la extracción de información. UNIDAD DIDÁCTICA 1. INTRODUCCIÓN

0. Objetivos de la unidad

1. Introducción

1.1. Orígenes de la extracción de información

1.2. Información estructurada vs. información no estructurada

2. Tareas de extracción de información

2.1. Reconocimiento de entidades

2.2. Clasificación automática

2.3. Extracción de información elaborada

2.4. Recuperación de información

2.5. Respuesta a preguntas

2.6. Extracción de resúmenes

3. Generación automática de texto

3.1. Fundamentos

3.2. Modelos GPT

4. Métricas de evaluación

5. Aprendizaje automático y deep learning

5.1. Aprendizaje automático

5.2. Redes neuronales y deep learning

5.2.1. Redes neuronales convolucionales

5.2.2. Capa de atención

5.2.3. Redes neuronales recurrentes

5.2.4. Arquitectura encoder-decoder

5.2.5. Modelo de transformer

5.2.6 Ventajas e inconvenientes

5.3. Vectores de embeddings

UNIDAD DIDÁCTICA 2. RECONOCIMIENTO DE ENTIDADES

0. Objetivos de la unidad

1. Introducción

1.1. Fundamentos y conceptos básicos

1.2. Proceso de reconocimiento de entidades

1.3. Representación del texto como secuencias

1.4. Entity linking

1.5. Aplicaciones

2. Métricas de evaluación

3. Técnicas de reconocimiento de entidades

3.1. Modelos clásicos de procesamiento del lenguaje natural

3.1.1. Características para reconocer/clasificar entidades

3.1.2. Tarea del lingüista

3.2. Técnicas de aprendizaje automático

3.2.1. Algoritmos de aprendizaje automático

3.2.2. Deep learning

3.2.3. Tarea del lingüista

Ejercicio 1: Reconocimiento de entidades con un sistema real

1. Introducción

2. IBM Watson Natural Language Understanding

3. Google Cloud Natural Language

Ejercicio 2: Funcionalidades para la tarea de reconocimiento de entidades

1. Introducción

2. Google Colaboratory

3. Creación de un cuaderno nuevo

4. Reconocimiento de entidades con NLTK

5. Reconocimiento de entidades con spaCy

UNIDAD DIDÁCTICA 3. CLASIFICACIÓN AUTOMÁTICA

0. Objetivos de la unidad

1. Introducción

1.1. Fundamentos y conceptos básicos

1.2. Tipos de clasificación

1.2.1. Clasificación binaria (binary)

1.2.2. Clasificación multiclase (multiclass)

1.2.3. Clasificación single-label vs. multi-label

1.3. Aplicaciones

2. Métricas de evaluación

2.1. Escenarios single-label

2.2. Escenarios multi-label

3. Técnicas de clasificación automática

3.1. Modelos basados en reglas

3.1.1. Tarea del lingüista

3.2. Técnicas de aprendizaje automático

3.2.1. Tarea del lingüista

3.3. Modelos híbridos

4. Tipos específicos de clasificación

4.1 Análisis de sentimientos

4.2. Análisis de emoción

4.3. Análisis de reputación

4.4. Detección de idioma

4.5. Detección de intenciones

Ejercicio 3: Clasificación de textos con un sistema real

1. Introducción

2. IBM Watson Natural Language Understanding

3. Google Cloud Natural Language

Ejercicio 4: Entrenamiento de un modelo de clasificación

1. Introducción

2. Modelo de clasificación de intenciones

3. Entrenamiento

4. Ejecución

UNIDAD DIDÁCTICA 4. EXTRACCIÓN DE INFORMACIÓN COMPLEJA

0. Objetivos de la unidad

1. Introducción

2. Modelo de grafo semántico

3. Tarea de extracción de información

3.1. Modelos de reglas de extracción

3.2. Técnicas de aprendizaje automático

3.3. Tarea del lingüista

UNIDAD DIDÁCTICA 5. RECUPERACIÓN DE INFORMACIÓN

0. Objetivos de la unidad

1. Fundamentos y conceptos

2. Modelos de recuperación de información

2.1. Modelo booleano

2.2. Modelo de espacio vectorial

2.3. Modelo probabilístico

3. Similitud semántica

3.1. Conceptos

3.2. Búsqueda semántica

4. Métricas de evaluación

5. Tarea del lingüista

Ejercicio 5: Similitud semántica y búsqueda semántica

1. Búsqueda semántica

2. Búsqueda de duplicados

UNIDAD DIDÁCTICA 6. RESPUESTA A PREGUNTAS

0. Objetivos de la unidad

1. Introducción

1.1. Conceptos y fundamentos

1.2. Historia

2. Proceso de respuesta a preguntas

2.1. Fundamentos

2.2. Análisis de la pregunta

2.3. Recuperación de contextos

2.4. Extracción de la respuesta

2.5. Ejemplo

3. Extractive question answering

4. Tarea del lingüista

UNIDAD DIDÁCTICA 7. EXTRACCIÓN DE RESÚMENES

0. Objetivos de la unidad

1. Introducción

2. Resúmenes extractivos

2.1. Conceptos

2.2. Proceso clásico

2.3. Modelos basados en aprendizaje automático

2.4. Escenarios específicos

2.5. Tarea del lingüista

3. Resúmenes abstractivos

3.1. Conceptos

3.2. Modelos

3.3. Tarea del lingüista

Ejercicio 6: Extracción de resúmenes extractivos y abstractivos

1. Resúmenes extractivos

2. Resúmenes abstractivos

UNIDAD DIDÁCTICA 8. PRÁCTICA FINAL

1. Objetivos

2. Desarrollo del ejercicio

2.1. Diseño del escenario

2.2. Desarrollo del escenario

3. Informe de resultados

4. Rúbrica de evaluación

Tecnologías del lenguaje para desarrollo de interfaces conversacionales. UNIDAD DIDÁCTICA 1. INTRODUCCIÓN

Presentación del curso

0. Objetivos de la unidad

1. Las primeras interfaces conversacionales

2. Tipos de interfaces conversacionales en la actualidad

3. Conceptos básicos y terminología específica

4. Casos de uso, canales y plataformas de desarrollo

UNIDAD DIDÁCTICA 2. DISEÑO DE INTERFACES CONVERSACIONALES

0. Objetivos de la unidad

1. Introducción al proceso de diseño

2. El concepto de user persona

3. Diseño de la conversación: situaciones y experiencia de usuario

4. Personalidad del asistente virtual y tono de la conversación

Paso 1

Paso 2

Paso 3

Paso 4

5. Nombre e identidad visual

Ejercicio 1: Características del chatbot

Ejercicio 2: Situaciones de diálogo del chatbot

Ejercicio 3: Perfil completo del chatbot

UNIDAD DIDÁCTICA 3. BASE DE CONOCIMIENTO

0. Objetivos de la unidad

1. Recopilación y extracción de la información

2. Identificación de las intenciones y de los flujos de diálogo

3. Gestión del contenido

4. Redacción de los mensajes

UNIDAD DIDÁCTICA 4. CREACIÓN DE UN ASISTENTE CONVERSACIONAL EN DIALOGFLOW

0. Objetivos de la unidad

1. Dialogflow: presentación de la plataforma y creación de un agente

2. Creación de una cuenta y de un agente

2.1. General

2.2. Languages

2.3. ML Settings

2.4. Export and Import

2.5. Environments

2.6. Speech

2.7. Share

2.8. Advanced

3. Creación de la base de conocimiento

4. Entidades

5. Creación de flujos de diálogo utilizando contextos

Ejercicio 4: Creación de un agente conversacional

UNIDAD DIDÁCTICA 5. INTEGRACIONES Y MENSAJES ENRIQUECIDOS

0. Objetivos de la unidad

1. Integración de un agente conversacional en Telegram

2. Configuración de mensajes enriquecidos en Telegram

2.1. Estilos del texto e hipervínculos

2.2. Mensajes enriquecidos preconfigurados

3. Mensajes enriquecidos en Dialogflow Messenger

UNIDAD DIDÁCTICA 6. VALIDACIÓN Y ENTRENAMIENTO

0. Objetivos de la unidad

1. Autovalidación del asistente

2. Validación con usuarios

3. Revisión de las conversaciones y entrenamiento

4. Analíticas de uso

ANEXO. Inteligencia artificial generativa y prompt engineering

UNIDAD DIDÁCTICA 7. PRÁCTICA FINAL

1. Práctica 1: Crea tu propio chatbot

Requisitos y entregables

2. Práctica 2: Test de redacción

3. Criterios de evaluación

Cursos relacionados

- Nuevo
Tecnologías del lenguaje para lingüistas humanistas
Online

Nuestro curso de Tecnologías del lenguaje para lingüistas humanistas busca formar profesionales del lenguaje para las áreas principales de trabajo en Procesamiento del Lenguaje Natural (PLN).

leer más
- Nuevo
Programación para humanistas
Online

En el curso de Programación para humanistas aprenderás a desenvolverte con Python, expresiones regulares, UNIX y demás interfaces de programación para aplicaciones de Procesamiento del Lenguaje Natural. Todo dirigido a humanistas que deseen trabajar en este sector.

leer más
- Nuevo
Tecnologías del lenguaje para la extracción de información
Online

El curso de Tecnologías del lenguaje para la extracción de información busca proporcionar habilidades al lingüista/humanista para el desarrollo de una carrera laboral dentro del Procesamiento del Lenguaje Natural.

leer más
- Nuevo
Tecnologías del lenguaje para desarrollo de interfaces conversacionales
Online

En el curso de Tecnologías del lenguaje para desarrollo de interfaces conversacionales aprenderás a diseñar y desarrollar chatbots según los diferentes casos de uso y aplicaciones. Practicarás con sistemas reales como Dialogflow.

leer más

¿Qué opinan del curso?

Marisa Fernández

¡Menudo viaje! Gracias infinitas por todo lo aprendido, la atención y la paciencia. Nos volveremos a ver.

[cerrar]

Mostrar el certificado de confianza

Artículos relacionados

Cursos para la vuelta del verano
Si eres de los que te gusta preparar las cosas…
El futuro en ciencia es de letras, ahora toca PLN (Procesamiento del lenguaje natural)
Cálamo y Cran te acompaña en el reto de formación…
El sistema arText
ArText, una herramienta tecnológica que ayuda a estructurar, redactar y revisar géneros…