Tecnologías del lenguaje para la extracción de información
La finalidad última de este curso es proporcionar al lingüista los conocimientos y habilidades necesarios para desempeñar roles profesionales significativos en las distintas áreas de la extracción de información para PLN.
Para ello, además de explicar su papel y sus tareas más habituales en cada tipo de proyecto, el curso se desarrolla con un enfoque teórico-práctico y numerosos ejercicios de casos reales de aplicación empleando plataformas en la nube y ejemplos de código en Python.


Concepción Polo Bayo
Profesora de PLN

Janine García Morera
Profesora de PLN

Julio Villena Román
Profesor de PLN
Grupos limitados
300 €
MÁS INFORMACIÓN
Tutorizado
Online. Empieza cuando quieras
3 meses
8 lecciones (100 horas)
Orientación profesional
Certificado al finalizar
Portal de ofertas de empleo
Gastos de matrícula (30€) no incluidos en el precio del curso. Consulta descuentos.
OBJETIVOS
El objetivo del curso es profundizar en los fundamentos y técnicas básicas de las tecnologías del lenguaje relacionadas con la extracción de información. Concretamente, el curso se centra en las aplicaciones que incluyen las tareas típicas en este ámbito como son:
- el reconocimiento de entidades y conceptos
- la extracción de insights
- la clasificación automática (con modelos clásicos o con técnicas de aprendizaje computacional y/o deep learning)
- el análisis de sentimientos, emoción y opinión
- las técnicas de recuperación de información, respuesta a preguntas y extracción de resúmenes.
UNIDAD DIDÁCTICA 1. INTRODUCCIÓN
0. Objetivos de la unidad
1. Introducción
1.1. Orígenes de la extracción de información
1.2. Información estructurada vs. información no estructurada
2. Tareas de extracción de información
2.1. Reconocimiento de entidades
2.2. Clasificación automática
2.3. Extracción de información elaborada
2.4. Recuperación de información
2.5. Respuesta a preguntas
2.6. Extracción de resúmenes
3. Generación automática de texto
3.1. Fundamentos
3.2. Modelos GPT
4. Métricas de evaluación
5. Aprendizaje automático y deep learning
5.1. Aprendizaje automático
5.2. Redes neuronales y deep learning
5.2.1. Redes neuronales convolucionales
5.2.2. Capa de atención
5.2.3. Redes neuronales recurrentes
5.2.4. Arquitectura encoder-decoder
5.2.5. Modelo de transformer
5.2.6 Ventajas e inconvenientes
5.3. Vectores de embeddings
UNIDAD DIDÁCTICA 2. RECONOCIMIENTO DE ENTIDADES
0. Objetivos de la unidad
1. Introducción
1.1. Fundamentos y conceptos básicos
1.2. Proceso de reconocimiento de entidades
1.3. Representación del texto como secuencias
1.4. Entity linking
1.5. Aplicaciones
2. Métricas de evaluación
3. Técnicas de reconocimiento de entidades
3.1. Modelos clásicos de procesamiento del lenguaje natural
3.1.1. Características para reconocer/clasificar entidades
3.1.2. Tarea del lingüista
3.2. Técnicas de aprendizaje automático
3.2.1. Algoritmos de aprendizaje automático
3.2.2. Deep learning
3.2.3. Tarea del lingüista
Ejercicio 1: Reconocimiento de entidades con un sistema real
1. Introducción
2. Google Cloud Natural Language
3. Lexalytics NLP Demo
4. IBM Watson Natural Language Understanding
Ejercicio 2: Funcionalidades para la tarea de reconocimiento de entidades
1. Introducción
2. Google Colaboratory
3. Creación de un cuaderno nuevo
4. Reconocimiento de entidades con NLTK
5. Reconocimiento de entidades con spaCy
UNIDAD DIDÁCTICA 3. CLASIFICACIÓN AUTOMÁTICA
0. Objetivos de la unidad
1. Introducción
1.1. Fundamentos y conceptos básicos
1.2. Tipos de clasificación
1.2.1. Clasificación binaria (binary)
1.2.2. Clasificación multiclase (multiclass)
1.2.3. Clasificación single-label vs. multi-label
1.3. Aplicaciones
2. Métricas de evaluación
2.1. Escenarios single-label
2.2. Escenarios multi-label
3. Técnicas de clasificación automática
3.1. Modelos basados en reglas
3.1.1. Tarea del lingüista
3.2. Técnicas de aprendizaje automático
3.2.1. Tarea del lingüista
3.3. Modelos híbridos
4. Tipos específicos de clasificación
4.1 Análisis de sentimientos
4.2. Análisis de emoción
4.3. Análisis de reputación
4.4. Detección de idioma
4.5. Detección de intenciones
Ejercicio 3: Clasificación de textos con un sistema real
1. Introducción
2. Google Cloud Natural Language
3. Lexalytics NLP Demo
4. IBM Watson Natural Language Understanding
Ejercicio 4: Entrenamiento de un modelo de clasificación
1. Introducción
2. Modelo de clasificación de intenciones
3. Entrenamiento
4. Ejecución
UNIDAD DIDÁCTICA 4. EXTRACCIÓN DE INFORMACIÓN COMPLEJA
0. Objetivos de la unidad
1. Introducción
2. Modelo de grafo semántico
3. Tarea de extracción de información
3.1. Modelos de reglas de extracción
3.2. Técnicas de aprendizaje automático
3.3. Tarea del lingüista
UNIDAD DIDÁCTICA 5. RECUPERACIÓN DE INFORMACIÓN
0. Objetivos de la unidad
1. Fundamentos y conceptos
2. Modelos de recuperación de información
2.1. Modelo booleano
2.2. Modelo de espacio vectorial
2.3. Modelo probabilístico
3. Similitud semántica
3.1. Conceptos
3.2. Búsqueda semántica
4. Métricas de evaluación
5. Tarea del lingüista
Ejercicio 5: Similitud semántica y búsqueda semántica
1. Búsqueda semántica
2. Búsqueda de duplicados
UNIDAD DIDÁCTICA 6. RESPUESTA A PREGUNTAS
0. Objetivos de la unidad
1. Introducción
1.1. Conceptos y fundamentos
1.2. Historia
2. Proceso de respuesta a preguntas
2.1. Fundamentos
2.2. Análisis de la pregunta
2.3. Recuperación de contextos
2.4. Extracción de la respuesta
2.5. Ejemplo
3. Extractive question answering
4. Tarea del lingüista
UNIDAD DIDÁCTICA 7. EXTRACCIÓN DE RESÚMENES
0. Objetivos de la unidad
1. Introducción
2. Resúmenes extractivos
2.1. Conceptos
2.2. Proceso clásico
2.3. Modelos basados en aprendizaje automático
2.4. Escenarios específicos
2.5. Tarea del lingüista
3. Resúmenes abstractivos
3.1. Conceptos
3.2. Modelos
3.3. Tarea del lingüista
Ejercicio 6: Extracción de resúmenes extractivos y abstractivos
1. Resúmenes extractivos
2. Resúmenes abstractivos
UNIDAD DIDÁCTICA 8. ORIENTACIÓN PROFESIONAL Y PRÁCTICA FINAL
1. Introducción
2. Escenarios con más oportunidades
3. La búsqueda de oportunidades
3.1. Modalidades
3.2. Tareas más demandadas
3.3. Expresiones clave para localizar ofertas
3.4. Portales generalistas
3.5. Portales especializados
4. Recomendaciones para presentar candidaturas
4.1. CV visualmente atractivo
4.2. Adaptación para cada oferta
5. Preparación previa/continua
5.1. Marca personal
5.1.1. Práctica
5.1.2. Porfolio
5.1.3. Comunidades
Práctica final
1. Objetivos
2. Desarrollo del ejercicio
2.1. Diseño del escenario
2.2. Desarrollo del escenario
3. Informe de resultados
4. Rúbrica de evaluación
-
Experto en Procesamiento del Lenguaje Natural
Online
En este Posgrado en Procesamiento del Lenguaje Natural aprenderás todo lo necesario para desarrollar tu carrera profesional en el ámbito de la inteligencia artificial (IA) en español.
-
Tecnologías del lenguaje para lingüistas humanistas
Online
Nuestro curso de Tecnologías del lenguaje para lingüistas humanistas busca formar profesionales del lenguaje para las áreas principales de trabajo en Procesamiento del Lenguaje Natural (PLN).
-
Programación para humanistas
Online
En el curso de Programación para humanistas aprenderás a desenvolverte con Python, expresiones regulares, UNIX y demás interfaces de programación para aplicaciones de Procesamiento del Lenguaje Natural. Todo dirigido a humanistas que deseen trabajar en este sector.
-
Tecnologías del lenguaje para desarrollo de interfaces conversacionales
Online
En el curso de Tecnologías del lenguaje para desarrollo de interfaces conversacionales aprenderás a diseñar y desarrollar chatbots según los diferentes casos de uso y aplicaciones. Practicarás con sistemas reales como Dialogflow.
[cerrar]
