Descripción
En muchas de las tareas de procesamiento de lenguaje la salida del sistema se presenta en formato texto. En las décadas anteriores las tareas más comunes de este tipo fueron la traducción y la generación de resúmenes. Sin embargo, en los últimos años, con el desarrollo de modelos de lenguaje pre-entrenados a gran escala (GTP, Bert, etc.), se han multiplicado las tareas en las que el sistema ofrece una solución en formato de texto libre (asistentes virtuales, generadores de código de programación, consultas de conocimiento general, etc.) Básicamente, estos sistemas se pueden evaluar, bien mediante métricas basadas en solapamiento de palabras con un texto de referencia (ROUGE, BLEU, METEOR) o bien entrenando a su vez un sistema para predecir la similitud entre el texto generado y un texto correcto. Ambas soluciones tienen ventajas y desventajas. Esta línea de investigación se centra en desarrollar mecanismos de combinación de métricas para asegurar una evaluación más robusta.
Profesor/es
Enrique Amigó
Asignaturas recomendadas
- 31101076 DESCUBRIMIENTO DE INFORMACIÓN EN TEXTOS
- 31101019 ACCESO INTELIGENTE A LA INFORMACIÓN
- 31070023 REPRESENTACIÓN DE TEXTOS EN ESPACIOS VECTORIALES Y PROBABILÍSTICOS
- 31070017 REDES NEURONALES PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL