Descripción

Tradicionalmente se ha distinguido en el campo del procesamiento de lenguaje entre sistemas discriminativos y sistemas generativos. Los primeros incluyen sistemas que generan información estructurada como clasificación en categorías, ranking, plantillas, etc. El segundo se refiere a sistemas que generan texto. Sin embargo, con el auge de los modelos de lenguaje neuronales pre-entrenados a gran escala, se abre la posibilidad de sistemas que generen conocimiento estructurado más allá de un pequeño conjunto de categorías o una ordenación en un ranking. Por ejemplo, mediante servicios como ChatGPT, es posible pedir a un modelo que genere una estructura en SQL, o un conjunto de cláusulas lógicas dentro de un dominio restringido. Se encuentra en plena discusión en la comunidad científica la pregunta de hasta qué punto los modelos de lenguaje pre-entrenados a gran escala son capaces de generalizar, interpretar o realizar inferencias sobre este tipo de estructuras. El propósito de esta línea de investigación es estudiar todas la posibles dimensiones del problema y definir métricas de evaluación que sirvan de guía para el desarrollo de este tipo de sistemas.

Profesor/es

Enrique Amigó

Asignaturas recomendadas

  • 31101076 DESCUBRIMIENTO DE INFORMACIÓN EN TEXTO
  • 31101019 ACCESO INTELIGENTE A LA INFORMACIÓN
  • 31070023 REPRESENTACIÓN DE TEXTOS EN ESPACIOS VECTORIALES Y PROBABILÍSTICOS
  • 31070017 REDES NEURONALES PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL