Director: Roberto Centeno (Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.) y Álvaro Rodrigo (Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.)

Objetivo: El trabajo que se propone consiste en el desarrollo de una aplicación capaz de i) recuperar titulares de noticias clasificadas como falsas por alguna web de fact checking (por ej. https://maldita.es o https://www.newtral.es/ o https://www.politifact.com/); ii) recuperar perfiles de usuario de redes como, por ej. Twitter o Facebook, que hayan compartido estos titulares, recopilando datos como sus último "n" mensajes, número de seguidores, likes, fecha de creación, etc.. y; iii) construir datasets con los datos recopilados, almacenándolos en algún formato concreto (por ej. csvjson, etc..).

Descripción: El término "fake news" ha experimentado un increíble aumento de popularidad y atención en los últimos años, convirtiéndose en un área de investigación muy importante. Dentro del área centrado en la detección de noticias falsas de manera automática, una de las tareas fundamentales se focaliza en mitigar o impedir la difusión de noticias falsas en las redes sociales, surgiendo en los últimos años nuevas propuestas centradas en la detección e identificación de perfiles de usuario difusores de noticias en los medios sociales.

Partiendo de estas ideas, el objetivo de este trabajo se centra en el desarrollo de una aplicación que nos permita crear datasets de perfiles de usuarios difusores de noticias falsas en las redes sociales, que sirvan en un futuro para evaluar los mecanismos centrados en la tarea de detección de estos perfiles. Para ello, la aplicación debe permitir recopilar titulares de noticias que han sido catalogadas como falsas por webs dedicadas a la detección de noticias falsas de manera manual. A partir de los titulares recopilados, la herramienta debe buscar en redes sociales como Twitter o Facebook, si ha sido compartida o no dicha noticia y en caso afirmativo recopilar todos los datos posibles de los perfiles de usuarios que han compartido la noticia. Una vez recopilados los datos de estos usuarios, el objetivo final será la construcción de datasets, almacenando los datos en algún formato estándar como puede ser csv o json. 

Metodología: En primer lugar, se realizará un estudio del problema y de las distintas técnicas que se van a aplicar. En esta etapa se contribuirá a la definición de requisitos de la aplicación. A continuación, se realizará una arquitectura de la aplicación, así como la determinación de las funcionalidades requeridas. En tercer lugar, se diseñarán e implementarán dichas funcionalidades, permitiendo el acceso a un conjunto de webs de fact checking y recopilando titulares de noticias catalogadas como falsas. En la siguiente etapa se definirán los aspectos necesarios para el acceso a un conjunto de redes sociales predefinidas, como Twitter o Facebook, que permitan la recopilación de perfiles de usuarios que hayan compartido los titulares recopilados. En esta fase se determinará qué aspectos de los usuarios se van a recopilar. En una siguiente etapa se definirá el formato de almacenamiento de los datos recopilados, para generar conjuntos de datos como resultado final de la aplicación. Finalmente, se llevará a cabo una fase de prueba, evaluando el funcionamiento de la aplicación.

Requisitos: Conocimientos de programación en python o java.