Con el objetivo de combatir la desinformación en redes sociales durante la emergencia sanitaria e identificar si existe una correlación entre las menciones negativas en Twitter y el número de retuits relacionados con el coronavirus , científicos mexicanos crearon un robot que permite clasificar la veracidad de las noticias y evitar la desinformación.
Un equipo liderado por el ingeniero Ismael Peregrina, desarrolló un robot para identificar si existe una correlación entre las menciones negativas y el número de retuits relacionados con el coronavirus y, a partir de ahí, desarrollar herramientas para clasificar la veracidad de las noticias y evitar la desinformación.
Utilizando técnicas aplicadas en ciencia de datos el equipo realizó un diccionario de Twitter y analizando 30 mil tuits , crearon una clasificación para medir la positividad de las publicaciones en una escala de decimales que va del +1.0 al -1.0.
“Si bien, se descubrió con esta información que no hay una correlación entre la negatividad y la propagación de la información , saltaron a la vista dos situaciones atípicas en donde el mayor número de retweets fueron de publicaciones negativas de cuentas no verificadas, con 9,353 y 8,427 retweets ”.
El proyecto denominado “Análisis Exploratorio de Tweets con Análisis de Sentimiento para determinar la viralidad de una mención con relación a su sentimiento”, obtuvo el primer lugar COVID-19 Challenge, organizado por el Colegio de Médicos Cirujanos del Estado de Nuevo León, Data Science Monterrey, Hacking Health Monterrey, Women in Data Science, Power and Engineering y Saturday AI Monterrey.
Existen diferentes factores que pueden viralizar un post, desde las palabras utilizadas, hasta el propietario de la cuenta, verificación de la cuenta, momento de la emisión del post respecto a la situación que está ocurriendo, explicó Ismael Peregrina, Líder de inteligencia y científico de datos Universidad Tecmilenio.
El especialista refirió que 80 por ciento del tiempo del proyecto se consume en la preparación de los datos; la inmediatez con la que hay que tratar las cifras en tiempo real para tomar acciones requiere de contar con procesos, recursos y arquitectura para informar a la población lo que en realidad esté ocurriendo.
Con este proyecto se da un paso importante en el objetivo de facilitar que la población, según el emisor y la clasificación de publicaciones, pueda estar informada con fuentes veraces.