
El investigador del CITIC de la UDC Miguel Anxo Pérez Vila, premiado por su trabajo en IA para detectar depresión en redes sociales
- El trabajo ha recibido el reconocimiento como Mejor Tesis Doctoral de 2024 por parte de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN).
- La tesis parte de la evidencia de que las personas que sufren problemas de salud mental suelen mostrar cambios en su manera de expresarse.
- En este mismo congreso, el investigador Roi Santos presentó sus avances en el proyecto CIDMEFEO, desarrollado en colaboración con el INE.
A Coruña, 6 de octubre de 2025.- La Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) ha concedido a Miguel Anxo Pérez Vila el Premio a la Mejor Tesis Doctoral en el año 2024, uno de los galardones más prestigiosos en el ámbito del Procesamiento de Lenguaje Natural (NLP) en España, en reconocimiento a su excelencia científica y su relevancia social.
La investigación de Anxo Pérez, miembro del Centro de Investigación en TIC (CITIC) de la Universidade da Coruña, centro integrado en la Red CIGUS de la Xunta de Galicia, es pionera en el uso de técnicas de Inteligencia Artificial, aprendizaje automático y lingüística computacional para la detección de la depresión a través del lenguaje en redes sociales.
La tesis, dirigida por los investigadores Javier Parapar y Álvaro Barreiro, parte de la evidencia de que las personas que sufren problemas de salud mental suelen mostrar cambios en su manera de expresarse. A partir de esta premisa y del enorme repositorio de lenguaje escrito que suponen las redes sociales, el trabajo de Anxo Pérez explora cómo aprovechar estas publicaciones mediante modelos de IA entrenados con datos clínicos y sociales para identificar señales de riesgo en los usuarios.
Uno de los aspectos más innovadores de la investigación es la búsqueda de mayor transparencia en los sistemas de detección. Frente a aproximaciones previas más opacas, la tesis propone modelos explicables basados en síntomas validados clínicamente, lo que facilita que los resultados sean comprensibles y útiles para profesionales de la salud.
El proyecto combina el diseño de nuevos algoritmos de estimación de la gravedad de la depresión con la creación de colecciones de datos específicas y con la exploración de grandes modelos de lenguaje (LLMs). Además, sus aportaciones han sido integradas en una plataforma demostrativa que permite su uso por parte de profesionales clínicos, abriendo la puerta a aplicaciones prácticas en el ámbito sanitario.
A lo largo del desarrollo de la tesis, Anxo Pérez ha publicado los resultados en conferencias internacionales de referencia como ECIR, SIGIR o EMNLP, así como en revistas como Artificial Intelligence in Medicine (AIM). Entre las principales conclusiones alcanzadas destacan varias aportaciones clave: los síntomas de depresión se manifiestan de forma distinta en el lenguaje, lo que exige modelos sensibles a su naturaleza; los mensajes en redes sociales contienen señales sutiles, que pueden revelarse mediante técnicas de recuperación semántica; y la falta de datos adecuados motivó la creación de dos nuevos conjuntos de referencia (BDI-Sen y DepreSym). Asimismo, la investigación subraya que, aunque los modelos de lenguaje de gran escala pueden apoyar la tarea de anotación, la supervisión humana sigue siendo esencial. Finalmente, la colaboración con profesionales clínicos resultó fundamental para guiar la clasificación, la interpretación de los resultados y garantizar la validez médica de las conclusiones.
Con este premio, la SEPLN pone en valor una investigación que no solo destaca por su originalidad y rigor metodológico, sino también por su impacto potencial en la mejora de la salud mental y el bienestar social.
Destacada participación del CITIC en el congreso de la SEPLN
En el mismo congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), en el que fue galardonado Miguel Anxo Pérez Vila, también participó el investigador del CITIC Roi Santos Ríos. En su intervención presentó parte de su trabajo de tesis “Automatic Classification of the Economic Activity of a Company Using ML and DL Techniques”, un trabajo enmarcado en el proyecto Ciencia e Ingeniería de Datos para la Mejora de la Función Estadística Oficial (CIDMEFEO) financiado por el Instituto Nacional de Estadística (INE). Su investigación se centra en la creación de un prototipo de clasificación automática de textos para identificar y etiquetar la actividad económica de las empresas españolas a partir de las descripciones que ellas mismas proporcionan.
Esta línea de trabajo busca desarrollar un codificador automático basado en técnicas de machine learning que permita agilizar y mejorar el tratamiento de preguntas abiertas en encuestas oficiales, en colaboración con el INE. Con ello se pretende reducir tiempos y costes, mejorar la homogeneidad de los resultados y afrontar retos complejos como la variabilidad lingüística, la calidad desigual de las respuestas o la realidad multilingüe de España.
De este modo, la presencia del CITIC en el congreso no solo estuvo marcada por un premio de gran prestigio, sino también por la exposición de proyectos punteros que refuerzan su papel en la aplicación de IA a la mejora de procesos estadísticos y sociales.
Sobre el CITIC
El CITIC es un centro de investigación que potencia el avance y la excelencia en I+D+i aplicada a las TIC, creado en 2008 por la Universidade da Coruña. La actividad científica del centro se estructura en cuatro áreas de investigación principales: Inteligencia artificial; Ciencia e Ingeniería de Datos; Computación de Altas Prestaciones; y Servicios y Redes Inteligentes, y un área de investigación transversal a todas ellas: la de Ciberseguridad.
El CITIC está acreditado como Centro de Excelencia y miembro de la Red CIGUS para el periodo 2024-2027, lo que avala la calidad e impacto de su investigación. La acreditación, estructuración y mejora del CITIC está cofinanciada por la Xunta de Galicia y en un 60% por la Unión Europea en el marco del Programa Operativo FEDER Galicia 2021-2027, con el objetivo temático de promover “una Europa más inteligente: transformación económica innovadora e inteligente” (ED431G 2023/01).