
O investigador do CITIC da UDC Miguel Anxo Pérez Vila, premiado polo seu traballo en IA para detectar depresión en redes sociais
- O traballo recibiu o recoñecemento como Mellor Tese Doutoral de 2024 por parte da Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN).
- A tese parte da evidencia de que as persoas que sofren problemas de saúde mental adoitan amosar cambios na súa maneira de expresarse.
- Neste mesmo congreso, o investigador Roi Santos presentou os seus avances no proxecto CIDMEFEO, desenvolvido en colaboración co INE.
A Coruña, 6 de outubro de 2025.– A Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN) concedeu a Miguel Anxo Pérez Vila o Premio á Mellor Tese Doutoral de 2024, un dos galardóns máis prestixiosos no ámbito do Procesamento da Linguaxe Natural (NLP) en España, en recoñecemento á súa excelencia científica e á súa relevancia social.
A investigación de Anxo Pérez, membro do Centro de Investigación en TIC (CITIC) da Universidade da Coruña, centro integrado na Rede CIGUS da Xunta de Galicia, é pioneira no uso de técnicas de Intelixencia Artificial, aprendizaxe automática e lingüística computacional para a detección da depresión a través da linguaxe en redes sociais.
A tese, dirixida polos investigadores Javier Parapar e Álvaro Barreiro, parte da evidencia de que as persoas con problemas de saúde mental adoitan amosar cambios na súa expresión. A partir desta premisa e do enorme repositorio de linguaxe escrita que supoñen as redes sociais, o traballo de Anxo Pérez explora como aproveitar estas publicacións mediante modelos de IA adestrados con datos clínicos e sociais para identificar sinais de risco nos usuarios.
Un dos aspectos máis innovadores da investigación é a busca dunha maior transparencia nos sistemas de detección. Fronte a aproximacións anteriores máis opacas, a tese propón modelos explicables baseados en síntomas validados clinicamente, o que facilita que os resultados sexan comprensibles e útiles para profesionais da saúde.
O proxecto combina o deseño de novos algoritmos de estimación da gravidade da depresión coa creación de coleccións de datos específicas e coa exploración de grandes modelos de linguaxe (LLMs). Ademais, as súas achegas foron integradas nunha plataforma demostrativa que permite o seu uso por parte de profesionais clínicos, abrindo a porta a aplicacións prácticas no ámbito sanitario.
Ao longo do desenvolvemento da tese, Anxo Pérez publicou os resultados en congresos internacionais de referencia como ECIR, SIGIR ou EMNLP, así como en revistas como Artificial Intelligence in Medicine (AIM). Entre as principais conclusións destacan varias achegas clave: os síntomas de depresión maniféstanse de maneira diferente na linguaxe, o que require modelos sensibles á súa natureza; as mensaxes en redes sociais conteñen sinais sutís que poden revelarse mediante técnicas de recuperación semántica; e a falta de datos adecuados motivou a creación de dous novos conxuntos de referencia (BDI-Sen e DepreSym). Así mesmo, a investigación subliña que, aínda que os modelos de linguaxe de gran escala poden apoiar a tarefa de anotación, a supervisión humana segue sendo esencial. Finalmente, a colaboración con profesionais clínicos resultou fundamental para guiar a clasificación, a interpretación dos resultados e garantir a validez médica das conclusións.
Con este premio, a SEPLN pon en valor unha investigación que non só destaca pola súa orixinalidade e rigor metodolóxico, senón tamén polo seu impacto potencial na mellora da saúde mental e do benestar social.
Destacada participación do CITIC no congreso da SEPLN
No mesmo congreso da Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN), no que foi galardoado Miguel Anxo Pérez Vila, tamén participou o investigador do CITIC Roi Santos Ríos. Na súa intervención presentou parte do seu traballo de tese “Automatic Classification of the Economic Activity of a Company Using ML and DL Techniques”, un traballo enmarcado no proxecto Ciencia e Enxeñaría de Datos para a Mellora da Función Estatística Oficial (CIDMEFEO) financiado polo Instituto Nacional de Estatística (INE). A súa investigación céntrase na creación dun prototipo de clasificación automática de textos para identificar e etiquetar a actividade económica das empresas españolas a partir das descricións que elas mesmas proporcionan.
Esta liña de traballo busca desenvolver un codificador automático baseado en técnicas de machine learning que permita axilizar e mellorar o tratamento de preguntas abertas en enquisas oficiais, en colaboración co INE. Con iso preténdese reducir tempos e custos, mellorar a homoxeneidade dos resultados e afrontar retos complexos como a variabilidade lingüística, a calidade desigual das respostas ou a realidade multilingüe de España.
Deste xeito, a presenza do CITIC no congreso non só estivo marcada por un premio de gran prestixio, senón tamén pola exposición de proxectos punteiros que reforzan o seu papel na aplicación da IA á mellora de procesos estatísticos e sociais.
Sobre o CITIC
O CITIC é un centro de investigación que impulsa o avance e a excelencia en I+D+i aplicada ás TIC, creado en 2008 pola Universidade da Coruña. A actividade científica do centro estrutúrase en catro áreas principais de investigación: Intelixencia Artificial, Ciencia e Enxeñaría de Datos, Computación de Altas Prestacións, e Servizos e Redes Intelixentes, ademais dunha área transversal a todas elas: a de Ciberseguridade.
O CITIC está acreditado como Centro de Excelencia e membro da Rede CIGUS para o período 2024-2027, o que avala a calidade e impacto da súa investigación. A acreditación, estruturación e mellora do CITIC está cofinanciada pola Xunta de Galicia e nun 60% pola Unión Europea no marco do Programa Operativo FEDER Galicia 2021-2027, co obxectivo temático de promover “unha Europa máis intelixente: transformación económica innovadora e intelixente” (ED431G 2023/01).