CITIC

O investigador do CITIC da UDC Carlos Gómez presenta en Kioto os seus proxectos sobre lingüística computacional, a ciencia que traduce a linguaxe natural a dispositivos tecnolóxicos

27/03/2025 - CITIC
  • Participou nun workshop sobre enfoques de datos orientados ás ciencias sociais e ás humanidades organizado pola Universidade de Kioto.

O investigador do CITIC da Universidade da Coruña, Carlos Gómez, especialista en lingüística computacional, falou sobre o potencial dos chamados modelos LLM (modelos de linguaxe de gran tamaño), dirixidos a adaptar a linguaxe natural a contornas virtuais e dispositivos tecnolóxicos, no workshop “Unit End-Year Workshop 2025: Data-Oriented Approaches to the Social Sciences and Humanities”.

O Premio Nacional de Investigación expuxo os primeiros resultados dun estudo comparativo que están a desenvolver no CITIC sobre as diferenzas entre textos LLM e textos humanos; o seu potencial, inconvenientes e a recomendación de expor un escenario con múltiples vías para seguir traballando nesta liña. Máis idiomas, modelos a medida ou considerar a influencia de xénero son algúns dos camiños que apunta o investigador.

A misión do CITIC coa participación nesta cita, así como noutras iniciativas de carácter internacional, é demostrar que facer ciencia de vangarda en Galicia é posible. Ciencia que sexa capaz de transferirse á sociedade e que, adicionalmente, desenvólvase desde o punto de vista funcional.

Ciencias e letras, da man para crear a linguaxe das TIC

O obxectivo do proxecto presentado no Xapón é crear algoritmos que ‘traduzan’ a linguaxe natural, moitas veces complexo para as TIC, a contornas dixitais actuais propios da intelixencia artificial; e os códigos, ferramentas e programas informáticos propios da chamada lingüística computacional. A investigación das tecnoloxías da linguaxe é a clave desta disciplina científica que conxuga o traballo de tecnólogos como matemáticos, informáticos ou enxeñeiros, co de lingüistas e outros especialistas das humanidades. Trátase dun campo interdisciplinar que se ocupa do desenvolvemento de formalismos que describen o funcionamento da linguaxe natural para que poidan ser transformados e, por tanto, procesados, en programas executables por un dispositivo tecnolóxico.

Os resultados presentados aplican os resultados dun proxecto dirixido polo mesmo investigador do CITIC, no que se desenvolveron novas técnicas para mellorar a velocidade dos analizadores sintácticos da linguaxe natural, facéndoos adecuados para o procesamento a escala web. Estas técnicas tamén se demostraron útiles para analizar e comparar grandes volumes de textos xerados por humanos e LLMs.