
El investigador del CITIC de la UDC Carlos Gómez presenta en Kioto sus proyectos sobre lingüística computacional, la ciencia que traduce el lenguaje natural a dispositivos tecnológicos
- Participó en un workshop sobre enfoques de datos orientados a las ciencias sociales y las humanidades organizado por la Universidad de Kioto.
El investigador del CITIC de la Universidade da Coruña, Carlos Gómez, especialista en lingüística computacional, habló sobre el potencial de los llamados modelos LLM (modelos de lenguaje de gran tamaño), dirigidos a adaptar el lenguaje natural a entornos virtuales y dispositivos tecnológicos, en el workshop “Unit End-Year Workshop 2025: Data-Oriented Approaches to the Social Sciences and Humanities”.
El Premio Nacional de Investigación expuso los primeros resultados de un estudio comparativo que están desarrollando en el CITIC sobre las diferencias entre textos LLM y textos humanos; su potencial, inconvenientes y la recomendación de plantear un escenario con múltiples vías para seguir trabajando en esta línea. Más idiomas, modelos a medida o considerar la influencia de género son algunos de los caminos que apunta el investigador.
La misión del CITIC con la participación en esta cita, así como en otras iniciativas de carácter internacional, es demostrar que hacer ciencia de vanguardia en Galicia es posible. Ciencia que sea capaz de transferirse a la sociedad y que, adicionalmente, se desarrolle desde el punto de vista funcional.
Ciencias y letras, de la mano para crear el lenguaje de las TIC
El objetivo del proyecto presentado en Japón es crear algoritmos que ‘traduzcan’ el lenguaje natural, muchas veces complejo para las TIC, a entornos digitales actuales propios de la inteligencia artificial; y los códigos, herramientas y programas informáticos propios de la llamada lingüística computacional. La investigación de las tecnologías del lenguaje es la clave de esta disciplina científica que conjuga el trabajo de tecnólogos como matemáticos, informáticos o ingenieros, con el de lingüistas y otros especialistas de las humanidades. Se trata de un campo interdisciplinar que se ocupa del desarrollo de formalismos que describen el funcionamiento del lenguaje natural para que puedan ser transformados y, por tanto, procesados, en programas ejecutables por un dispositivo tecnológico.
Los resultados presentados aplican los resultados de un proyecto dirigido por el mismo investigador del CITIC, en el que se desarrollaron nuevas técnicas para mejorar la velocidad de los analizadores sintácticos del lenguaje natural, haciéndolos adecuados para el procesamiento a escala web. Dichas técnicas también se han demostrado útiles para analizar y comparar grandes volúmenes de textos generados por humanos y LLMs.