Carlos Gómez, investigador del CITIC de la UDC, recibe financiación del prestigioso ERC para su proyecto de lingüística computacional, la ciencia que traduce el lenguaje natural a dispositivos tecnológicos
06/09/2022 – CITIC
- El proyecto denominado SALSA se enmarca en el área de Inteligencia Artificial del centro de la UDC y es continuación del también ERC FASTPARSE, responsable de crear el algoritmo que reduce la lectura de El Quijote a menos de 20 segundos sin perder calidad conceptual
- SALSA avanza en la generación de códigos, métodos y herramientas pensadas para traducir el lenguaje natural a los más sofisticados entornos digitales
- El Consejo Europeo de Investigación (ERC) financia con 150.000 € este innovador programa, único gallego en esta convocatoria, situando al CITIC en el mapa europeo de la excelencia investigadora
El Centro de Investigación en Tecnologías de la Información y las Comunicaciones (CITIC) de la UDC da un nuevo salto cualitativo en la transferencia de tecnología y en su reconocimiento internacional. El proyecto “Efficient Syntactic Analysis for Large-scale Sentiment Analysis” (SALSA), dirigido por el IP del centro Carlos Gómez Rodríguez, acaba de ser seleccionado por la agencia financiadora más importante de Europa, el Consejo Europeo de Investigación (ERC), y financiado con 150.000 € en la categoría “Prueba de Concepto”, la línea que da cobertura a proyectos de innovación comercializables. SALSA es el único proyecto gallego que reconoce el ERC en esta última convocatoria.
Ciencias y letras, de la mano para crear el lenguaje de las TIC
El objetivo de SALSA es crear algoritmos que ‘traduzcan’ el lenguaje natural, muchas veces complejo para las TIC, a entornos digitales actuales propios de la inteligencia artificial; y los códigos, herramientas y programas informáticos propios de la llamada lingüística computacional. La investigación de las tecnologías del lenguaje es la clave de esta disciplina científica que conjuga el trabajo de tecnólogos como matemáticos, informáticos o ingenieros, con el de lingüistas y otros especialistas de las humanidades. Se trata de un campo interdisciplinar que se ocupa del desarrollo de formalismos que describen el funcionamiento del lenguaje natural para que puedan ser transformados y, por tanto, procesados, en programas ejecutables por un dispositivo tecnológico.
Este programa es la continuación del también financiado por el ERC en 2016, finalizado recientemente, “Fast Natural Language Parsing for Large-Scale NLP” (FASTPARSE), responsable, entre otros hitos, de diseñar el algoritmo capaz de agilizar la lectura de El Quijote reduciéndola a tan solo 20 segundos sin deteriorar su calidad conceptual. La finalidad de este innovador proyecto ha sido desarrollar nuevas técnicas para mejorar la velocidad de los analizadores sintácticos del lenguaje natural, haciéndolos adecuados para el procesamiento a escala web.
Software más accesible y económico
“Acelerar enormemente el análisis de las opiniones presentes en textos del lenguaje natural para hacerlas más fáciles de interpretar por la inteligencia artificial es lo que buscamos con este proyecto”, señala Carlos Gómez, que recuerda además que el principal objetivo de SALSA es “democratizar el análisis de datos de internet y redes sociales y transformarlos en conocimiento para los tomadores de decisiones, utilizando los modelos y algoritmos de análisis sintáctico desarrollados en el proyecto ERC Starting Grant FASTPARSE para crear sistemas de análisis de sentimiento que sean a la vez precisos y eficientes (al emplear analizadores rápidos que pueden procesar del orden de 1.000 oraciones por segundo en hardware estándar de consumo)”, apunta el investigador del CITIC.
SALSA seguirá un modelo de negocio de software de código abierto y pretende contribuir, en gran medida, a la competitividad del mercado tecnológico de la UE, “reduciendo su dependencia del oligopolio de gigantes tecnológicos. Además de crear oportunidades para idiomas como el gallego, no prioritarios para las multinacionales”, recuerda.
La misión del CITIC con este y otros proyectos de similar alcance es demostrar que hacer ciencia de vanguardia en Galicia es posible. “Ciencia que sea capaz de transferirse a la sociedad y que, adicionalmente, se desarrolle desde el punto de vista industrial. La captación de proyectos de primer nivel como este ERC dan buena cuenta de ello”, asegura el investigador principal del CITIC.