Un investigador do CITIC presenta un toolkit para procesamento da linguaxe natural no ANLP 2018
17/10/2018
O investigador Marcos García-González da área de Ciencia de Datos e Información do CITIC e investigador postdoctoral do Programa Juan de la Cierva, asiste estes días ao Second International Workshop on Advances in Natural Language Processing ( ANLP 2018) que se celebra en Valencia no marco do Fifth International Conference on Social Networks Analysis, Management and Security ( SNAMS-2018).
Marcos García-González presentará no evento o ” LinguaKit: a Big Data- based multilingual tool for linguistic analysis and information extraction”, un toolkit para procesamento da linguaxe natural e minería de texto multilingües que implementa diversas ferramentas para análises, extracción, anotación e corrección lingüística, así como para a súa integración nunha infraestrutura Big Data. A maioría dos módulos están dispoñibles para español, galego, portugués e inglés. O sistema está programado en Perl e está dispoñible @gratuitamente baixo unha licenza GPLv3.
Os coautores do traballo, xunto con Marcos García-González do CITIC, son Pablo Gamallo, Marcos García, César Piñeiro, Rodrigo Martínez-Castaño e Juan C. Pichel, do CITIUS.