CITIC

Sistemas recomendadores y búsquedas de información más efectivas a través de las investigaciones del CITIC

02/05/2013

Cuando uno accede a Google o a cualquier otro buscador estaría encantado con que a través de una búsqueda simple y rápida encuentre en la primera página de resultados toda la información que está buscando, pero a veces se ha de realizar nueva búsquedas o avanzar en el listado de páginas hasta llegar al resultado óptimo. Para evitar esta situación y mejorar la calidad de la información obtenida el Centro de Investigación en Tecnologías de la Información y las Comunicaciones (CITIC) ha desarrollado técnicas inteligentes basadas en la creación semiautomática de aplicaciones de integración ligeras (“mashups”) que se están aplicando en empresas como Denodo Technologies o en sectores como la banca o la industria textil.

 

El volumen de información que se genera en Internet es descomunal, se estima que en dos días se genera la misma cantidad de información que desde el origen de los tiempos hasta el año 2003. Pero, de todo lo que se encuentra en la red, ¿cuáles son los datos que está buscando o necesita una empresa? El Centro de Investigación en Tecnologías de la Información y las Comunicaciones (CITIC) lleva años desarrollando proyectos de investigación en esta línea, que favorezcan la obtención de información más refinada y adecuada a las búsquedas realizadas de la manera más rápida posible.

 

En definitiva, se trata de obtener un software que basado en un algoritmo sea capaz de generar un sistema recomendador con un claro objetivo: obtener información más relevante.

 

Búsquedas más refinadas y eficientes

Víctor Carneiro, Víctor Carneiro, Responsable del Área Tecnológica del CITIC de Integración de Aplicaciones e Información, e Investigador Principal del Grupo de Investigación TELEMÁTICA, explica el funcionamiento de estas aplicaciones de integración de datos en dos pasos: “En Internet hay millones de fuentes, un buscador emplea complicados algoritmos para encontrar la información requerida pero no es capaz de determinar qué fuente es la más adecuada para la búsqueda que realizamos. Nuestro software basado en técnicas inteligentes permite, en primer lugar, la localización de las mejores fuentes de información y a continuación, sobre ese primer sesgo, busca el contenido relacionado, con lo que se consiguen búsquedas más refinadas y eficientes. Se trata de quedarnos con lo que realmente interesa”.

 

Estos sistemas recomendadores del CITIC obtienen mejores búsquedas ya que integran todo tipo de datos y fuentes heterogéneas como páginas html, archivos Word, bases de datos o formularios, consiguiendo homogeneizarlas de una manera rápida, en tan sólo segundos. Uno de los objetivos principales es lograr que estas búsquedas se realicen de forma óptima y rápida, ya que las respuestas lentas están condenadas al fracaso.

 
Investigación aplicada

Entre los proyectos de investigación del CITIC que se han llevado a la práctica destacan las aplicaciones mashup de inteligencia colectiva que han sido empleadas para colaborar en algunas de las plataformas de la compañía Denodo Technologies,  referente internacional en el acceso a las fuentes de información desestructuradas. Para este caso en concreto se crearon una serie de algoritmos desarrollados para análisis de formularios web,  automatización de consultas, etc… De forma que el sistema se adapta a cambios recurrentes en las fuentes, a nuevas fuentes,…

 

Desde el CITIC también se han desarrollado aplicaciones orientadas a la venta online en la industria textil. Basándose en una aplicación de algoritmos se ha creado un software que origina un sistema recomendador que facilita información sobre productos relacionados en la búsqueda, permitiendo incrementar en más de un 5% las ventas a través de web. En función de los pasos que el cliente realiza en su búsqueda se asigna un peso a la misma, lo que favorece la recomendación de otros productos dentro de un volumen de información enorme.

 

El correcto manejo de la información es a día de hoy uno de los aspectos más importantes para las empresas: integrar datos, analizarlos y encontrar lo que uno necesita de la manera más eficaz posible es uno de los campos en los que investigación TIC está haciendo más hincapié. No hace falta salir de Galicia para encontrar modelos de cómo llevarlo a cabo, el CITIC ha desarrollado diferentes técnicas que facilitan este objetivo.