CITIC

CIENCIA E ENXEÑERÍA DE DATOS

Trátase dunha área de investigación en crecemento e con perspectiva de futuro de xerar novo coñecemento e aplicacións para mellorar a calidade de vida da sociedade. Os investigadores líderes que forman parte desta área posúen unha excelente e recoñecida traxectoria reflectida tanto en publicacións como en proxectos de ámbito nacional e internacional.

PRIORIDADES CIENTÍFICAS E LÍÑAS DE INVESTIGACIÓN:

Big Data: céntrase en resolver os problemas para a xestión de grandes volumes de datos que non poden ser tratados de xeito convencional polo seu gran volume, a velocidade á que deben ser xestionados e a variedade ou complexidade en que se require manexar con frecuencia datos estruturados e non estruturados. Existen outras dificultades que debe afrontar como a veracidade dos datos para se asegurar de que a información extraída é fiable, o valor ou rendemento que se pode obter da súa explotación, ou a dificultade inherente na súa visualización.

Liñas de investigación:

    • Novos sistemas para o almacenamento masivo e eficiente de datos mediante estruturas de datos compactas e autoindexadas e, máis especificamente, no deseño e implementación de algoritmos para a creación e explotación de estruturas de datos comprimidas para diferentes tipos de datos como textos, gráficos, mapas raster, traxectorias de obxectos móbiles e xenoma, entre outras.

Recuperación de información: trátase da recollida, almacenamento, indexación e busca de información. Son o conxunto de teorías, modelos, algoritmos e metodoloxías de avaliación de textos non estruturados en ámbitos como a web, textos médicos, xurídicos ou científicos.

Liñas de investigación:

    • Modelos de recuperación de información
    • Eficiencia dos sistemas de recuperación de información
    • Sistemas de recomendación
    • Metodoloxías de avaliación de sistemas de información
    • Minaría de textos e recuperación de información para a detección temperá de trastornos psicolóxicos en internet

Sistemas de información: os sistemas de información facilitan a recompilación, almacenamento, procesamento e explotación de datos de calquera tipo. A investigación céntrase nos avances na enxeñaría do sóftware para automatizar a creación de sistemas de información, garantindo a súa calidade e a xestión de datos masivos, complexos e heteroxéneos.

Liñas de investigación:

    • Desenvolvemento de ferramentas para a produción automatizada de sistemas de información en web en xeral, e de sistemas de información xeográfica en particular.
    • Desenvolvemento de tecnoloxías para sistemas de información complexos, en particular bibliotecas dixitais, sistemas multimedia e sistemas de información xeográfica.
    • Desenvolvemento de sistemas para a xestión da mobilidade que permitan a representación de traxectorias de obxectos móbiles sobre mapas e a realización de consultas e análise de datos espazo-temporais de forma eficiente.

Análise de datos: trátase de técnicas para as análises de datos segundo a súa natureza, tipo e obxectivos. Inclúense diferentes abordaxes mediante técnicas estatísticas ou de intelixencia artificial aplicadas a unha gran cantidade de sectores diversos: industrial, finanzas, astrofísica, bioloxía, saúde etc.

Liñas de investigación:

    • Análise de datos dependentes, incluída a análise clúster de series temporais, a clasificación de series temporais, os métodos bootstrap suavizados para dependencia serial e a estimación suavizada de funcións cópula.
    • Análise de datos espaciais
    • Análise de datos funcionais
    • Análise de sistemas biolóxicos complexos
    • Análise de supervivencia
    • Explotación científica de datos satélite GAIA
    • Inferencia estatística en áreas pequenas
    • Optimización de imaxes mediante o emprego de técnicas deep learning
    • Regresión simbólica determinística
    • Machine learning con enxeñaría de características, usando teoría de perturbacións en bioinformática e quimioinformática.
    • Análise de sinais médicos
      Minaría de bases de datos astronómicas
    • Deseño de estruturas de datos comprimidas
    • Análise de datos de mobilidade

Simulación e optimización: a modelización consiste basicamente no estudo dos procesos e produtos para a súa representación en termos de modelos matemáticos ou estatísticos. A simulación numérica dos modelos comprende o estudo e selección de algoritmos numéricos para a súa resolución, así como a súa implementación no ordenador para o cálculo e a representación gráfica da solución buscada. Os algoritmos de optimización numérica permiten axustar os parámetros dos modelos a datos reais para predicir a evolución de procesos ou o funcionamento dos produtos.

Liñas de investigación:

    • Modelización e simulación de procesos produción industrial
    • Finanzas computacionais
    • Modelización e simulación numérica de redes xenéticas e de procesos en bioloxía computacional
    • Modelización e simulación numérica de fluxos no medio poroso, de procesos fluido-mecánicos e de ondas submarinas
    • Análise e simulación de problemas de convección-difusión, de interacción fluído-estrutura e de corpos flotantes
    • Algoritmos numéricos híbridos de optimización
    • Paralelización de algoritmos en multi CPU e GPU
    • Análise matemática de modelos de ecuacións diferenciais ordinarias, parciais e aleatorias
    • Programación matemática
    • Metaheurísticas
    • Xogos cooperativos e non cooperativo
    • Aplicacións: planificación, rutas, inventarios etc..