CITIC

Algoritmos e técnicas para comprimir datos xenómicos, a debate no Almorzo TIC Talk de maio

26/05/2026 - CITIC

O Almorzo TIC Talk, celebrado o pasado martes 26 de maio, contou coa participación de Rodrigo Blanco Amoedo, que ofreceu a conferencia titulada “Comprimindo o xenoma: algoritmos, técnicas e arquivos biolóxicos”, centrada nos métodos actuais para o almacenamento e compresión eficiente de datos xenómicos.

Durante a sesión, o relator introduciu a estrutura dos ficheiros FASTQ, o formato máis empregado para gardar fragmentos do xenoma dun organismo. Aínda que non existe un estándar unificado, estes arquivos son unha solución de referencia no campo da bioloxía computacional, debido ao volume de datos que xeran as tecnoloxías de secuenciación masiva e á necesidade de manexar esta información coa maior eficiencia posible.

Blanco Amoedo presentou a evolución das ferramentas de compresión ao longo do tempo, explicando desde as solucións xenéricas, como GZip ou WinRAR, altamente valoradas pola súa facilidade de uso, ata algoritmos especializados desenvolvidos especificamente para datos xenómicos.

Entre estes últimos destacan ferramentas como FaStore, Spring e FQSqueezer, que aproveitan a alta repetitividade característica dos datos presentes neste tipo de ficheiros, acadando unha maior taxa de compresión. Blanco Amoedo tamén mencionou outro tipo de solucións punteiras, como GeneSqueeze, e outras alternativas comerciais.

Presentou as vantaxes e inconvenientes de cada unha destas solucións. Como conclusión, realizou un balance do estado actual das tecnoloxías de compresión xenómica e apuntou cara unha posible liña de traballo, unha aproximación ao problema mediante estruturas de datos compactas.