Algoritmo identifica estructuras específicas del cáncer en datos de secuenciación de ADN de lectura larga
Actualizado el 03 Jun 2025
Las tecnologías de secuenciación de lectura larga están diseñadas para analizar segmentos largos y continuos de ADN, lo que ofrece un gran potencial para mejorar la capacidad de los investigadores para detectar cambios genéticos complejos en los genomas del cáncer. Sin embargo, debido a la intrincada estructura de los genomas del cáncer, las herramientas de análisis estándar, incluidas las desarrolladas específicamente para datos de secuenciación de lectura larga, suelen ser insuficientes. Esto puede generar falsos positivos e interpretaciones de datos poco fiables, lo que, en última instancia, dificulta nuestra comprensión de la evolución de los tumores, su respuesta a los tratamientos y su impacto en el diagnóstico y el manejo de los pacientes. Para superar este problema, los investigadores han desarrollado un algoritmo de aprendizaje automático capaz de identificar variaciones estructurales específicas del cáncer y cambios en el número de copias en datos de secuenciación de ADN de lectura larga.
El algoritmo, llamado SAVANA, fue desarrollado por investigadores del Instituto Europeo de Bioinformática (EMBL-EBI, Barcelona, España) y el laboratorio de I+D de Genomics England (Londres, Reino Unido), en colaboración con socios clínicos. SAVANA utiliza técnicas de aprendizaje automático para identificar con precisión variantes estructurales, como inserciones, deleciones, duplicaciones y reordenamientos, junto con los cambios resultantes en el número de copias en genomas de cáncer utilizando datos de secuenciación de lectura larga. Debido a que los genomas de cáncer son complejos, las herramientas de análisis tradicionales a menudo generan falsos positivos, lo que lleva a interpretaciones clínicas inexactas de la biología tumoral. SAVANA reduce significativamente estos errores. El algoritmo, descrito en Nature Methods, se probó en 99 muestras de tumores humanos, y su rápido procesamiento y fuertes capacidades de corrección de errores lo hacen ideal para aplicaciones clínicas. Recientemente, el método se aplicó para estudiar el osteosarcoma, un cáncer de hueso raro y agresivo, donde ayudó a descubrir nuevos reordenamientos genómicos, arrojando luz sobre los mecanismos detrás de la progresión del osteosarcoma.

El equipo también comparó los resultados de SAVANA a partir de datos de lectura larga con los datos generados mediante la secuenciación de Illumina, aplicando el proceso estándar de secuenciación del genoma completo utilizado en entornos clínicos. Los resultados fueron muy consistentes entre ambas tecnologías, lo que demuestra que SAVANA cumple con los estándares clínicos actuales, a la vez que revela alteraciones adicionales relacionadas con el cáncer. SAVANA proporciona un análisis genómico rápido y fiable, lo que mejora la interpretación de muestras clínicas y las estrategias de diagnóstico y tratamiento del cáncer. Esta iniciativa representa el primer esfuerzo global para incorporar la secuenciación del genoma completo en la atención clínica habitual. Al integrar la genómica en la práctica clínica diaria, el objetivo es mejorar la precisión diagnóstica y respaldar planes de tratamiento personalizados para pacientes con cáncer. Sin embargo, para aprovechar al máximo los beneficios de la genómica clínica, es esencial una interpretación precisa de los datos genómicos, lo que depende del uso de herramientas analíticas especializadas. Como parte de sus esfuerzos por explorar el potencial clínico de la tecnología de secuenciación de lectura larga para un diagnóstico del cáncer más rápido y precoz, Genomics England ha incorporado SAVANA a su investigación.
“El uso de SAVANA garantizará que los médicos reciban datos genómicos precisos y confiables, lo que les permitirá integrar con confianza métodos avanzados de secuenciación genómica, como la secuenciación de lectura larga, en la atención rutinaria del paciente”, afirmó Greg Elgar, director de I+D de secuenciación en Genomics England.
Enlaces relacionados:
EMBL-EBI
Genomics England