LabMedica

Deascargar La Aplicación Móvil
Noticias Recientes Expo COVID-19 Química Clínica Diagnóstico Molecular Hematología Inmunología Microbiología Patología Tecnología Industria Focus

Investigadores utilizan algoritmos de procesamiento de lenguaje natural (PLN) para predecir las mutaciones del virus SARS-CoV-2

Por el equipo editorial de LabMedica en español
Actualizado el 19 Jan 2021
Print article
Imagen: Los investigadores utilizan algoritmos de PLN para predecir las mutaciones del virus SARS-CoV-2 (Fotografía cortesía de Baidu)
Imagen: Los investigadores utilizan algoritmos de PLN para predecir las mutaciones del virus SARS-CoV-2 (Fotografía cortesía de Baidu)
Los algoritmos de procesamiento de lenguaje natural (PLN) ahora pueden generar secuencias de proteínas y predecir mutaciones de virus, incluidos cambios clave que ayudan al virus SARS-CoV-2 a evadir el sistema inmunológico.

La idea clave que hace que esto sea posible es que muchas propiedades de los sistemas biológicos se pueden interpretar en términos de palabras y oraciones. En los últimos años, un puñado de investigadores ha demostrado que las secuencias de proteínas y los códigos genéticos pueden modelarse utilizando técnicas de PLN. Ahora, los biólogos computacionales del Instituto Tecnológico de Massachusetts (MIT; Cambridge, MA, EUA) reunieron varias de estas cadenas y utilizan la PLN para predecir mutaciones que permiten que los virus eviten ser detectados por anticuerpos en el sistema inmunológico humano, un proceso conocido como escape inmunológico viral. La idea básica es que la interpretación de un virus por un sistema inmunológico es análoga a la interpretación de una oración por un humano.

El equipo utiliza dos conceptos lingüísticos diferentes: gramática y semántica (o significado). La aptitud genética o evolutiva de un virus, características tales como lo bueno que es para infectar a un huésped, se puede interpretar en términos de corrección gramatical. Un virus infeccioso exitoso es gramaticalmente correcto; uno que no tiene éxito no lo es. Del mismo modo, las mutaciones de un virus se pueden interpretar en términos de semántica. Las mutaciones que hacen que un virus parezca diferente a las cosas en su entorno, como cambios en las proteínas de su superficie que lo hacen invisible para ciertos anticuerpos, han alterado su significado. Los virus con diferentes mutaciones pueden tener diferentes significados, y un virus con un significado diferente puede necesitar diferentes anticuerpos para leerlo.

Para modelar estas propiedades, los investigadores utilizaron una LSTM, un tipo de red neuronal que es anterior a las basadas en transformadores utilizadas por modelos de lenguaje grandes como GPT-3. Estas redes más antiguas se pueden entrenar con muchos menos datos que los transformadores y aún funcionan bien para muchas aplicaciones. En lugar de millones de frases, entrenaron el modelo de PLN en miles de secuencias genéticas tomadas de tres virus diferentes: 45.000 secuencias únicas para una cepa de influenza, 60.000 para una cepa de VIH y entre 3.000 y 4.000 para una cepa del virus SARS-CoV-2.

Los modelos de PLN funcionan codificando palabras en un espacio matemático de tal manera que las palabras con significados similares están más juntas que las palabras con significados diferentes. Esto se conoce como incrustación. En el caso de los virus, la incrustación de las secuencias genéticas agrupaba los virus según la similitud de sus mutaciones. El objetivo general del método es identificar mutaciones que podrían permitir que un virus escape de un sistema inmunológico sin hacerlo menos infeccioso, es decir, mutaciones que cambian el significado de un virus sin hacerlo gramaticalmente incorrecto.

Para probar su método, el equipo utilizó una métrica común para evaluar las predicciones realizadas por modelos de aprendizaje automático que puntúan la exactitud en una escala entre 0,5 (nada mejor que la casualidad) y 1 (perfecto). En este caso, tomaron las principales mutaciones identificadas por la herramienta y, utilizando virus reales en un laboratorio, comprobaron cuántas de ellas eran mutaciones de escape reales. Sus resultados variaron de 0,69 para el VIH a 0,85 para una cepa de coronavirus. Esto es mejor que los resultados de otros modelos de última generación, según los investigadores.

El equipo ha procesado modelos con nuevas variantes del coronavirus, incluida la llamada mutación del Reino Unido, la mutación del visón de Dinamarca y variantes tomadas de Sudáfrica, Singapur y Malasia. El uso de PLN acelera un proceso lento. Anteriormente, el genoma del virus tomado de un paciente con COVID-19 en el hospital podía secuenciarse y sus mutaciones recreadas y estudiadas en un laboratorio. Sin embargo, eso se puede demorar semanas, mientras que el modelo PLN predice mutaciones potenciales de inmediato, lo que enfoca el trabajo de laboratorio y lo acelera.

“Hemos aprendido el lenguaje de la evolución”, dijo Bonnie Berger, bióloga computacional del Instituto Tecnológico de Massachusetts. “La biología tiene su propio lenguaje”.

Enlace relacionado:
Instituto Tecnológico de Massachusetts (MIT)

Miembro Platino
PRUEBA RÁPIDA COVID-19
OSOM COVID-19 Antigen Rapid Test
Magnetic Bead Separation Modules
MAG and HEATMAG
Complement 3 (C3) Test
GPP-100 C3 Kit
New
Miembro Oro
Liquid Ready-To-Use Lp(a) Reagent
Lipoprotein (a) Reagent

Print article

Canales

Química Clínica

ver canal
Imagen: El ionizador miniatura impreso en 3D es un componente clave de un espectrómetro de masas (foto cortesía del MIT)

Espectrómetro de masas impreso en 3D para el punto de atención supera a los modelos de última generación

La espectrometría de masas es una técnica precisa para identificar los componentes químicos de una muestra y tiene un potencial significativo para monitorear estados de salud de enfermedades... Más

Diagnóstico Molecular

ver canal
Imagen: un análisis de sangre podría predecir el riesgo de cáncer de pulmón con mayor precisión y reducir el número de escaneos requeridos (foto cortesía de 123RF)

Prueba de sangre predice con precisión el riesgo de cáncer de pulmón y reduce la necesidad de escaneos de TC

El cáncer de pulmón es extremadamente difícil de detectar tempranamente debido a las limitaciones de las tecnologías de detección actuales, que son costosas, a veces... Más

Hematología

ver canal
Imagen: El ensayo de Procleix Arboplex ha recibido la marca CE (foto cortesía de Grifols)

Primera prueba NAT 4 en 1 para el cribado de arbovirus podría reducir el riesgo de infecciones transmitidas por transfusiones

Los arbovirus representan una amenaza emergente para la salud mundial, exacerbada por el cambio climático y el aumento de la conectividad mundial que está facilitando su propagación a nuevas regiones.... Más

Inmunología

ver canal
Imagen: los exosomas pueden ser un biomarcador prometedor para el rechazo celular después del trasplante de órganos (foto cortesía de Nicolas Primola/Shutterstock)

Análisis de sangre para diagnóstico de rechazo celular después de trasplante de órganos podría reemplazar las biopsias quirúrgicas

Los órganos trasplantados enfrentan constantemente el riesgo de ser rechazados por el sistema inmunológico del receptor, que los diferencia de los órganos no propios mediante... Más

Microbiología

ver canal
Imagen: Las innovaciones del analizador DXI 9000 abordan las necesidades de velocidad, confiabilidad, reproducibilidad, calidad y expansión del menú (foto cortesía de Beckman Coulter)

Nuevos ensayos de hepatitis con marcado CE permite la detección temprana de infecciones

Según la Organización Mundial de la Salud (OMS), se estima que 354 millones de personas en todo el mundo padecen hepatitis B o C crónica. Estos virus son las principales causas de... Más

Patología

ver canal
Imagen: Comparación de imágenes de histopatología tradicionales versus los datos en bruto de PARS (foto cortesía de la Universidad de Waterloo)

Sistema de imágenes digitales impulsado por IA podría revolucionar el diagnóstico del cáncer

El proceso de biopsia es importante para confirmar la presencia de cáncer. En la técnica de histopatología convencional, el tejido se extirpa, se corta, se tiñe, se monta en... Más

Tecnología

ver canal
Imagen: el chip optofluídico de nanoporo utilizado en el nuevo sistema de diagnóstico (foto cortesía de UC Santa Cruz)

Nuevo sistema de diagnóstico de laboratorio en un chip iguala la precisión de las pruebas de PCR

Si bien las pruebas de PCR son el estándar de oro en cuanto a precisión para las pruebas de virología, tienen limitaciones como la complejidad, la necesidad de operadores de laboratorio capacitados y tiempos... Más