
El Sumario – Evo 2 es el modelo de inteligencia artificial (IA) más grande y de código abierto en biología, un sistema que abarca la diversidad genética del árbol de la vida y que puede ser útil para predecir mutaciones que causan enfermedades o para diseñar secuencias de ADN.
El nuevo sistema de IA generativa, que puede leer y escribir código genético, ha sido entrenado con el ADN de más de 100.000 especies de todo tipo.
Desarrollado por científicos del Instituto Arc y la empresa NVIDIA, junto a colaboradores de diversas universidades, se trata de una versión mejorada de Evo, que fue presentada en 2024.
El nuevo modelo se hizo público hace un año en un repositorio y ahora se publica formalmente en la revista científica Nature.
La información genética esencial para la vida se escribe con un vocabulario de solo cuatro nucleótidos y Evo 2 es capaz de leer y escribir con fluidez en ese ‘lenguaje’.
El desarrollo de este sistema representa un momento clave en el campo emergente de la biología generativa, según indicó Patrick Hsu, cofundador del Instituto Arc.
Detalles de Evo 2
Evo 2 tiene una comprensión generalista que resulta útil para multitud de tareas, desde predecir mutaciones causantes de enfermedades hasta diseñar código potencial para la vida artificial.
Evo puede identificar con precisión mutaciones en genes humanos y es capaz de diseñar nuevos genomas tan largos como los que tienen las bacterias simples.
Ante los posibles riesgos éticos, los científicos excluyeron de su base de datos los patógenos que infectan a los seres humanos y otros organismos complejos.
En el año transcurrido desde su publicación preliminar, el modelo se ha aplicado a problemas como la predicción del riesgo de enfermedades genéticas en pacientes con alzhéimer.
El modelo ya muestra suficiente versatilidad para identificar cambios genéticos que afectan a la función de las proteínas y a la aptitud física de los organismos.
En pruebas con variantes del gen BRCA1 asociado al cáncer de mama, alcanzó una precisión superior al 90 % en la predicción de mutaciones patógenas.
Funciones del sistema de IA
Además, Evo 2 se ha usado para diseñar bacteriófagos sintéticos funcionales, lo que demuestra sus posibles aplicaciones para el tratamiento de bacterias resistentes.
El equipo considera que el sistema podría ser útil para diseñar elementos genéticos que se activen solo en células específicas, como neuronas o células del hígado.
Esta nueva versión es el modelo de IA más grande en biología hasta la fecha, entrenado con más de 9,3 billones de nucleótidos de más de 128.000 genomas completos.
Además de genomas bacterianos, incluye información de seres humanos, plantas y otras especies del dominio eucariota de la vida.
Para lograr esa complicada tarea, el equipo tuvo que replantearse cómo un modelo de IA podía asimilar datos de esta magnitud.
La arquitectura resultante, denominada StripedHyena 2, permitió entrenar a Evo 2 con 30 veces más datos que su antecesor.
De interés: Las interacciones entre sapiens y neandertales esculpieron el ADN
Con información de EFE Servicios y redes sociales
¡Sigue nuestras noticias en Google! Para obtener información actual, interesante y precisa. Haz clic aquí y conoce todos los contenidos de El Sumario. Encuéntranos también en X/Twitter e Instagram





