Científicos están usando la IA para soñar con nuevas proteínas revolucionarias – Science Streets.
Nature 609, 661-662 (2022). doi: https://doi.org/10.1038/d41586-022-02947-7
Recopilado por Carlos Cabrera Lozada. Miembro Correspondiente Nacional, ANM puesto 16 . ORCID: 0000-0002-3133-5183. 21/09/2022
En junio, los reguladores surcoreanos autorizaron que el primer medicamento, una vacuna contra el COVID, se hiciera a partir de una nueva proteína diseñada por humanos. La vacuna se basa en una proteína esférica «nanopartícula» que fue creada por investigadores hace casi una década, a través de un proceso de prueba y error que requiere mucha mano de obra.1.
Ahora, gracias a los gigantescos avances en inteligencia artificial (IA), un equipo dirigido por David Baker, bioquímico de la Universidad de Washington (UW) en Seattle, informa en Science2,3 que puede diseñar tales moléculas en segundos en lugar de meses.‘Todo el universo de proteínas’: la IA predice la forma de casi todas las proteínas conocidas
Tales esfuerzos son parte de un cambio científico en el mar, ya que las herramientas de IA como el software de predicción de estructura de proteínas AlphaFold de DeepMind son adoptadas por los científicos de la vida. En julio, DeepMind reveló que la última versión de AlphaFold había predicho estructuras para cada proteína conocida por la ciencia. Y en los últimos meses se ha visto un crecimiento explosivo en las herramientas de IA, algunas basadas en AlphaFold, que pueden soñar rápidamente con proteínas completamente nuevas. Anteriormente, esta había sido una búsqueda minuciosa con altas tasas de fracaso.
«Desde AlphaFold, ha habido un cambio en la forma en que trabajamos con el diseño de proteínas», dice Noelia Ferruz, bióloga computacional de la Universidad de Girona, España. «Estamos presenciando tiempos muy emocionantes».
La mayoría de los esfuerzos se centran en herramientas que pueden ayudar a producir proteínas originales, con formas diferentes a cualquier cosa en la naturaleza, sin centrarse mucho en lo que estas moléculas pueden hacer. Pero a los investigadores, y a un número creciente de empresas que están aplicando la IA al diseño de proteínas, les gustaría diseñar proteínas que puedan hacer cosas útiles, desde limpiar desechos tóxicos hasta tratar enfermedades. Entre las empresas que están trabajando hacia este objetivo se encuentran DeepMind en Londres y Meta (anteriormente Facebook) en Menlo Park, California.
«Los métodos ya son realmente poderosos. Se van a volver más poderosos», dice Baker. «La pregunta es qué problemas vas a resolver con ellos».
Desde cero
El laboratorio de Baker ha pasado las últimas tres décadas fabricando nuevas proteínas. El software llamado Rosetta, que su laboratorio comenzó a desarrollar en la década de 1990, divide el proceso en pasos. Inicialmente, los investigadores concibieron una forma para una nueva proteína, a menudo improvisando trozos de otras proteínas, y el software dedujo una secuencia de aminoácidos que correspondía a esta forma.
Pero estas proteínas de «primer borrador» rara vez se plegaban en la forma deseada cuando se fabricaban en el laboratorio, y en su lugar terminaban atrapadas en diferentes confirmaciones. Por lo tanto, se necesitaba otro paso para ajustar la secuencia de proteínas de tal manera que se plegara solo en una sola estructura deseada. Este paso, que implicaba simular todas las formas en que las diferentes secuencias podrían plegarse, fue computacionalmente costoso, dice Sergey Ovchinnikov, biólogo evolutivo de la Universidad de Harvard en Cambridge, Massachusetts, que solía trabajar en el laboratorio de Baker. «Literalmente tendrías, como, 10,000 computadoras funcionando durante semanas haciendo esto».Lo que sigue para AlphaFold y la revolución del plegamiento de proteínas de IA
Al ajustar AlphaFold y otros programas de IA, ese paso que consume mucho tiempo se ha vuelto instantáneo, dice Ovchinnikov. En un enfoque desarrollado por el equipo de Baker, llamado alucinación, los investigadores alimentan secuencias aleatorias de aminoácidos en una red de predicción de estructura; esto altera la estructura para que se vuelva cada vez más parecida a una proteína, según lo juzgado por las predicciones de la red. En un artículo de 2021, el equipo de Baker creó más de 100 proteínas pequeñas y «alucinadas» en el laboratorio y encontró signos de que aproximadamente una quinta parte se parecía a la forma predicha.4
AlphaFold, y una herramienta similar desarrollada por el laboratorio de Baker llamada RoseTTAFold, fueron entrenados para predecir la estructura de las cadenas de proteínas individuales. Pero los investigadores pronto descubrieron que tales redes también podrían modelar ensamblajes de múltiples proteínas que interactúan. Sobre esta base, Baker y su equipo confiaban en que podrían alucinar proteínas que se autoensamblarían en nanopartículas de diferentes formas y tamaños; estos estarían formados por numerosas copias de una sola proteína y serían similares a aquellos en los que se basa la vacuna contra el COVID-19.
Pero cuando instruyeron a los microorganismos para que hicieran sus creaciones en los laboratorios, ninguno de los 150 diseños funcionó. «No se doblaron en absoluto: solo estaban hundidos en el fondo del tubo de ensayo», dice Baker.
Casi al mismo tiempo, otro investigador en el laboratorio, el científico de aprendizaje automático Justas Dauparas, estaba desarrollando una herramienta de aprendizaje profundo para abordar lo que se conoce como el problema del plegamiento inverso: determinar una secuencia de proteínas que corresponde a la forma general de una proteína dada.3. La red, llamada ProteinMPNN, puede actuar como un «corrector ortográfico» para las proteínas de diseño creadas utilizando AlphaFold y otras herramientas, dice Ovchinnikov, ajustando las secuencias mientras se mantiene la forma general de las moléculas.
Cuando Baker y su equipo aplicaron esta segunda red a sus nanopartículas de proteínas alucinadas, tuvo un éxito mucho mayor haciendo las moléculas experimentalmente. Los investigadores determinaron la estructura de 30 de sus nuevas proteínas utilizando microscopía crioelectrónica y otras técnicas experimentales, y 27 de ellas coincidieron con los diseños liderados por IA.2. Las creaciones del equipo incluían anillos gigantes con simetrías complejas, a diferencia de todo lo que se encuentra en la naturaleza. En teoría, el enfoque podría usarse para diseñar nanopartículas correspondientes a casi cualquier forma simétrica, dice Lukas Milles, un biofísico que codirigió el esfuerzo. «Es electrizante ver lo que estas redes pueden hacer».
Revolución del aprendizaje profundo
Las herramientas de aprendizaje profundo como proteinMPNN han cambiado las reglas del juego en el diseño de proteínas, dice Arne Elofsson, biólogo computacional de la Universidad de Estocolmo. «Dibujas tu proteína, presionas un botón y obtienes algo que una de cada diez veces funciona». Se pueden lograr tasas de éxito aún más altas combinando múltiples redes neuronales para abordar diferentes partes del proceso de diseño, como lo hizo el equipo de Baker en el diseño de las nanopartículas. «Ahora tenemos control total sobre la forma de la proteína», dice Ovchinnikov.
Baker’s no es el único laboratorio que aplica IA al diseño de proteínas. En un artículo de revisión publicado en bioRxiv este mes, Ferruz y sus colegas contaron más de 40 herramientas de diseño de proteínas de IA que se han desarrollado en los últimos años, utilizando varios enfoques.5 (ver ‘Cómo diseñar una proteína’).
Muchas de estas herramientas, incluida proteinMPNN, abordan el problema del plegamiento inverso: especifican una secuencia que corresponde a una estructura particular, a menudo utilizando enfoques tomados de herramientas de reconocimiento de imágenes. Algunos otros se basan en una arquitectura similar a la de las redes neuronales del lenguaje como GPT-3, que produce texto similar al humano; pero, en cambio, las herramientas son capaces de producir nuevas secuencias de proteínas. «Estas redes son capaces de ‘hablar’ de proteínas», dice Ferruz, quien ha co-desarrollado una de esas redes.6.
Con tantas herramientas de diseño de proteínas disponibles, no siempre está claro cuál es la mejor manera de compararlas, dice Chloe Hsu, investigadora de aprendizaje automático en la Universidad de California, Berkeley, quien desarrolló una red de plegado inverso con investigadores de Meta7.
Muchos equipos miden la capacidad de su red para determinar con precisión la secuencia de una proteína existente a partir de su estructura. Pero esto no se aplica a todos los métodos, y no está claro cómo esta métrica, conocida como tasa de recuperación, se aplica al diseño de nuevas proteínas, dicen los científicos. A Ferruz le gustaría ver un concurso de diseño de proteínas, análogo al experimento bienal de Evaluación Crítica de la Predicción de la Estructura de proteínas (CASP), en el que AlphaFold demostró por primera vez su superioridad sobre otras redes. «Es un sueño. Algo como CASP realmente haría avanzar el campo», dice.
Al laboratorio húmedo
Baker y sus colegas insisten en que hacer una nueva proteína en el laboratorio es la prueba definitiva de sus métodos. Su fracaso inicial para hacer ensamblajes de proteínas alucinadas muestra esto. «AlphaFold pensó que eran proteínas fantásticas, pero claramente no funcionaron en el laboratorio húmedo», dice Basile Wicky, un biofísico en el laboratorio de Baker que codirigió el esfuerzo, junto con Baker, Milles y el bioquímico de la UW Alexis Courbet.
Pero no todos los científicos que desarrollan herramientas de IA para el diseño de proteínas tienen fácil acceso a configuraciones experimentales, señala Jinbo Xu, biólogo computacional del Instituto Tecnológico Toyota en Chicago en Illinois. Encontrar un laboratorio con el que colaborar puede llevar tiempo, por lo que Xu está estableciendo su propio laboratorio húmedo para poner a prueba las creaciones de su equipo.
Los experimentos también serán esenciales cuando se trata de diseñar proteínas con tareas específicas en mente, dice Baker. En julio, su equipo describió un par de métodos de IA que permiten a los investigadores incrustar una secuencia o estructura específica en una nueva proteína.8. Utilizaron estos enfoques para diseñar enzimas que catalizan reacciones particulares; proteínas capaces de unirse a otras moléculas; y una proteína que podría usarse en una vacuna contra un virus respiratorio que es una de las principales causas de hospitalizaciones infantiles.
El año pasado, DeepMind lanzó una empresa derivada llamada Isomorphic Labs en Londres que tiene la intención de aplicar herramientas de IA como AlphaFold al descubrimiento de fármacos. El director ejecutivo de DeepMind, Demis Hassabis, dice que ve el diseño de proteínas como una aplicación obvia y prometedora para la tecnología de aprendizaje profundo, y para AlphaFold en particular. «Estamos trabajando bastante en el espacio de diseño de proteínas. Es bastante temprano».