Post 37: Como aprendió AlphaFold2 a modelar las proteínas? 🤔

1 minute read

Published:

 

En el vídeo se modela una hidrolasa de una bacteria (PDB: 7DQ9). Al inicio AF2 ubica a todos los átomos en un mismo espacio. Posteriormente va extendiendo los átomos en 1 dimensión, 2 dimensiones hasta adoptar un volumen. AF2 primero aprendió a modelar regiones hélice, luego betas plegadas y al final las otras variaciones de estructuras 2°. Una vez establecida la estructura local, la estructura global se refina al checar que no haya choques entre las cadenas laterales de los aminoácidos, lo cual es bastante difícil al considerar la geometría de todos los átomos del vecindario.

Para llegar a esta conclusión un equipo reprodujo por completo el entrenamiento de AF2 usando prácticamente el mismo algoritmo, y a su modelo lo llamaron OpenFold. Su entrenamiento duró 90,000 iteraciones, sin embargo, observaron que solo son necesarias 2,700 iteraciones (equivalentes al ~3%) para lograr un 90% del desempeño final de AF2. Lo anterior sugiere que podemos llegar a una solución decente para otros problemas de bioquímica con inteligencia artificial sin tener que usar cantidades masivas de datos como AF2 lo hizo.

Refs:

  1. OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization
  2. Y un seminario de OpenFold