Post 49: Descarga milles de proteĆnas de la AlphaFold Database š
Published:
Ā
Hoy es viernes, viernes de proteĆnas! Y si quieren descargar de forma (relativamente) masiva modelos de AlphaFold2 dado una lista de IDs de la Uniprot, aquĆ un tutorial que escribĆ en google Colab:
Pero si tienen >2TB de almacenamiento (deseable unos 10TB), mejor descargar las bases de datos ya comprimidas y luego seleccionar los modelos que interesan. Con foldcomp puedes comprimir tus proteinas para ahorrar espacio, tal como un .rar/.zip. Y de hecho los autores ya disponen de bases de datos previamente comprimidas
El codigo optimizado con numpy toma unas ~28 horas para descargar 100,000 estructuras de proteĆnas de unos 350 aminoĆ”cidos cada una.