Post 49: Descarga milles de proteĆ­nas de la AlphaFold Database šŸ“

less than 1 minute read

Published:

Ā 

Hoy es viernes, viernes de proteĆ­nas! Y si quieren descargar de forma (relativamente) masiva modelos de AlphaFold2 dado una lista de IDs de la Uniprot, aquĆ­ un tutorial que escribĆ­ en google Colab:

Pero si tienen >2TB de almacenamiento (deseable unos 10TB), mejor descargar las bases de datos ya comprimidas y luego seleccionar los modelos que interesan. Con foldcomp puedes comprimir tus proteinas para ahorrar espacio, tal como un .rar/.zip. Y de hecho los autores ya disponen de bases de datos previamente comprimidas

El codigo optimizado con numpy toma unas ~28 horas para descargar 100,000 estructuras de proteƭnas de unos 350 aminoƔcidos cada una.

img