Una guía para el diseño de proteínas basada en IA
Curso, Youtube, 2025
Hice este curso gratuito de 10 clases para introducirte al diseño de proteínas.

Descripcion general
Quiero que más personas aprendan a diseñar proteínas usando Inteligencia Artificial (IA). Sin embargo, he encontrado dos problemas:
- no hay cursos integrales en línea sobre el tema
- los cursos relacionados con el tema suelen ser costosos para la mayoría de los estudiantes de Latinoamérica
Para atender estos problemas, hice este curso gratuito de 10 clases para introducirte al diseño de proteínas basado en IA. El curso tiene dos recursos principales:
- Las 10 clases en YouTube
- Un repositorio en GitHub con los siguientes recursos:
- Herramientas: librerías recomendadas y organizadas en +10 categorías, como procesamiento de secuencias y estructuras de proteínas, descarga de datos, machine learning, etc.
- Recursos de aprendizaje: cursos y blogs para aprender temas como Python, ciencia de datos, bioinformática, etc.
- Bases de datos: recursos recomendados para descargar datos de proteínas (i.e. secuencias, estructuras, embeddings, (meta)genomas).
- Tutoriales: tutoriales para aprender a procesar y analizar datos relacionados con la ciencia de proteínas.
- Artículos seleccionados: artículos científicos que recomiendo
Acceso a las diapositivas
Este curso se compone de +800 diapositivas, cada una con las fuentes de las imágenes y citas, así como recursos recomendados en la sección de notas. Las diapositivas fueron hechas en PowerPoint, por lo que recomiendo revisarlas en este software. Puedes descargar las diapositivas en las siguientes dos opciones:
| Tema | Diapositivas | YouTube |
|---|---|---|
| Conceptos básicos de computación | Drive, Zenodo | Video |
| Machine learning | Drive, Zenodo | Video |
| Deep learning | Drive, Zenodo | Video |
| Transformers y modelos de lenguaje | Drive, Zenodo | Video |
| Estructura de proteínas | Drive, Zenodo | Video |
| Función de proteínas | Drive, Zenodo | Video |
| Evolución de proteínas | Drive, Zenodo | Video |
| AlphaFold | Drive, Zenodo | Video |
| Diseño de proteínas basado en IA | Drive, Zenodo | Video |
| Datos y sesgos | Drive, Zenodo | Video |
Con esto pretendo que tengas acceso a más información para profundizar en los temas. Si eres docente y has adoptado este material para tus clases, por favor, házmelo saber. Me encantaría conocer cómo mejoraste el curso y saber que más personas han aprendido sobre ciencia de proteínas. Sin embargo, si identificas que alguien ha plagiado total o parcialmente este curso Y ADEMÁS cobra dinero por acceder a él, te agradecería que me lo notificaras.
Organización de clases

Las clases teóricas están organizadas de la 01 a la 10 para facilitar la comprensión de los temas. Por ejemplo, para hablar sobre AlphaFold es necesario conocer conceptos de biología estructural y deep learning. A continuación se describen brevemente las clases y sus temas:
- Conceptos básicos de computación: cómo funcionan la CPU y las GPU de las computadoras, así como el software básico para el análisis de datos (i.e. Linux/Bash y Python).
- Cómo empezar en la bioinformática
- Hardware
- Software
- Machine learning: qué es la IA y sus subcampos, cuál es la capacidad actual de los algoritmos y cómo se entrena un modelo.
- Estado actual de la IA
- Cómo aprende la IA
- Cómo entrenar un modelo
- Deep learning: cómo funcionan las redes neuronales, los distintos tipos de redes neuronales que existen y qué software se usa para trabajar con ellas.
- Redes neuronales
- Librerías de deep learning
- Transformers y modelos de lenguaje: cómo funcionan los Transformers y los modelos de lenguaje modernos, así como el software que se usa para trabajar con ellos.
- Modelos de lenguaje
- Transformers
- Desempeño y generalización
- Cómo trabajar con modelos de lenguaje
- Estructura de proteínas: principios de biología estructural, así como la organización de secuencias y estructuras de proteínas.
- Organización estructural
- Clasificaciones
- La forma del universo de proteínas
- Función de proteínas: cómo las proteínas adoptan su estructura, cómo ocurre la catálisis y la unión a ligandos, y cómo se regula la función.
- Plegamiento
- Función
- Regulación funcional
- Evolución de proteínas: cómo se cree que se generaron y diversificaron las proteínas a partir de péptidos más simples y cómo opera la evolución molecular.
- Niveles de organización biológica
- Evolución biológica
- El espacio de secuencia
- Epistasis
- AlphaFold: revisión de la arquitectura de AlphaFold2 y AlphaFold3, sus fortalezas y debilidades e impacto en la ciencia.
- AlphaFold
- AlphaFold2
- AlphaFold3
- Diseño de proteínas basado en IA: motivos para diseñar proteínas, cómo son las proteínas diseñadas y cómo se ha implementado la IA para modernizar los métodos clásicos y crear nuevos enfoques.
- Diseño de proteínas
- Diseño racional
- Diseño evolutivo
- Aprendizaje de representaciones
- IA generativa
- Datos y sesgos: bases de datos relevantes, cómo procesar datos para usarlos en el entrenamiento de modelos y ejemplos de los sesgos inherentes que contienen.
- Big data en ómicas
- Conjuntos de datos
- Procesamiento de datos
- Generalización en biología
- Sesgos en los datos
Como apoyar a este proyecto
Hacer este curso requirió mucho tiempo y trabajo. Si te fue útil y deseas apoyarme económicamente, puedes hacer una donación vía PayPal. Las donaciones pueden ser de cualquier monto o de 12, 30 o 45 dólares estadounidenses (sugerencias basadas en la economía de los estudiantes y el costo de este tipo de cursos). Haz clic en la siguiente imagen si quieres donar.
Si no cuentas con gran libertad económica, pero quieres expresar tu gratitud, puedes enviarme tus comentarios a mi correo:
- gamamiguelangel@gmail.com
Finalmente, te agradecería que compartieras este curso con tus colegas interesados en aprender sobre diseño de proteínas basado en IA.
Sobre mi
Soy Miguel Ángel Gonzalez Arias. Soy un biólogo mexicano y me gustan las proteínas, los microbios y la computación. Para más detalles sobre mi, redes sociales y otros medios de contacto, consulta la siguiente pagina:
