Skills que aprenderás
Convocatorias
No hay convocatorias abiertas ahora mismo, pero no te pierdas la oportunidad: guarda este curso y te avisamos en cuanto se abra una convocatoria.
Recursos
No hay recursos disponibles todavía para esta convocatoria
Dirigido a profesionales que ya dominan los fundamentos de Apache Airflow y necesitan llevar sus pipelines a un nivel de producción real, este curso profundiza en los patrones de diseño y las decisiones de ingeniería que marcan la diferencia entre un DAG funcional y uno mantenible, resiliente y seguro. A lo largo de 8 horas, los participantes explorarán la lógica condicional de ejecución, la integración con sistemas externos mediante Connections, el diseño de tareas idempotentes y el uso de XComs para propagar metadatos entre tareas; aprenderán a comparar y elegir entre estilos de autoría (PythonOperator frente a TaskFlow API), a estructurar DAGs complejos con TaskGroups y a controlar el paralelismo y la frecuencia de ejecución de forma coherente con el entorno. Al finalizar, el participante será capaz de diseñar, adaptar y depurar pipelines de datos listos para entornos colaborativos y de producción, tomando decisiones técnicas justificadas en cada etapa.
BranchPythonOperator y trigger_rule para satisfacer requisitos de negocio con múltiples caminos alternativos.Bloque 1 — Estilos de autoría y fundamentos avanzados de DAG
Se revisan en profundidad las dos formas principales de definir pipelines en Airflow: el enfoque clásico basado en PythonOperator y el estilo declarativo de la TaskFlow API con el decorador @task. Los participantes analizan cómo cada aproximación gestiona el paso de datos entre tareas, qué implicaciones tiene en la legibilidad del código y cuándo la elección de uno u otro afecta al mantenimiento a largo plazo de los DAGs.
Bloque 2 — Lógica condicional y control de ejecución
Se trabaja el diseño de flujos de trabajo con múltiples rutas posibles mediante BranchPythonOperator, estudiando cómo la configuración del parámetro trigger_rule en las tareas descendentes determina el comportamiento real del pipeline ante cada bifurcación. A continuación se abordan los parámetros de programación y concurrencia: schedule_interval, max_active_runs y concurrency, con los que se adaptan DAGs existentes para cumplir nuevos requisitos de frecuencia y paralelismo de forma coherente con el entorno de ejecución.
Bloque 3 — Idempotencia, integración con sistemas externos y XComs Este bloque aborda tres principios que sostienen los pipelines de producción. En primer lugar, el diseño de tareas idempotentes en pipelines de ingesta, documentando en el propio código las decisiones que garantizan la reejecutabilidad segura. En segundo lugar, la integración de operadores de terceros —HTTP, SQL y cloud— con sistemas reales a través de las Connections de Airflow, evitando el hardcoding de credenciales. Finalmente, se estudia el mecanismo de XComs para propagar metadatos entre tres o más tareas encadenadas, incluyendo cuándo delegar el almacenamiento a un sistema externo por volumen de datos.
Bloque 4 — Depuración y organización de DAGs complejos
El bloque final integra las habilidades adquiridas en un flujo de trabajo de diagnóstico y refactorización. Los participantes practican la identificación de la causa raíz de fallos reales consultando los logs de Airflow, los estados de tarea en la interfaz gráfica y los mensajes de excepción. Sobre DAGs de más de ocho tareas, se aplica la estructura de TaskGroups con nombres semánticos, transformando versiones planas en pipelines legibles y mantenibles.
docker-compose.yml de referencia).pip disponible en el entorno de trabajo.