Skills que aprenderás
Convocatorias
No hay convocatorias abiertas ahora mismo, pero no te pierdas la oportunidad: guarda este curso y te avisamos en cuanto se abra una convocatoria.
Recursos
No hay recursos disponibles todavía para esta convocatoria
Dirigido a ingenieros de calidad, SREs y profesionales DevOps con experiencia previa en Datadog que necesitan llevar su práctica de observabilidad al siguiente nivel en entornos de microservicios complejos. A lo largo de las 8 horas del curso, el participante profundizará en la arquitectura de estrategias de observabilidad full-stack —integrando métricas, logs, trazas APM y RUM—, aprenderá a gobernar el coste de la ingesta de datos mediante pipelines de procesamiento y políticas de retención, y automatizará la gestión de toda la configuración de Datadog a través de Terraform y la API, incorporándola en flujos CI/CD. El resultado es un profesional capaz de diseñar e implementar un sistema de observabilidad sostenible, auditado y orientado a negocio, con SLOs y error budgets accionables, alertas de alta señal y detección proactiva de degradaciones en producción.
Bloque 1 — Observabilidad full-stack en microservicios El curso arranca estableciendo el marco conceptual de la observabilidad avanzada: cómo métricas, logs, trazas distribuidas y Real User Monitoring se complementan para ofrecer una visión cohesionada de un sistema compuesto por múltiples servicios interdependientes. Se estudian los patrones de correlación entre señales y los criterios que guían la decisión entre métricas custom, métricas de integración y logs estructurados en función del caso de uso y el coste asociado.
Bloque 2 — Gestión del coste de ingesta de logs Se aborda la optimización económica y operativa de la capa de logs: diseño de pipelines de procesamiento, configuración de filtros de exclusión y definición de políticas de retención diferenciada según la criticidad de cada fuente. El participante trabaja con escenarios reales para reducir el volumen ingestado manteniendo la cobertura necesaria para auditoría y troubleshooting.
Bloque 3 — SLOs, error budgets y alertas de alta señal Este bloque profundiza en la fiabilidad orientada a negocio: definición de SLOs vinculados a acuerdos de servicio reales, cálculo y seguimiento de error budgets, e implementación de burn rate alerts con ventanas deslizantes cortas y largas. Sobre esa base, se analiza una arquitectura de alertas existente aplicando métricas de signal-to-noise para detectar falsos positivos, alertas huérfanas y huecos de cobertura, y se establece un proceso de mejora continua.
Bloque 4 — Automatización: IaC, CI/CD y detección de regresiones El bloque final consolida la visión de Datadog como código: provisión automatizada de dashboards y monitores mediante Terraform y la API REST, integración de esa configuración en un flujo CI/CD versionado y reproducible, y uso de la misma API para consultar métricas APM después de cada despliegue y convertir la detección de regresiones de rendimiento en un gate de calidad del pipeline. Se cierra con la construcción de monitores de anomalías y forecasting sobre métricas de infraestructura para anticipar degradaciones de forma proactiva.
DataDog/datadog disponible.