Boost Academy

Dirigido a profesionales con experiencia sólida en MongoDB que necesitan operar y escalar clústeres en entornos productivos de alta demanda, este curso aborda los desafíos propios de la ingeniería avanzada de bases de datos distribuidas: desde el diseño de arquitecturas sharded y la elección razonada de shard keys hasta la auditoría de seguridad frente al CIS Benchmark, pasando por la optimización profunda de consultas y pipelines de agregación mediante análisis de estadísticas de ejecución. El participante aprenderá a evaluar trade-offs de modelado de documentos con criterios cuantitativos, a anticipar y gestionar fallos en Replica Sets conforme a SLAs exigentes, a automatizar ciclos completos de backup y restauración, y a construir una estrategia de monitorización continua orientada a respuesta automatizada. Al finalizar, el participante será capaz de diseñar, operar y asegurar clústeres MongoDB productivos tomando decisiones técnicas justificadas con métricas reales.

Comprender los principios de sharding, los mecanismos de replicación y los patrones de modelado avanzado de documentos que determinan la escalabilidad y el rendimiento de un clúster MongoDB en producción.
Analizar el output de explain("executionStats") para identificar cuellos de botella en consultas y pipelines de agregación, rediseñando índices y etapas de pipeline para alcanzar los umbrales de rendimiento establecidos.
Arquitecturar un clúster con sharding seleccionando una shard key justificada mediante análisis de cardinalidad, distribución de escrituras y patrón de acceso del workload.
Evaluar críticamente los trade-offs de los patrones de modelado de documentos (embedding, referencing, bucket, outlier) y seleccionar la estrategia óptima para un caso de uso con requisitos de lectura/escritura definidos.
Anticipar escenarios de fallo en un Replica Set y diseñar procedimientos de respuesta y recuperación que garanticen el SLA, incluyendo configuración adecuada de Write Concern y tamaño de oplog.
Automatizar la ejecución, verificación de integridad y rotación de backups, validando el RTO mediante simulacro de restauración documentado.
Evaluar la configuración de seguridad de un clúster existente identificando vulnerabilidades en autenticación, RBAC, cifrado en reposo y en tránsito respecto al CIS Benchmark for MongoDB.
Arquitecturar una estrategia de monitorización continua definiendo métricas clave, umbrales de alerta y acciones de respuesta automatizadas para un clúster productivo.

Bloque 1 — Arquitectura distribuida: Sharding y selección de shard key. Se estudian los fundamentos del sharding en MongoDB: cómo se distribuyen los chunks entre shards, el papel de los config servers y los mongos routers, y los criterios de cardinalidad, distribución de escrituras y patrón de acceso que determinan la idoneidad de una shard key. A partir de un workload real, los participantes practican el análisis comparativo de candidatas y documentan la justificación de la shard key seleccionada.

Bloque 2 — Modelado avanzado de documentos. Se examinan en profundidad los patrones embedding, referencing, bucket y outlier, analizando sus implicaciones en latencia de lectura, amplificación de escritura y tamaño de documento. Mediante un caso de uso con requisitos de lectura/escritura cuantificados, los participantes evalúan cada patrón con métricas de rendimiento o proyecciones argumentadas y justifican la selección final.

Bloque 3 — Optimización de consultas y pipelines de agregación. Se trabaja con explain("executionStats") para diagnosticar consultas de alto impacto: interpretación del ratio docsExamined / docsReturned, identificación de COLLSCAN y stages bloqueantes, y rediseño de índices compuestos, parciales o TTL según el patrón de acceso. A continuación se aplica la misma metodología a pipelines de agregación de alta frecuencia: reordenación de etapas para aprovechar índices, uso de $match y $sort tempranos, y evaluación del uso de vistas materializadas o colecciones de resultados cacheados.

Bloque 4 — Alta disponibilidad y recuperación ante fallos en Replica Sets. Se analizan los escenarios críticos de fallo: pérdida del nodo primario y proceso de elección, retraso de replicación sostenido y riesgo de oplog overflow. Los participantes diseñan procedimientos de respuesta y recuperación para cada escenario, configuran Write Concern y Read Concern alineados al SLA, y dimensionan el oplog para absorber ventanas de mantenimiento planificadas.

Bloque 5 — Backup, restauración y continuidad operacional. Se diseña e implementa un ciclo automatizado de backup que incluye ejecución programada, verificación de integridad del snapshot o dump, rotación de copias y registro de eventos. El bloque culmina con un simulacro de restauración cronometrado que valida el RTO documentado y expone los puntos de mejora del procedimiento.

Bloque 6 — Seguridad y auditoría frente al CIS Benchmark. Se audita la configuración de seguridad de un clúster MongoDB existente revisando los mecanismos de autenticación (SCRAM, x.509), el modelo de autorización basado en roles (RBAC), el cifrado en reposo mediante WiredTiger Encrypted Storage Engine y el cifrado en tránsito mediante TLS. Los participantes identifican al menos tres vulnerabilidades o desviaciones respecto al CIS Benchmark for MongoDB y proponen las medidas correctoras priorizadas.

Bloque 7 — Monitorización continua y respuesta automatizada. Se diseña una estrategia de observabilidad para clústeres productivos definiendo las métricas clave: latencia de operaciones por tipo, cache hit ratio de WiredTiger, replication lag, número de conexiones activas y métricas de chunk balancing. Se establecen umbrales de alerta con criterios de severidad y se especifican las acciones de respuesta automatizadas asociadas a cada umbral, integrando las herramientas de monitorización habituales del ecosistema (MongoDB Atlas Monitoring, Ops Manager, Prometheus + Grafana).

MongoDB Community Edition o Enterprise 6.x / 7.x instalado localmente o acceso a un clúster Atlas de nivel M10 o superior para los ejercicios de sharding y monitorización.
Docker o una herramienta de virtualización equivalente para levantar topologías de Replica Set y clústeres sharded de práctica con tres o más nodos.
mongosh (MongoDB Shell) en su versión estable más reciente.
Acceso a las herramientas mongodump, mongorestore y mongostat incluidas en MongoDB Database Tools.
Entorno de scripting: Python 3.10+ o Bash para los ejercicios de automatización de backup.
Opcional pero recomendado: stack Prometheus + Grafana o acceso a MongoDB Atlas Charts para el bloque de monitorización.
Conexión a internet estable para acceder a la documentación oficial de MongoDB y al CIS Benchmark for MongoDB (descarga gratuita previa registro).

Para aprovechar este curso es imprescindible haber completado MMDB02 o disponer de un nivel equivalente que incluya: manejo fluido del aggregation framework, creación y gestión de índices simples y compuestos, comprensión del modelo de replicación básico en MongoDB, administración de usuarios y roles a nivel operacional, y experiencia práctica con mongodump / mongorestore o herramientas equivalentes. Los participantes deben sentirse cómodos leyendo el output de explain() en su forma básica y trabajando con la shell de MongoDB o un cliente equivalente.

MongoDB — Avanzado

Necesitas un plan activo

Descripción

Objetivos

Temario

Requisitos técnicos

Conocimientos previos

Detalles de la convocatoria