Boost Academy

Este curso está dirigido a profesionales de datos, analistas y desarrolladores que se incorporan por primera vez al mundo del Data Warehouse y necesitan construir una base conceptual y práctica sólida antes de abordar proyectos de inteligencia de negocio. A lo largo de las 8 horas, el participante comprenderá qué diferencia un entorno analítico de uno transaccional, conocerá los componentes que forman una arquitectura de Data Warehouse y el flujo que sigue un proceso ETL, aprenderá a distinguir tablas de hechos y dimensiones dentro de modelos estrella y copo de nieve, y ejecutará sus primeras consultas de exploración sobre un almacén real guiado. Al finalizar, el participante será capaz de orientarse con autonomía en la arquitectura de un Data Warehouse, interpretar sus modelos de datos y detectar problemas básicos de granularidad, sentando las bases para iterar hacia niveles más avanzados.

Describir las diferencias fundamentales entre sistemas OLTP y OLAP, reconociendo el rol de cada uno en el ciclo de vida del dato dentro de una organización.
Identificar y nombrar los componentes principales de una arquitectura de Data Warehouse —fuentes, capa de staging, almacén central y data marts— y explicar la función que cumple cada uno.
Describir el propósito de un data mart y diferenciarlo del almacén central en un contexto de negocio concreto.
Describir el flujo general de un proceso ETL, detallando qué ocurre en cada fase y por qué es necesaria la transformación antes de la carga.
Identificar tablas de hechos y tablas de dimensiones en un esquema estrella, aplicando criterios claros para distinguirlas y justificar la elección entre esquema estrella y esquema copo de nieve ante un modelo de datos dado.
Ejecutar consultas básicas de exploración sobre un Data Warehouse de ejemplo, combinando hechos y dimensiones mediante JOIN, filtros y agregaciones simples.
Identificar y explicar errores de granularidad —duplicados o agregaciones incorrectas— en consultas sobre tablas de hechos, relacionando la causa con la estructura del modelo.

Bloque 1 — Fundamentos conceptuales: OLTP, OLAP y arquitectura de Data Warehouse

El bloque de apertura establece el marco teórico imprescindible. Se analiza en qué se diferencia un sistema transaccional (OLTP) de un sistema analítico (OLAP), haciendo énfasis en sus características de diseño, volumen de escritura y lectura, y casos de uso típicos en la empresa. A continuación se presenta la arquitectura canónica de un Data Warehouse: se recorren las fuentes de datos heterogéneas, la capa de staging donde los datos se preparan antes de ser integrados, el almacén central como repositorio unificado y los data marts como subconjuntos orientados a un área de negocio. El bloque concluye diferenciando con claridad el papel del almacén central frente al data mart y describiendo cuándo y por qué una organización opta por desplegar ambas capas.

Bloque 2 — El proceso ETL: extracción, transformación y carga

Este bloque recorre de forma detallada el flujo que transforma datos en bruto en información lista para el análisis. Se estudia la fase de extracción desde fuentes relacionales, archivos planos y APIs; la fase de transformación, donde se aplican limpiezas, estandarizaciones, enriquecimientos y reglas de negocio sobre ejemplos de datos reales facilitados; y la fase de carga hacia el almacén, abordando estrategias de carga completa e incremental. El objetivo es que el participante comprenda por qué cada etapa existe y cuáles son los riesgos que se materializan si se omite o se ejecuta incorrectamente.

Bloque 3 — Modelado dimensional: esquema estrella, copo de nieve y granularidad

Entrando en el corazón del modelado analítico, el bloque introduce el concepto de tabla de hechos y tabla de dimensiones, sus atributos característicos y las claves que las relacionan. Se trabaja sobre esquemas predefinidos para practicar la identificación y etiquetado de cada componente. Se comparan el esquema estrella y el esquema copo de nieve, evaluando las implicaciones de cada uno en rendimiento de consulta y mantenimiento. El bloque presta especial atención a la granularidad: se examinan casos donde una granularidad mal definida produce duplicados o agregaciones incorrectas, y se desarrolla la capacidad de diagnosticar la causa raíz de estos errores a partir de la estructura del modelo.

Bloque 4 — Consultas de exploración sobre el Data Warehouse

El bloque final lleva la teoría a la práctica en un entorno guiado. El participante ejecuta consultas SELECT que cruzan tablas de hechos y dimensiones mediante JOIN, aplica filtros por atributos de dimensión y calcula métricas con funciones de agregación simples (SUM, COUNT, AVG). Cada ejercicio está diseñado para reforzar los conceptos de modelado del bloque anterior y consolidar la capacidad de obtener resultados correctos y reproducibles sobre el Data Warehouse de ejemplo.

Ordenador con conexión a internet estable.
Navegador web actualizado (Chrome, Firefox, Edge o Safari en sus versiones recientes).
Acceso al entorno de práctica guiado proporcionado por la plataforma (no requiere instalación local; se accede vía navegador).
Opcional pero recomendado: cliente SQL de escritorio (por ejemplo, DBeaver o Azure Data Studio) para exploración adicional fuera del entorno guiado.

Conocimientos básicos de bases de datos relacionales: qué es una tabla, una clave primaria y una clave foránea.
Capacidad para leer y escribir consultas SQL simples con SELECT, WHERE y funciones de agregación (SUM, COUNT).
Familiaridad general con el concepto de dato estructurado y sus formatos más habituales (CSV, tablas de base de datos).

Data Warehouse — Iniciación

Necesitas un plan activo

Descripción

Objetivos

Temario

Requisitos técnicos

Conocimientos previos

Detalles de la convocatoria