Boost Academy

Este curso está dirigido a personas con conocimientos básicos de Python que se inician en el análisis de datos y necesitan una herramienta práctica para explorar, transformar y exportar conjuntos de datos tabulares. A lo largo de las 10 horas, el participante descubrirá las estructuras fundamentales de Pandas —Series y DataFrame—, aprenderá a cargar datos desde ficheros CSV y Excel ajustando parámetros de lectura, inspeccionará y filtrará la información mediante métodos de exploración y selección, gestionará valores nulos, realizará transformaciones básicas sobre columnas y controlará el comportamiento del índice, para finalmente exportar el resultado de su trabajo a un archivo listo para compartir o continuar procesando.

Distinguir las estructuras de datos Series y DataFrame reconociendo sus componentes internos —índice, columnas y tipo de dato— y explicar en qué situación es apropiado usar cada una.
Cargar conjuntos de datos reales desde ficheros CSV y Excel configurando los parámetros de lectura más habituales, e inspeccionar las dimensiones, tipos de dato y estadísticas descriptivas del DataFrame resultante.
Extraer subconjuntos de datos mediante selección por etiqueta y por posición, aplicar filtros booleanos sobre una o dos condiciones, y describir el comportamiento del índice tras operaciones de filtrado y ordenación.
Detectar y tratar valores nulos eligiendo la estrategia más adecuada al contexto, ejecutar transformaciones básicas de columnas —renombrado, cambio de tipo y ordenación— y exportar el DataFrame procesado a CSV con la configuración correcta.

Bloque 1 — Estructuras de datos en Pandas. Se presenta la librería en el contexto del ecosistema de análisis de datos y se estudian las dos estructuras centrales: Series y DataFrame. Se analiza cómo se organiza internamente cada estructura —índice, columnas y dtype— y se practican ejercicios de creación manual para consolidar las diferencias entre ambas.

Bloque 2 — Carga e inspección de datos. Se trabaja la lectura de ficheros CSV y Excel con read_csv y read_excel, prestando especial atención a los parámetros sep, header, usecols y dtype. Una vez cargado el DataFrame, se utilizan info(), describe(), shape y dtypes para obtener una primera radiografía del conjunto de datos: dimensiones, tipos y estadísticas básicas.

Bloque 3 — Selección y filtrado. Se introducen los accesores loc e iloc para seleccionar filas y columnas por etiqueta y por posición respectivamente, trabajando con al menos dos escenarios distintos en cada caso. A continuación se construyen máscaras booleanas con una y dos condiciones para filtrar filas según criterios definidos en el enunciado.

Bloque 4 — Calidad y transformación de datos. Se aborda la detección de valores nulos con isnull().sum() y se practican las estrategias dropna y fillna justificando la elección en función del contexto. Seguidamente se aplican transformaciones habituales: renombrar columnas, cambiar tipos de dato y ordenar el DataFrame por una columna concreta. Se explica el comportamiento del índice tras el filtrado y la ordenación, y se ejecuta reset_index cuando el flujo de trabajo lo requiere.

Bloque 5 — Exportación del resultado. Se cierra el ciclo de trabajo exportando el DataFrame procesado a CSV mediante to_csv, configurando correctamente los parámetros index y sep para garantizar que el fichero de salida sea legible y reutilizable en pasos posteriores del análisis.

Python 3.9 o superior instalado en el entorno de trabajo.
Pandas 2.0 o superior (pip install pandas).
OpenPyXL para la lectura de ficheros Excel (pip install openpyxl).
Jupyter Notebook o JupyterLab (pip install notebook o pip install jupyterlab).
Acceso a los ficheros de datos de práctica proporcionados en el repositorio del curso (formato CSV y XLSX).

Programación básica en Python: variables, tipos de dato nativos (listas, diccionarios), estructuras de control y funciones.
Manejo elemental de un entorno de desarrollo Jupyter Notebook o JupyterLab (abrir, crear y ejecutar celdas).
Comprensión conceptual de qué es una tabla de datos (filas, columnas, celdas).

Pandas — Iniciación

Necesitas un plan activo

Descripción

Objetivos

Temario

Requisitos técnicos

Conocimientos previos

Detalles de la convocatoria