Boost Academy
FormaciónEvaluacionesPerfil
Volver
  • En directo

Pandas — Iniciación

10h de clase en directo·HACK A BOSS·Español

Skills que aprenderás

  • Pandas

Convocatorias

Necesitas un plan activo

Para acceder a los cursos en directo necesitas un plan activo. Estamos trabajando para que los planes estén disponibles pronto — ¡mantente atento!

No hay convocatorias abiertas ahora mismo, pero no te pierdas la oportunidad: guarda este curso y te avisamos en cuanto se abra una convocatoria.

Descripción

Objetivos

Temario

Requisitos técnicos

Conocimientos previos

Detalles de la convocatoria

Recursos

No hay recursos disponibles todavía para esta convocatoria

Este curso está dirigido a personas con conocimientos básicos de Python que se inician en el análisis de datos y necesitan una herramienta práctica para explorar, transformar y exportar conjuntos de datos tabulares. A lo largo de las 10 horas, el participante descubrirá las estructuras fundamentales de Pandas —Series y DataFrame—, aprenderá a cargar datos desde ficheros CSV y Excel ajustando parámetros de lectura, inspeccionará y filtrará la información mediante métodos de exploración y selección, gestionará valores nulos, realizará transformaciones básicas sobre columnas y controlará el comportamiento del índice, para finalmente exportar el resultado de su trabajo a un archivo listo para compartir o continuar procesando.

  1. Distinguir las estructuras de datos Series y DataFrame reconociendo sus componentes internos —índice, columnas y tipo de dato— y explicar en qué situación es apropiado usar cada una.
  2. Cargar conjuntos de datos reales desde ficheros CSV y Excel configurando los parámetros de lectura más habituales, e inspeccionar las dimensiones, tipos de dato y estadísticas descriptivas del DataFrame resultante.
  3. Extraer subconjuntos de datos mediante selección por etiqueta y por posición, aplicar filtros booleanos sobre una o dos condiciones, y describir el comportamiento del índice tras operaciones de filtrado y ordenación.
  4. Detectar y tratar valores nulos eligiendo la estrategia más adecuada al contexto, ejecutar transformaciones básicas de columnas —renombrado, cambio de tipo y ordenación— y exportar el DataFrame procesado a CSV con la configuración correcta.

Bloque 1 — Estructuras de datos en Pandas. Se presenta la librería en el contexto del ecosistema de análisis de datos y se estudian las dos estructuras centrales: Series y DataFrame. Se analiza cómo se organiza internamente cada estructura —índice, columnas y dtype— y se practican ejercicios de creación manual para consolidar las diferencias entre ambas.

Bloque 2 — Carga e inspección de datos. Se trabaja la lectura de ficheros CSV y Excel con read_csv y read_excel, prestando especial atención a los parámetros sep, header, usecols y dtype. Una vez cargado el DataFrame, se utilizan info(), describe(), shape y dtypes para obtener una primera radiografía del conjunto de datos: dimensiones, tipos y estadísticas básicas.

Bloque 3 — Selección y filtrado. Se introducen los accesores loc e iloc para seleccionar filas y columnas por etiqueta y por posición respectivamente, trabajando con al menos dos escenarios distintos en cada caso. A continuación se construyen máscaras booleanas con una y dos condiciones para filtrar filas según criterios definidos en el enunciado.

Bloque 4 — Calidad y transformación de datos. Se aborda la detección de valores nulos con isnull().sum() y se practican las estrategias dropna y fillna justificando la elección en función del contexto. Seguidamente se aplican transformaciones habituales: renombrar columnas, cambiar tipos de dato y ordenar el DataFrame por una columna concreta. Se explica el comportamiento del índice tras el filtrado y la ordenación, y se ejecuta reset_index cuando el flujo de trabajo lo requiere.

Bloque 5 — Exportación del resultado. Se cierra el ciclo de trabajo exportando el DataFrame procesado a CSV mediante to_csv, configurando correctamente los parámetros index y sep para garantizar que el fichero de salida sea legible y reutilizable en pasos posteriores del análisis.

  • Python 3.9 o superior instalado en el entorno de trabajo.
  • Pandas 2.0 o superior (pip install pandas).
  • OpenPyXL para la lectura de ficheros Excel (pip install openpyxl).
  • Jupyter Notebook o JupyterLab (pip install notebook o pip install jupyterlab).
  • Acceso a los ficheros de datos de práctica proporcionados en el repositorio del curso (formato CSV y XLSX).
  • Programación básica en Python: variables, tipos de dato nativos (listas, diccionarios), estructuras de control y funciones.
  • Manejo elemental de un entorno de desarrollo Jupyter Notebook o JupyterLab (abrir, crear y ejecutar celdas).
  • Comprensión conceptual de qué es una tabla de datos (filas, columnas, celdas).