Boost Academy
LearningAssessmentsProfile
Back
  • Live

Entorno, datos y preparación

8h of live classes·HACK A BOSS·Spanish

Skills you will learn

  • Machine Learning

Schedules

You need an active plan

To access live courses you need an active plan. We're working on making plans available soon — stay tuned.

There are no open calls right now, but don't miss out: save this course and we'll notify you as soon as a call opens.

Description

Learning objectives

Syllabus

Technical requirements

Prerequisites

Schedule details

Resources

No resources are available yet for this schedule

Curso práctico para montar el entorno de trabajo de machine learning y dominar el flujo inicial de un proyecto de datos. El alumno configura Jupyter, se familiariza con el stack base —numpy, pandas, matplotlib y scikit-learn—, obtiene datasets reales del UCI Repository y ejecuta el ciclo completo de inspección, visualización, limpieza y preparación hasta dejar un dataset listo para modelar.

Al finalizar el curso, el participante será capaz de:

  • Lanzar un servidor Jupyter Notebook y crear notebooks funcionales con una estructura de proyecto clara
  • Trabajar con las librerías base del stack: numpy, pandas, matplotlib y nociones de scikit-learn
  • Descargar datasets del UCI Machine Learning Repository directamente desde un notebook
  • Cargar datos en pandas y realizar una primera exploración: head, tipos, nulos y duplicados
  • Visualizar variables con gráficos 2D básicos para detectar patrones y problemas en los datos
  • Limpiar datos: tratar nulos, eliminar duplicados y normalizar formatos inconsistentes
  • Transformar variables categóricas simples a formato numérico para su uso en modelos
  1. Entorno de trabajo — Jupyter Notebook: instalación, lanzamiento y estructura de un notebook de proyecto
  2. Stack de librerías — numpy, pandas, matplotlib y visión general de scikit-learn
  3. Obtención de datos — descarga de datasets desde el UCI Machine Learning Repository en notebook
  4. Exploración inicial — carga en pandas, head, tipos, nulos y duplicados
  5. Visualización — gráficos 2D para exploración y detección de problemas
  6. Limpieza y preparación — tratamiento de nulos, duplicados, formatos y transformación de variables categóricas a numéricas
  • Python instalado con entorno de notebooks (Jupyter Notebook o JupyterLab)
  • Librerías: numpy, pandas, matplotlib y scikit-learn
  • Python básico-intermedio: funciones, listas y diccionarios
  • Familiaridad mínima con CSV y conceptos de fila/columna (recomendable)
  • Nociones básicas de estadística descriptiva (recomendable, no obligatorio)