Boost Academy

Este curso capacita a profesionales en IA para diseñar, implementar y optimizar arquitecturas RAG (Retrieval-Augmented Generation) que combinan modelos de lenguaje con sistemas de recuperación de información para generar respuestas contextualizadas y precisas. Dirigido a ingenieros de ML, arquitectos de IA y desarrolladores con experiencia en NLP que buscan dominar técnicas avanzadas de generación aumentada. Al finalizar, los participantes serán capaces de construir sistemas RAG escalables, optimizar pipelines de recuperación semántica y evaluar su rendimiento en entornos productivos.

Al finalizar el curso, el participante será capaz de:

Diseñar arquitecturas RAG completas integrando modelos de embedding, bases de datos vectoriales y LLMs
Diseñar e implementar pipelines de indexación y recuperación semántica justificando las decisiones según el caso de uso
Seleccionar y justificar la estrategia de chunking y reranking más adecuada en función de la naturaleza del corpus
Evaluar y monitorizar sistemas RAG utilizando métricas específicas de precisión, latencia y calidad de generación
Optimizar el rendimiento y costes de arquitecturas RAG en producción mediante técnicas de caching, compresión y ajuste de prompts

Fundamentos de RAG y arquitectura básica — Componentes principales, diferencias con fine-tuning, casos de uso empresariales, flujo end-to-end
Embeddings y bases de datos vectoriales — Sentence transformers, modelos multilingües, dimensionalidad, normalización; Pinecone, Weaviate, FAISS, algoritmos ANN y gestión de metadatos
Preprocesamiento y recuperación — Chunking semántico, overlapping, jerarquías, tratamiento de tablas y código; búsqueda híbrida (densa + sparse), cross-encoders, expansión de queries
Integración con LLMs y generación aumentada — Construcción de prompts contextuales, gestión de ventanas de contexto, streaming, control de alucinaciones
Evaluación y métricas de sistemas RAG — Precision@k, NDCG, faithfulness, answer relevancy, context recall, framework RAGAS, testing automatizado
Optimización y despliegue — Caching semántico, compresión de contexto, gestión de costes API, monitorización en producción, implementación de chatbots empresariales

Software y herramientas:

Python 3.9 o superior con pip/conda configurado
VS Code, PyCharm o IDE similar con soporte para notebooks
Docker Desktop (última versión estable) para despliegue de bases de datos vectoriales
Git para control de versiones
Bibliotecas: LangChain 0.1.0+, LlamaIndex 0.9.0+, sentence-transformers, FAISS, chromadb Accesos y cuentas:
Cuenta en OpenAI, Anthropic o similar con créditos API (mínimo $10-20 para prácticas)
Cuenta gratuita en Pinecone, Weaviate Cloud o Qdrant Cloud (tier gratuito suficiente)
Cuenta GitHub para acceso a repositorios del curso

Experiencia práctica con Python (nivel intermedio-avanzado) y bibliotecas de machine learning como scikit-learn, numpy y pandas. Conocimientos sólidos de procesamiento de lenguaje natural (NLP) incluyendo tokenización, embeddings y modelos transformer. Familiaridad con APIs de modelos de lenguaje (OpenAI, Anthropic u otros LLMs) y conceptos de prompt engineering. Comprensión de arquitecturas de sistemas distribuidos, APIs REST y bases de datos. Se recomienda experiencia previa con frameworks como LangChain, LlamaIndex o similares, aunque se revisarán en el curso.

Arquitecturas RAG: Retrieval-Augmented Generation

You need an active plan

Description

Learning objectives

Syllabus

Technical requirements

Prerequisites

Schedule details