Boost Academy
LearningAssessmentsProfile
Back
  • Live

Arquitecturas RAG: Retrieval-Augmented Generation

8h of live classes·HACK A BOSS·Spanish

Skills you will learn

  • Arquitecturas RAG

Schedules

You need an active plan

To access live courses you need an active plan. We're working on making plans available soon — stay tuned.

There are no open calls right now, but don't miss out: save this course and we'll notify you as soon as a call opens.

Description

Learning objectives

Syllabus

Technical requirements

Prerequisites

Schedule details

Resources

No resources are available yet for this schedule

Este curso capacita a profesionales en IA para diseñar, implementar y optimizar arquitecturas RAG (Retrieval-Augmented Generation) que combinan modelos de lenguaje con sistemas de recuperación de información para generar respuestas contextualizadas y precisas. Dirigido a ingenieros de ML, arquitectos de IA y desarrolladores con experiencia en NLP que buscan dominar técnicas avanzadas de generación aumentada. Al finalizar, los participantes serán capaces de construir sistemas RAG escalables, optimizar pipelines de recuperación semántica y evaluar su rendimiento en entornos productivos.

Al finalizar el curso, el participante será capaz de:

  • Diseñar arquitecturas RAG completas integrando modelos de embedding, bases de datos vectoriales y LLMs
  • Diseñar e implementar pipelines de indexación y recuperación semántica justificando las decisiones según el caso de uso
  • Seleccionar y justificar la estrategia de chunking y reranking más adecuada en función de la naturaleza del corpus
  • Evaluar y monitorizar sistemas RAG utilizando métricas específicas de precisión, latencia y calidad de generación
  • Optimizar el rendimiento y costes de arquitecturas RAG en producción mediante técnicas de caching, compresión y ajuste de prompts
  1. Fundamentos de RAG y arquitectura básica — Componentes principales, diferencias con fine-tuning, casos de uso empresariales, flujo end-to-end
  2. Embeddings y bases de datos vectoriales — Sentence transformers, modelos multilingües, dimensionalidad, normalización; Pinecone, Weaviate, FAISS, algoritmos ANN y gestión de metadatos
  3. Preprocesamiento y recuperación — Chunking semántico, overlapping, jerarquías, tratamiento de tablas y código; búsqueda híbrida (densa + sparse), cross-encoders, expansión de queries
  4. Integración con LLMs y generación aumentada — Construcción de prompts contextuales, gestión de ventanas de contexto, streaming, control de alucinaciones
  5. Evaluación y métricas de sistemas RAG — Precision@k, NDCG, faithfulness, answer relevancy, context recall, framework RAGAS, testing automatizado
  6. Optimización y despliegue — Caching semántico, compresión de contexto, gestión de costes API, monitorización en producción, implementación de chatbots empresariales

Software y herramientas:

  • Python 3.9 o superior con pip/conda configurado
  • VS Code, PyCharm o IDE similar con soporte para notebooks
  • Docker Desktop (última versión estable) para despliegue de bases de datos vectoriales
  • Git para control de versiones
  • Bibliotecas: LangChain 0.1.0+, LlamaIndex 0.9.0+, sentence-transformers, FAISS, chromadb Accesos y cuentas:
  • Cuenta en OpenAI, Anthropic o similar con créditos API (mínimo $10-20 para prácticas)
  • Cuenta gratuita en Pinecone, Weaviate Cloud o Qdrant Cloud (tier gratuito suficiente)
  • Cuenta GitHub para acceso a repositorios del curso

Experiencia práctica con Python (nivel intermedio-avanzado) y bibliotecas de machine learning como scikit-learn, numpy y pandas. Conocimientos sólidos de procesamiento de lenguaje natural (NLP) incluyendo tokenización, embeddings y modelos transformer. Familiaridad con APIs de modelos de lenguaje (OpenAI, Anthropic u otros LLMs) y conceptos de prompt engineering. Comprensión de arquitecturas de sistemas distribuidos, APIs REST y bases de datos. Se recomienda experiencia previa con frameworks como LangChain, LlamaIndex o similares, aunque se revisarán en el curso.