Boost Academy

Este curso está dirigido a profesionales con conocimientos fundacionales en IA generativa que buscan profundizar en el diseño y operación de sistemas LLM listos para producción. A lo largo de seis horas, los participantes explorarán cómo estructurar pipelines de recuperación aumentada (RAG) y cómo adaptar modelos a casos de uso específicos mediante fine-tuning o técnicas de eficiencia como LoRA, aprendiendo a tomar decisiones de diseño justificadas en función del coste, la latencia y la calidad requerida. El curso aborda también el prompt engineering avanzado, la evaluación rigurosa de la calidad de las respuestas y la implementación de controles de riesgo, de modo que al finalizar cada participante será capaz de construir y auditar un sistema GenAI robusto, seguro y alineado con los requisitos reales de un entorno de negocio.

Comprender la arquitectura de un pipeline RAG y las decisiones de diseño asociadas a cada etapa —chunking, embedding, indexación y recuperación— en función del tipo de documentos y el patrón de consulta previsto.
Comparar modelos LLM en términos de coste por token, latencia y ventana de contexto, y seleccionar la configuración de inferencia más adecuada para un caso de uso con requisitos concretos de velocidad, coste y calidad.
Aplicar técnicas avanzadas de diseño de prompts —few-shot learning, chain-of-thought y role prompting— seleccionando y combinando la técnica apropiada para tareas de negocio complejas.
Preparar un dataset de fine-tuning con el formato y la calidad requeridos, y seleccionar entre full fine-tuning, LoRA/QLoRA y prompt-tuning razonando el trade-off entre rendimiento y coste computacional.
Evaluar la calidad de las respuestas de un sistema RAG aplicando métricas de faithfulness, answer relevancy y context precision, e interpretar los resultados para diagnosticar fallos en el pipeline.
Implementar controles de riesgo en un sistema GenAI —grounding, filtrado de PII y validación de salidas— identificando en qué etapa del pipeline se sitúa cada medida y describiendo su implementación técnica.

Bloque 1 — Arquitectura y diseño de sistemas RAG Este bloque establece las bases conceptuales de la generación aumentada por recuperación. Se analiza la arquitectura completa de un pipeline RAG, detallando las etapas de chunking de documentos (estrategias por tamaño fijo, por separadores semánticos y por estructura), generación y almacenamiento de embeddings en un vector store, indexación eficiente y recuperación por similitud. Se hace especial énfasis en cómo las decisiones de diseño en cada etapa dependen del tipo de corpus y del patrón de consulta esperado, de forma que el participante sea capaz de justificar sus elecciones técnicas ante un equipo o cliente.

Bloque 2 — Selección y configuración de modelos LLM El segundo bloque aborda el ecosistema actual de modelos LLM desde una perspectiva práctica orientada a la toma de decisiones. Se comparan modelos propietarios y abiertos atendiendo a sus características de coste por token, latencia, tamaño de ventana de contexto y capacidades específicas. A continuación se estudian los parámetros clave de inferencia —temperatura, top-p y max_tokens— y cómo su ajuste afecta al equilibrio entre creatividad, coherencia y control del coste, lo que permite al participante configurar el modelo de forma óptima para cada caso de uso.

Bloque 3 — Prompt engineering avanzado Este bloque profundiza en las técnicas de diseño de prompts más efectivas para escenarios de negocio complejos. Se trabajan en detalle el few-shot learning (selección y estructura de los ejemplos), el chain-of-thought (cadenas de razonamiento explícitas para tareas de múltiples pasos) y el role prompting (definición del rol del modelo para acotar el tono y el dominio de las respuestas). El bloque pone el foco en la capacidad de combinar estas técnicas de forma deliberada y de argumentar por qué una determinada combinación produce el resultado más fiable para un caso de uso concreto.

Bloque 4 — Fine-tuning y adaptación eficiente de modelos Se introduce el proceso completo de adaptación de un LLM a un dominio o tarea específicos. El bloque cubre la preparación del dataset de entrenamiento —formatos de entrada/salida, criterios de calidad de los ejemplos y técnicas de curación—, así como la comparativa entre las principales estrategias de adaptación: full fine-tuning, LoRA/QLoRA y prompt-tuning. Se analiza el trade-off entre rendimiento obtenido, coste computacional y accesibilidad para equipos con distintos niveles de recursos, facilitando la selección razonada de la técnica más adecuada.

Bloque 5 — Evaluación y control de riesgos en sistemas GenAI El bloque final integra la perspectiva de calidad y seguridad. En la parte de evaluación se presentan las métricas estándar para medir la fiabilidad de un sistema RAG: faithfulness (la respuesta está anclada en el contexto recuperado), answer relevancy (la respuesta responde a la pregunta formulada) y context precision (los fragmentos recuperados son realmente pertinentes), y se muestra cómo interpretar sus valores para localizar el punto de fallo en el pipeline. La segunda parte aborda los controles de riesgo que todo sistema GenAI en producción debe incorporar: grounding para mitigar alucinaciones, detección y filtrado de información de identificación personal (PII) tanto en entradas como en salidas, y guardrails de formato y contenido. Para cada medida se especifica en qué etapa del pipeline se inserta y cómo se implementa técnicamente.

Ordenador con conexión estable a internet.
Cuenta activa en OpenAI, Azure OpenAI o el proveedor de LLM indicado en la plataforma del curso (se indicará la capa gratuita disponible antes del inicio).
Python 3.10 o superior instalado localmente, o acceso a Google Colab / JupyterHub corporativo.
Librerías: openai, langchain, chromadb, sentence-transformers, ragas, transformers y peft (se facilitará un archivo requirements.txt al inicio del curso).
Acceso a Hugging Face Hub para la descarga de modelos abiertos utilizados en el bloque de fine-tuning.
GPU opcional pero recomendada para los ejercicios de fine-tuning con LoRA; en su ausencia se puede usar Google Colab con GPU T4 (gratuito).

Para aprovechar este curso el participante debe haber completado el nivel Iniciación de IA Generativa (IAG01) o contar con conocimientos equivalentes, que incluyen: familiaridad con los fundamentos de los modelos de lenguaje de gran escala (qué es un LLM, cómo funciona la generación de texto y el concepto de tokenización), experiencia básica en el diseño de prompts simples y comprensión general del ciclo de vida de un proyecto de IA. Se asume también comodidad con el uso de Python a nivel básico, dado que los ejemplos y ejercicios del curso hacen uso de fragmentos de código.

IA Generativa — Intermedio

Necesitas un plan activo

Descripción

Objetivos

Temario

Requisitos técnicos

Conocimientos previos

Detalles de la convocatoria