RAG (Retrieval-Augmented Generation) combina un LLM con un sistema de recuperación — extrayendo información relevante de una base de conocimiento y proporcionándola al LLM como contexto para generar respuestas precisas y fundamentadas. Es una técnica clave para construir aplicaciones LLM sobre datos personalizados.
Qué hace RAG
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
