RAG (Retrieval-Augmented Generation) combine un LLM avec un système de récupération — récupérant les informations pertinentes d'une base de connaissances et les fournissant au LLM comme contexte pour générer des réponses précises et fondées. C'est une technique clé pour construire des applications LLM sur des données personnalisées.
Ce que RAG fait
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
