RAG (Retrieval-Augmented Generation) combineert een LLM met een retrieval systeem — het ophalen van relevante informatie uit een kennisbank en het verstrekken ervan aan de LLM als context om nauwkeurige, gegronde antwoorden te genereren. Het is een sleuteltechniek voor het bouwen van LLM-applicaties over aangepaste gegevens.
Wat RAG doet
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
