RAG (Retrieval-Augmented Generation) kombinerer en LLM med et retrieval-system — henter relevant information fra en knowledge base og giver den til LLM'en som kontekst for at generere præcise, grundede svar. Det er en vigtig teknik til at bygge LLM-applikationer over brugerdefinerede data.
Hvad RAG gør
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
