RAG (Retrieval-Augmented Generation) kombinira LLM sa sustavom za pretraživanje — dohvaćanjem relevantnih informacija iz baze znanja i pružanjem kao konteksta LLM-u kako bi generirao točne, utemeljene odgovore. Ključna je tehnika za izgradnju LLM aplikacija nad prilagođenim podacima.
Što RAG radi
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
