RAG (Retrieval-Augmented Generation) kombinuje LLM s systémem vyhledávání — načítá relevantní informace ze znalostní báze a poskytuje je LLM jako kontext pro generování přesných, podložených odpovědí. Jedná se o klíčovou techniku pro vytváření LLM aplikací nad vlastními daty.
Co RAG dělá
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
