RAG (Retrieval-Augmented Generation) объединяет LLM с системой поиска — извлечением релевантной информации из базы знаний и предоставлением её LLM в качестве контекста для генерации точных, обоснованных ответов. Это ключевой метод для создания приложений LLM над пользовательскими данными.
Что делает RAG
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
