RAG(Retrieval-Augmented Generation) は、LLM と retrieval system を組み合わせ、knowledge base から relevant information を取得して context として LLM に渡し、より正確で grounded な answer を生成する technique です。custom data 上で LLM application を作る key pattern です。
RAG がすること
text
RAG → LLM generation を RETRIEVED relevant information で augment する:
1. RETRIEVE → query に relevant な info を knowledge base から search
2. AUGMENT → retrieved info を CONTEXT として LLM prompt に追加
3. GENERATE → LLM が provided context を使って answer
→ LLM が training されていない current/specific knowledge を渡せる
typical workflow
text
→ data を index: documents を chunks に分割 → EMBEDDINGS 作成 → VECTOR DATABASE に保存
→ query time: query を embed → semantic search で most SIMILAR chunks を retrieve
→ prompt 作成: 'Using this context: [chunks], answer: [query]'
→ LLM が retrieved context に grounded した answer を生成
