Retrieval-Augmented Generation（RAG）とは何ですか？

Question

Accepted Answer

**RAG（Retrieval-Augmented Generation）** は、LLM と **retrieval system** を組み合わせ、knowledge base から relevant information を取得して context として LLM に渡し、より正確で grounded な answer を生成する technique です。custom data 上で LLM application を作る key pattern です。

## RAG がすること

```text
RAG → LLM generation を RETRIEVED relevant information で augment する:
  1. RETRIEVE → query に relevant な info を knowledge base から search
  2. AUGMENT → retrieved info を CONTEXT として LLM prompt に追加
  3. GENERATE → LLM が provided context を使って answer
→ LLM が training されていない current/specific knowledge を渡せる
```

## typical workflow

```text
→ data を index: documents を chunks に分割 → EMBEDDINGS 作成 → VECTOR DATABASE に保存
→ query time: query を embed → semantic search で most SIMILAR chunks を retrieve
→ prompt 作成: 'Using this context: [chunks], answer: [query]'
→ LLM が retrieved context に grounded した answer を生成
```

## RAG の価値

```text
✓ OWN/CURRENT data を使える → private docs, recent info, specific knowledge
✓ HALLUCINATION を減らす → retrieved facts に grounded させる
✓ Up-to-date → fixed training cutoff を補える
✓ CITATIONS → source chunks を示せる
✓ fine-tuning より安く簡単に knowledge を追加できる
```

## なぜ重要なのか

RAG は実用的な LLM application の最重要 pattern の 1 つです。自社 document、最新情報、domain-specific knowledge を LLM に使わせ、hallucination を減らし、citation を出せます。custom data 上の Q&A、semantic search、assistant を作る developer にとって基本です。