什么是检索增强生成 (RAG)？

Question

什么是检索增强生成 (RAG)？

Accepted Answer

**RAG (检索增强生成)** 将 LLM 与**检索系统**结合在一起——从知识库中获取相关信息，并将其作为上下文提供给 LLM 以生成准确、有根据的答案。这是在自定义数据上构建 LLM 应用程序的关键技术。

## RAG 的作用

```text
RAG → augment an LLM's generation with RETRIEVED relevant information:
  1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
  2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
  3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
```

## RAG 通常如何工作

```text
→ index your data: split documents into chunks → create EMBEDDINGS → store in a VECTOR DATABASE
→ at query time: embed the query → find the most SIMILAR chunks (semantic search) →
  retrieve them
→ build a prompt: 'Using this context: [retrieved chunks], answer: [query]'
→ the LLM generates an answer grounded in the retrieved context
```

## RAG 的价值

```text
✓ Use your OWN/CURRENT data → answer questions about documents the LLM wasn't trained on
  (private docs, recent info, specific knowledge)
✓ Reduce HALLUCINATION → grounding answers in retrieved facts → more accurate, less made-up
✓ Up-to-date → retrieve current info (vs the model's fixed training cutoff)
✓ CITATIONS → can show sources (the retrieved chunks) → trust/verification
✓ cheaper/easier than fine-tuning for adding knowledge
→ a key pattern for building LLM apps over custom data
```

## 为什么这很重要

理解 RAG 很有价值，因为它是**在自定义数据上构建实用 LLM 应用程序的关键技术**，因此对开发者来说是越来越重要的 AI 知识。

RAG——将 LLM 与检索系统相结合，获取相关信息并将其作为上下文提供以实现有根据的生成——是真实世界 LLM 应用程序的基础模式。

理解 **RAG 的作用**——从知识库中检索相关信息，使用它作为上下文增强 LLM 的提示，以及生成基于该数据的答案——阐明了 RAG 如何让 LLM 访问它们未经训练的知识。

理解 **RAG 通常如何工作**——通过将文档拆分成块来索引数据、创建 embeddings 并将其存储在向量数据库中；然后在查询时对查询进行 embedding、通过语义搜索查找类似的块，并为 LLM 构建带有检索上下文的提示——提供了实用的架构（连接到 embeddings 和向量数据库）。

理解 **RAG 为什么有价值**是关键洞察：它让 LLM 可以使用**你自己的和最新的数据**（回答有关私有文档、最近信息和 LLM 未经训练的特定知识的问题）、**减少幻觉**（通过将答案植根于检索事实来提高准确性——解决一个关键的 LLM 局限性）、提供**最新信息**（相对于模型的固定训练截止日期）、启用**引用**（显示来源以增加信任）、并且相比微调来说成本更低、更容易添加知识。

这些好处使 RAG 成为在自定义数据上构建 LLM 应用程序的首选技术（这是非常常见的需求）。

RAG 是 LLM 应用程序最重要的实用模式之一，对于构建 AI 功能的开发者来说越来越必不可少。

由于 RAG 是在自定义数据上构建实用 LLM 应用程序的关键技术（使 LLM 植根于你自己的/最新数据、减少幻觉、启用引用）——这是非常常见的需求——并且理解它对于构建 AI 功能的开发者来说越来越重要，所以理解 RAG 是有价值的、日益必要的 AI 知识——在自定义数据上构建 LLM 应用程序的基础模式（通过将答案植根于检索信息来减少幻觉并使用你自己的/最新知识），对开发者来说越来越重要，以及 LLM 实际应用中的关键技术。