В чём различие между prompt engineering, RAG и fine-tuning, и когда использовать каждый?

Question

Accepted Answer

Это три способа заставить LLM делать то, что вам нужно, работающие на **разных уровнях**: prompting формирует *поведение*, RAG вносит *знания*, а fine-tuning меняет саму *модель*.

## Три подхода

- **Prompt engineering** — формировать поведение модели через инструкции, контекст и примеры в промпте. Ничего в самой модели не меняется; вы просто общаетесь лучше (системные промпты, few-shot примеры, формат вывода). Самый дешёвый и быстрый; ваш **первый выбор**.
- **RAG (retrieval-augmented generation)** — во время запроса извлечь релевантные документы (из векторного хранилища, базы данных или поиска) и вставить их в промпт. Модель отвечает *на основе* предоставленного контекста. Лучший вариант, когда знания **внешние, приватные или изменяются**.
- **Fine-tuning** — продолжить обучение модели на ваших примерах, настраивая её **веса**. Это встраивает в неё стабильный стиль, формат или узкий навык. Мощно, но дорого и **статично** — знания замораживаются на момент обучения.

## Сравнение

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Что меняется** | Промпт | Промпт (+ retrieval) | Веса модели |
| **Лучше всего для** | Поведение, формат, тон | Свежие / приватные факты | Стабильный стиль, узкие задачи |
| **Актуальность знаний** | N/A | Live (переиндексация данных) | Заморожено на момент обучения |
| **Стоимость / усилия** | Минимальная | Средняя (инфра) | Максимальная (обучение + данные) |
| **Обновление** | Редактировать текст | Обновить индекс | Переобучить |

## Руководство по выбору

- Начните с **prompting** — решите задачу бесплатно в первую очередь.
- Нужны факты, которые модель не знает, или которые меняются (документы, цены, внутренние данные)? Используйте **RAG**.
- Нужен надёжный стиль/формат или узкая специализированная задача в масштабе, и prompting недостаточно консистентен? **Fine-tune**.
- Эти подходы **комбинируются**: fine-tuned модель с RAG и хорошим промптом — обычное дело в продакшене.

## Почему это важно

Выбрать неправильный инструмент дорого обходится: люди часто пытаются делать fine-tuning для добавления знаний (что RAG делает лучше и дешевле) или для исправления поведения (что решается prompting). Понимание того, что **prompting формирует поведение, RAG поставляет знания, а fine-tuning меняет модель**, позволяет вам выбрать самый дешёвый рабочий подход — и комбинировать их намеренно, а не случайно.

	Prompt engineering	RAG	Fine-tuning
Что меняется	Промпт	Промпт (+ retrieval)	Веса модели
Лучше всего для	Поведение, формат, тон	Свежие / приватные факты	Стабильный стиль, узкие задачи
Актуальность знаний	N/A	Live (переиндексация данных)	Заморожено на момент обучения
Стоимость / усилия	Минимальная	Средняя (инфра)	Максимальная (обучение + данные)
Обновление	Редактировать текст	Обновить индекс	Переобучить