Это три способа заставить LLM делать то, что вам нужно, работающие на разных уровнях: prompting формирует поведение, RAG вносит знания, а fine-tuning меняет саму модель.
Это три способа заставить LLM делать то, что вам нужно, работающие на разных уровнях: prompting формирует поведение, RAG вносит знания, а fine-tuning меняет саму модель.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Что меняется | Промпт | Промпт (+ retrieval) | Веса модели |
| Лучше всего для | Поведение, формат, тон | Свежие / приватные факты | Стабильный стиль, узкие задачи |
| Актуальность знаний | N/A | Live (переиндексация данных) | Заморожено на момент обучения |
| Стоимость / усилия | Минимальная | Средняя (инфра) | Максимальная (обучение + данные) |
| Обновление | Редактировать текст | Обновить индекс | Переобучить |
Выбрать неправильный инструмент дорого обходится: люди часто пытаются делать fine-tuning для добавления знаний (что RAG делает лучше и дешевле) или для исправления поведения (что решается prompting). Понимание того, что prompting формирует поведение, RAG поставляет знания, а fine-tuning меняет модель, позволяет вам выбрать самый дешёвый рабочий подход — и комбинировать их намеренно, а не случайно.