Jaka jest różnica między prompt engineeringiem, RAG-iem i fine-tuningiem i kiedy używasz każdego z nich?

Question

Accepted Answer

To są trzy sposoby, aby sprawić, że LLM robił to, co chcesz, działające na **różnych warstwach**: prompting kształtuje *zachowanie*, RAG wstrzykuje *wiedzę*, a fine-tuning zmienia *model*.

## Trzy podejścia

- **Prompt engineering** — kształtuj zachowanie modelu poprzez instrukcje, kontekst i przykłady w promptcie. Nic się nie zmienia w modelu; po prostu lepiej się komunikujesz (system prompts, few-shot examples, format wyjścia). Najtańsze i najszybsze; twoje **pierwsze wyjście**.
- **RAG (retrieval-augmented generation)** — w momencie zapytania pobierz odpowiednie dokumenty (z vector store, bazy danych lub wyszukiwarki) i wstaw je do promptu. Model odpowiada *na podstawie* dostarczonego kontekstu. Najlepsze, gdy wiedza jest **zewnętrzna, prywatna lub zmienia się**.
- **Fine-tuning** — kontynuuj trening modelu na własnych przykładach, dostrajając jego **wagi**. To utrwala spójny styl, format lub wąską umiejętność. Potężne, ale kosztowne i **statyczne** — wiedza jest zamrożona w momencie treningu.

## Porównanie

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Zmienia** | Prompt | Prompt (+ retrieval) | Wagi modelu |
| **Najlepsze do** | Zachowanie, format, ton | Aktualne / prywatne fakty | Spójny styl, wąskie zadania |
| **Świeżość wiedzy** | N/A | Na żywo (re-indeksowanie danych) | Zamrożona w momencie treningu |
| **Koszt / wysiłek** | Najniższy | Średni (infra) | Najwyższy (trening + dane) |
| **Aktualizacja** | Edytuj tekst | Zaktualizuj indeks | Ponownie trenuj |

## Przewodnik decyzyjny

- Zacznij od **promptingu** — najpierw rozwiąż to za darmo.
- Potrzebujesz faktów, których model nie zna, lub które się zmieniają (dokumenty, ceny, wewnętrzne dane)? Użyj **RAG**.
- Potrzebujesz niezawodnego stylu/formatu lub specjalistycznego zadania na dużą skalę, a prompting nie jest wystarczająco spójny? **Fine-tune**.
- Te **łączą się**: model fine-tunowany z RAG-iem i dobrym promptem to powszechne rozwiązanie w produkcji.

## Dlaczego to ważne

Sięgnięcie po złe narzędzie jest kosztowne: ludzie często próbują fine-tunować, aby dodać wiedzę (co RAG robi lepiej i taniej) lub naprawić zachowanie (co prompting obsługuje). Wiedza, że **prompting kształtuje zachowanie, RAG dostarcza wiedzę, a fine-tuning zmienia model** pozwala ci wybrać najtańsze podejście, które działa — i celowo je łączyć zamiast przypadkowego mieszania.

	Prompt engineering	RAG	Fine-tuning
Zmienia	Prompt	Prompt (+ retrieval)	Wagi modelu
Najlepsze do	Zachowanie, format, ton	Aktualne / prywatne fakty	Spójny styl, wąskie zadania
Świeżość wiedzy	N/A	Na żywo (re-indeksowanie danych)	Zamrożona w momencie treningu
Koszt / wysiłek	Najniższy	Średni (infra)	Najwyższy (trening + dane)
Aktualizacja	Edytuj tekst	Zaktualizuj indeks	Ponownie trenuj