Mi a különbség a prompt engineering, a RAG és a fine-tuning között, és mikor használj egyet-egyet?

Question

Accepted Answer

Ez három módja annak, hogy az LLM azt tegyen, amit szeretnél, **különböző rétegeken működve**: a prompt engineering az *viselkedést* formálja, a RAG *tudást* injektál, a fine-tuning pedig a *modellt* változtatja meg.

## A három megközelítés

- **Prompt engineering** — az utasítások, kontextus és példák segítségével alakítsd a modell viselkedését. A modell semmit sem változik; csak jobban kommunikálsz (rendszer promptok, few-shot példák, output formátum). A legolcsóbb és leggyorsabb; az **első választásod**.
- **RAG (retrieval-augmented generation)** — a lekérdezés idején releváns dokumentumokat retriewalj (vektor tárból, adatbázisból vagy keresésből) és szúrd be őket a promptba. A modell az *adott* kontextusból válaszol. Akkor a legjobb, ha a tudás **külső, privát vagy változó**.
- **Fine-tuning** — folytasd a modell képzését saját példákon, az **súlyok** módosítása révén. Ez konzisztens stílust, formátumot vagy szűk képességet süllyeszt bele. Erőteljes, de költséges és **statikus** — a tudás a képzés idején fagyasztódik be.

## Összehasonlítás

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Amit módosít** | A promptot | A promptot (+ retrieval-t) | A modell súlyait |
| **Mire jó** | Viselkedés, formátum, hang | Naprakész / privát tények | Konzisztens stílus, szűk feladatok |
| **Tudás frissessége** | N/A | Élő (újra indexelve az adat) | Fagyasztva a képzés idején |
| **Költség / erőfeszítés** | Legalacsonyabb | Közepes (infrastruktúra) | Legmagasabb (képzés + adat) |
| **Frissítés** | Szöveg szerkesztése | Az index frissítése | Újra képzés |

## Döntéshozatali útmutató

- Kezdd a **prompt engineering**-gel — először ingyen oldd meg.
- Szüksége van olyan tényekre, amelyeket a modell nem ismer, vagy amelyek változnak (dokumentumok, árak, belső adatok)? Használj **RAG**-et.
- Szükséges egy megbízható stílus/formátum vagy egy specializált feladat nagy léptékben, és a prompt engineering nem elég konzisztens? **Fine-tune**.
- Ezek **kombinálódnak**: egy fine-tunezett modell RAG-gel és egy jó prompttal gyakori a produkció során.

## Miért fontos

A rossz eszköz választása drága: az emberek gyakran próbálnak fine-tunezni a tudás hozzáadásához (amit a RAG jobban és olcsóbban csinál) vagy a viselkedés javításához (amit a prompt engineering kezel). Annak tudatában, hogy a **prompt engineering a viselkedést formálja, a RAG a tudást biztosítja, és a fine-tuning a modellt változtatja**, kiválaszthatod a legolcsóbb megközelítést, amely működik — és szándékosan kombinálhatod őket ahelyett, hogy véletlenül tenéd.

	Prompt engineering	RAG	Fine-tuning
Amit módosít	A promptot	A promptot (+ retrieval-t)	A modell súlyait
Mire jó	Viselkedés, formátum, hang	Naprakész / privát tények	Konzisztens stílus, szűk feladatok
Tudás frissessége	N/A	Élő (újra indexelve az adat)	Fagyasztva a képzés idején
Költség / erőfeszítés	Legalacsonyabb	Közepes (infrastruktúra)	Legmagasabb (képzés + adat)
Frissítés	Szöveg szerkesztése	Az index frissítése	Újra képzés