Wat is het verschil tussen prompt engineering, RAG en fine-tuning, en wanneer gebruik je elk?

Question

Accepted Answer

Dit zijn drie manieren om een LLM te laten doen wat je wilt, werkend op **verschillende lagen**: prompting vormt het *gedrag*, RAG injecteert *kennis*, en fine-tuning verandert het *model*.

## De drie benaderingen

- **Prompt engineering** — vorm het gedrag van het model door instructies, context en voorbeelden in de prompt. Niets aan het model verandert; je communiceert alleen beter (systeemvragen, few-shot voorbeelden, uitvoerformat). Goedkoopst en snelst; je **eerste keus**.
- **RAG (retrieval-augmented generation)** — bij het stellen van een vraag haalt u relevante documenten op (uit een vector store, database of zoekopdracht) en voegt deze in de prompt in. Het model antwoordt *vanuit* die geleverde context. Het beste wanneer de kennis **extern, privé of veranderend** is.
- **Fine-tuning** — traineer het model verder op uw eigen voorbeelden en pas de **gewichten** aan. Dit bakt een consistent stijl, format of beperkte vaardigheid in. Krachtig maar kostbaar en **statisch** — de kennis is bevroren op trainingsjabber.

## Vergelijking

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Verandert** | De prompt | De prompt (+ ophalen) | De modelgewichten |
| **Geschikt voor** | Gedrag, format, toon | Actuele / privéfeiten | Consistente stijl, beperkte taken |
| **Versheid van kennis** | N.v.t. | Live (herindex data) | Bevroren op trainingstijd |
| **Kosten / inspanning** | Laagst | Gemiddeld (infrastructuur) | Hoogst (training + data) |
| **Bijwerken** | Tekst bewerken | De index bijwerken | Opnieuw trainen |

## Beslissingsgids

- Begin met **prompting** — los het eerst gratis op.
- Heb je feiten nodig die het model niet kent, of die veranderen (documenten, prijzen, interne data)? Gebruik **RAG**.
- Heb je een betrouwbare stijl/format of een gespecialiseerde taak op schaal nodig, en prompting is niet consistent genoeg? **Fine-tune**.
- Deze **combineren**: een fine-tuned model met RAG en een goede prompt is gebruikelijk in productie.

## Waarom het belangrijk is

Het grijpen naar het verkeerde hulpmiddel is duur: mensen proberen vaak fine-tuning om kennis toe te voegen (wat RAG beter en goedkoper doet) of om gedrag op te lossen (wat prompting aanpakt). Weten dat **prompting gedrag vormgeeft, RAG kennis levert, en fine-tuning het model verandert** laat je de goedkoopste aanpak kiezen die werkt — en ze bewust combineren in plaats van per ongeluk.

	Prompt engineering	RAG	Fine-tuning
Verandert	De prompt	De prompt (+ ophalen)	De modelgewichten
Geschikt voor	Gedrag, format, toon	Actuele / privéfeiten	Consistente stijl, beperkte taken
Versheid van kennis	N.v.t.	Live (herindex data)	Bevroren op trainingstijd
Kosten / inspanning	Laagst	Gemiddeld (infrastructuur)	Hoogst (training + data)
Bijwerken	Tekst bewerken	De index bijwerken	Opnieuw trainen