Dit zijn drie manieren om een LLM te laten doen wat je wilt, werkend op verschillende lagen: prompting vormt het gedrag, RAG injecteert kennis, en fine-tuning verandert het model.
Dit zijn drie manieren om een LLM te laten doen wat je wilt, werkend op verschillende lagen: prompting vormt het gedrag, RAG injecteert kennis, en fine-tuning verandert het model.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Verandert | De prompt | De prompt (+ ophalen) | De modelgewichten |
| Geschikt voor | Gedrag, format, toon | Actuele / privéfeiten | Consistente stijl, beperkte taken |
| Versheid van kennis | N.v.t. | Live (herindex data) | Bevroren op trainingstijd |
| Kosten / inspanning | Laagst | Gemiddeld (infrastructuur) | Hoogst (training + data) |
| Bijwerken | Tekst bewerken | De index bijwerken | Opnieuw trainen |
Het grijpen naar het verkeerde hulpmiddel is duur: mensen proberen vaak fine-tuning om kennis toe te voegen (wat RAG beter en goedkoper doet) of om gedrag op te lossen (wat prompting aanpakt). Weten dat prompting gedrag vormgeeft, RAG kennis levert, en fine-tuning het model verandert laat je de goedkoopste aanpak kiezen die werkt — en ze bewust combineren in plaats van per ongeluk.