Koja je razlika između prompt engineering, RAG i fine-tuninga, i kada koristiš svaki od njih?

Question

Accepted Answer

Ovo su tri načina da natjeras LLM da radi ono što želiš, radeći na **različitim slojevima**: prompting oblikuje *ponašanje*, RAG ubacuje *znanje*, a fine-tuning mijenja *model*.

## Tri pristupa

- **Prompt engineering** — oblikuj ponašanje modela kroz upute, kontekst i primjere u promptu. Ništa se ne mijenja u samom modelu; samo komuniciraš bolje (sistemski prompti, few-shot primjeri, format izlaza). Najjeftinije i najbrže; tvoj **prvi izbor**.
- **RAG (retrieval-augmented generation)** — prilikom upita, preuzmi relevantne dokumente (iz vektorske pohrane, baze podataka ili pretrage) i umetni ih u prompt. Model odgovara *iz* tog dostavljenog konteksta. Najbolje kada je znanje **vanjsko, privatno ili mijenja se**.
- **Fine-tuning** — nastavi treniranje modela na tvojim primjerima, prilagođavajući njegove **težine**. Ovo fiksira konzistentan stil, format ili usku vještinu. Moćno ali skupo i **statičko** — znanje je zamrznuto u vrijeme treniranja.

## Usporedba

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Mijenja** | Prompt | Prompt (+ pretraga) | Težine modela |
| **Najbolje za** | Ponašanje, format, ton | Ažurne / privatne činjenice | Konzistentan stil, uske zadaće |
| **Svježina znanja** | N/A | Uživa (re-indeksiranje podataka) | Zamrznuto u vrijeme treniranja |
| **Trošak / napor** | Najniži | Srednji (infrastruktura) | Najveći (treniranje + podaci) |
| **Ažuriranje** | Uredi tekst | Ažuriraj indeks | Ponovo treniraj |

## Vodič odlučivanja

- Počni s **promptingom** — prvo ga riješi besplatno.
- Trebaš činjenice koje model ne zna, ili koje se mijenjaju (dokumenti, cijene, interni podaci)? Koristi **RAG**.
- Trebam pouzdanu stil/format ili specijalizirani zadatak u većoj skali, a prompting nije dovoljno konzistentan? **Fine-tune**.
- Ova tri **se kombiniraju**: fine-tunirani model s RAG i dobrim promptom je česta praksa u produkciji.

## Zašto je to važno

Seći se za krivi alat je skupo: ljudi često pokušavaju fine-tunirati da dodaju znanje (što RAG čini bolje i jeftinije) ili da isprave ponašanje (što prompting rješava). Znanje da **prompting oblikuje ponašanje, RAG opskrbljuje znanje, a fine-tuning mijenja model** omogućava ti odabrati najjeftiniji pristup koji funkcionira — i kombinirati ih namjerno umjesto slučajno.

	Prompt engineering	RAG	Fine-tuning
Mijenja	Prompt	Prompt (+ pretraga)	Težine modela
Najbolje za	Ponašanje, format, ton	Ažurne / privatne činjenice	Konzistentan stil, uske zadaće
Svježina znanja	N/A	Uživa (re-indeksiranje podataka)	Zamrznuto u vrijeme treniranja
Trošak / napor	Najniži	Srednji (infrastruktura)	Najveći (treniranje + podaci)
Ažuriranje	Uredi tekst	Ažuriraj indeks	Ponovo treniraj