Ovo su tri načina da natjeras LLM da radi ono što želiš, radeći na različitim slojevima: prompting oblikuje ponašanje, RAG ubacuje znanje, a fine-tuning mijenja model.
Ovo su tri načina da natjeras LLM da radi ono što želiš, radeći na različitim slojevima: prompting oblikuje ponašanje, RAG ubacuje znanje, a fine-tuning mijenja model.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Mijenja | Prompt | Prompt (+ pretraga) | Težine modela |
| Najbolje za | Ponašanje, format, ton | Ažurne / privatne činjenice | Konzistentan stil, uske zadaće |
| Svježina znanja | N/A | Uživa (re-indeksiranje podataka) | Zamrznuto u vrijeme treniranja |
| Trošak / napor | Najniži | Srednji (infrastruktura) | Najveći (treniranje + podaci) |
| Ažuriranje | Uredi tekst | Ažuriraj indeks | Ponovo treniraj |
Seći se za krivi alat je skupo: ljudi često pokušavaju fine-tunirati da dodaju znanje (što RAG čini bolje i jeftinije) ili da isprave ponašanje (što prompting rješava). Znanje da prompting oblikuje ponašanje, RAG opskrbljuje znanje, a fine-tuning mijenja model omogućava ti odabrati najjeftiniji pristup koji funkcionira — i kombinirati ih namjerno umjesto slučajno.