Acestea sunt trei moduri de a face un LLM să facă ceea ce dorești, funcționând la niveluri diferite: prompting-ul modelează comportamentul, RAG injectează cunoștințe, și fine-tuning-ul schimbă modelul.
Acestea sunt trei moduri de a face un LLM să facă ceea ce dorești, funcționând la niveluri diferite: prompting-ul modelează comportamentul, RAG injectează cunoștințe, și fine-tuning-ul schimbă modelul.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Schimbări | Promptul | Promptul (+ retrieval) | Greutățile modelului |
| Cel mai bun pentru | Comportament, format, ton | Fapte actualizate / private | Stil consistent, sarcini înguste |
| Actualitatea cunoștințelor | N/A | Live (re-index date) | Înghețate la momentul antrenării |
| Cost / efort | Cel mai mic | Mediu (infra) | Cel mai mare (antrenare + date) |
| Actualizare | Editează textul | Actualizează indexul | Re-antrenare |
A folosi instrumentul greșit este costisitor: oamenii încearcă adesea să fină-ajusteze pentru a adăuga cunoștințe (pe care RAG o face mai bine și mai ieftin) sau pentru a corecta comportamentul (pe care prompting-ul o gestionează). Știind că prompting-ul modelează comportamentul, RAG furnizează cunoștințe, și fine-tuning-ul schimbă modelul te permite să alegi cea mai ieftină abordare care funcționează — și să le combini deliberat mai degrabă decât din întâmplare.