Dessa är tre sätt att få en LLM att göra det du vill, och de arbetar på olika nivåer: prompting formar beteende, RAG injicerar kunskap, och fine-tuning ändrar modellen.
Dessa är tre sätt att få en LLM att göra det du vill, och de arbetar på olika nivåer: prompting formar beteende, RAG injicerar kunskap, och fine-tuning ändrar modellen.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Ändrar | Prompten | Prompten (+ hämtning) | Modellvikterna |
| Bäst för | Beteende, format, ton | Uppdaterade / privata fakta | Konsekvent stil, snäva uppgifter |
| Kunskapsaktualitet | N/A | Live (indexera data på nytt) | Fryst vid träningstid |
| Kostnad / ansträngning | Lägst | Medel (infrastruktur) | Högst (träning + data) |
| Uppdatering | Redigera text | Uppdatera indexet | Träna på nytt |
Att välja fel verktyg är dyrt: människor försöker ofta fine-tune för att lägga till kunskap (vilket RAG gör bättre och billigare) eller för att åtgärda beteende (vilket prompting hanterar). Att veta att prompting formar beteende, RAG tillhandahåller kunskap och fine-tuning ändrar modellen låter dig välja det billigaste tillvagagångssättet som fungerar — och kombinera dem medvetet snarare än av en slump.