Vad är skillnaden mellan prompt engineering, RAG och fine-tuning, och när använder du var och en?

Question

Accepted Answer

Dessa är tre sätt att få en LLM att göra det du vill, och de arbetar på **olika nivåer**: prompting formar *beteende*, RAG injicerar *kunskap*, och fine-tuning ändrar *modellen*.

## De tre tillvagagångssätten

- **Prompt engineering** — forma modellens beteende genom instruktioner, kontext och exempel i prompten. Ingenting om modellen ändras; du kommunicerar bara bättre (systemprompts, few-shot-exempel, utdataformat). Billigast och snabbast; ditt **första val**.
- **RAG (retrieval-augmented generation)** — hämta relevanta dokument (från ett vektorlager, databas eller sökning) vid frågetidpunkten och infoga dem i prompten. Modellen svarar *från* den tillhandahållna kontexten. Bäst när kunskapen är **extern, privat eller föränderlig**.
- **Fine-tuning** — fortsätt träna modellen på dina egna exempel och justera dess **vikter**. Detta bäddar in en konsekvent stil, format eller snäv skicklighet. Kraftfull men dyr och **statisk** — kunskapen är fryst vid träningstillfället.

## Jämförelse

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Ändrar** | Prompten | Prompten (+ hämtning) | Modellvikterna |
| **Bäst för** | Beteende, format, ton | Uppdaterade / privata fakta | Konsekvent stil, snäva uppgifter |
| **Kunskapsaktualitet** | N/A | Live (indexera data på nytt) | Fryst vid träningstid |
| **Kostnad / ansträngning** | Lägst | Medel (infrastruktur) | Högst (träning + data) |
| **Uppdatering** | Redigera text | Uppdatera indexet | Träna på nytt |

## Beslutsguide

- Börja med **prompting** — lös det gratis först.
- Behöver du fakta som modellen inte vet, eller som förändras (dokument, priser, interna data)? Använd **RAG**.
- Behöver du en tillförlitlig stil/format eller en specialiserad uppgift i stor skala, och prompting är inte tillräckligt konsekvent? **Fine-tune**.
- Dessa **kombineras**: en fine-tunad modell med RAG och en bra prompt är vanligt i produktion.

## Varför det spelar roll

Att välja fel verktyg är dyrt: människor försöker ofta fine-tune för att lägga till kunskap (vilket RAG gör bättre och billigare) eller för att åtgärda beteende (vilket prompting hanterar). Att veta att **prompting formar beteende, RAG tillhandahåller kunskap och fine-tuning ändrar modellen** låter dig välja det billigaste tillvagagångssättet som fungerar — och kombinera dem medvetet snarare än av en slump.

	Prompt engineering	RAG	Fine-tuning
Ändrar	Prompten	Prompten (+ hämtning)	Modellvikterna
Bäst för	Beteende, format, ton	Uppdaterade / privata fakta	Konsekvent stil, snäva uppgifter
Kunskapsaktualitet	N/A	Live (indexera data på nytt)	Fryst vid träningstid
Kostnad / ansträngning	Lägst	Medel (infrastruktur)	Högst (träning + data)
Uppdatering	Redigera text	Uppdatera indexet	Träna på nytt