Was ist der Unterschied zwischen Prompt Engineering, RAG und Fine-Tuning, und wann verwendest du jeweils welches?

Question

Accepted Answer

Dies sind drei Möglichkeiten, um ein LLM das tun zu lassen, was du möchtest, und sie arbeiten auf **verschiedenen Ebenen**: Prompting formt das *Verhalten*, RAG injiziert *Wissen*, und Fine-Tuning ändert das *Modell*.

## Die drei Ansätze

- **Prompt Engineering** — forme das Verhalten des Modells durch Anweisungen, Kontext und Beispiele im Prompt. Nichts am Modell selbst ändert sich; du kommunizierst einfach besser (System Prompts, Few-Shot-Beispiele, Ausgabeformat). Am günstigsten und schnellsten; dein **erster Versuch**.
- **RAG (Retrieval-Augmented Generation)** — zur Abfragezeit werden relevante Dokumente (aus einem Vector Store, einer Datenbank oder Suche) abgerufen und in den Prompt eingefügt. Das Modell antwortet *aus* diesem bereitgestellten Kontext. Am besten, wenn das Wissen **extern, privat oder sich ändernde ist**.
- **Fine-Tuning** — setze das Training des Modells mit deinen eigenen Beispielen fort und passe seine **Gewichte** an. Dies verankert einen konsistenten Stil, ein Format oder eine spezialisierte Fähigkeit. Mächtig, aber kostspielig und **statisch** — das Wissen ist zum Trainingszeitpunkt eingefroren.

## Vergleich

| | Prompt Engineering | RAG | Fine-Tuning |
|---|---|---|---|
| **Ändert** | Den Prompt | Den Prompt (+ Retrieval) | Die Modellgewichte |
| **Am besten für** | Verhalten, Format, Ton | Aktuelle / private Fakten | Konsistenter Stil, spezialisierte Aufgaben |
| **Wissensfrichiheit** | N/A | Live (Daten neu indexieren) | Eingefroren beim Training |
| **Kosten / Aufwand** | Niedrigste | Mittel (Infrastruktur) | Höchste (Training + Daten) |
| **Aktualisierung** | Text bearbeiten | Index aktualisieren | Neu trainieren |

## Entscheidungsleitfaden

- Beginne mit **Prompting** — löse es zuerst kostenlos.
- Brauchst du Fakten, die das Modell nicht kennt, oder die sich ändern (Dokumente, Preise, interne Daten)? Verwende **RAG**.
- Brauchst du einen zuverlässigen Stil/Format oder eine spezialisierte Aufgabe in großem Maßstab, und Prompting ist nicht konsistent genug? **Fine-tune**.
- Diese **kombinieren sich**: Ein Fine-Tuned-Modell mit RAG und einem guten Prompt ist in der Produktion üblich.

## Warum es wichtig ist

Zum falschen Werkzeug zu greifen, ist teuer: Menschen versuchen oft, Fine-Tuning zu nutzen, um Wissen hinzuzufügen (was RAG besser und günstiger tut) oder um Verhalten zu korrigieren (was Prompting handhabt). Zu verstehen, dass **Prompting Verhalten formt, RAG Wissen liefert und Fine-Tuning das Modell ändert**, ermöglicht dir, den günstigsten funktionierenden Ansatz zu wählen — und sie bewusst zu kombinieren, anstatt es zufällig zu tun.

	Prompt Engineering	RAG	Fine-Tuning
Ändert	Den Prompt	Den Prompt (+ Retrieval)	Die Modellgewichte
Am besten für	Verhalten, Format, Ton	Aktuelle / private Fakten	Konsistenter Stil, spezialisierte Aufgaben
Wissensfrichiheit	N/A	Live (Daten neu indexieren)	Eingefroren beim Training
Kosten / Aufwand	Niedrigste	Mittel (Infrastruktur)	Höchste (Training + Daten)
Aktualisierung	Text bearbeiten	Index aktualisieren	Neu trainieren