Dies sind drei Möglichkeiten, um ein LLM das tun zu lassen, was du möchtest, und sie arbeiten auf verschiedenen Ebenen: Prompting formt das Verhalten, RAG injiziert Wissen, und Fine-Tuning ändert das .
Dies sind drei Möglichkeiten, um ein LLM das tun zu lassen, was du möchtest, und sie arbeiten auf verschiedenen Ebenen: Prompting formt das Verhalten, RAG injiziert Wissen, und Fine-Tuning ändert das .
| Prompt Engineering | RAG | Fine-Tuning | |
|---|---|---|---|
| Ändert | Den Prompt | Den Prompt (+ Retrieval) | Die Modellgewichte |
| Am besten für | Verhalten, Format, Ton | Aktuelle / private Fakten | Konsistenter Stil, spezialisierte Aufgaben |
| Wissensfrichiheit | N/A | Live (Daten neu indexieren) | Eingefroren beim Training |
| Kosten / Aufwand | Niedrigste | Mittel (Infrastruktur) | Höchste (Training + Daten) |
| Aktualisierung | Text bearbeiten | Index aktualisieren | Neu trainieren |
Zum falschen Werkzeug zu greifen, ist teuer: Menschen versuchen oft, Fine-Tuning zu nutzen, um Wissen hinzuzufügen (was RAG besser und günstiger tut) oder um Verhalten zu korrigieren (was Prompting handhabt). Zu verstehen, dass Prompting Verhalten formt, RAG Wissen liefert und Fine-Tuning das Modell ändert, ermöglicht dir, den günstigsten funktionierenden Ansatz zu wählen — und sie bewusst zu kombinieren, anstatt es zufällig zu tun.