To są trzy sposoby, aby sprawić, że LLM robił to, co chcesz, działające na różnych warstwach: prompting kształtuje zachowanie, RAG wstrzykuje wiedzę, a fine-tuning zmienia model.
To są trzy sposoby, aby sprawić, że LLM robił to, co chcesz, działające na różnych warstwach: prompting kształtuje zachowanie, RAG wstrzykuje wiedzę, a fine-tuning zmienia model.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Zmienia | Prompt | Prompt (+ retrieval) | Wagi modelu |
| Najlepsze do | Zachowanie, format, ton | Aktualne / prywatne fakty | Spójny styl, wąskie zadania |
| Świeżość wiedzy | N/A | Na żywo (re-indeksowanie danych) | Zamrożona w momencie treningu |
| Koszt / wysiłek | Najniższy | Średni (infra) | Najwyższy (trening + dane) |
| Aktualizacja | Edytuj tekst | Zaktualizuj indeks | Ponownie trenuj |
Sięgnięcie po złe narzędzie jest kosztowne: ludzie często próbują fine-tunować, aby dodać wiedzę (co RAG robi lepiej i taniej) lub naprawić zachowanie (co prompting obsługuje). Wiedza, że prompting kształtuje zachowanie, RAG dostarcza wiedzę, a fine-tuning zmienia model pozwala ci wybrać najtańsze podejście, które działa — i celowo je łączyć zamiast przypadkowego mieszania.