Ez három módja annak, hogy az LLM azt tegyen, amit szeretnél, különböző rétegeken működve: a prompt engineering az viselkedést formálja, a RAG tudást injektál, a fine-tuning pedig a modellt változtatja meg.
Ez három módja annak, hogy az LLM azt tegyen, amit szeretnél, különböző rétegeken működve: a prompt engineering az viselkedést formálja, a RAG tudást injektál, a fine-tuning pedig a modellt változtatja meg.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Amit módosít | A promptot | A promptot (+ retrieval-t) | A modell súlyait |
| Mire jó | Viselkedés, formátum, hang | Naprakész / privát tények | Konzisztens stílus, szűk feladatok |
| Tudás frissessége | N/A | Élő (újra indexelve az adat) | Fagyasztva a képzés idején |
| Költség / erőfeszítés | Legalacsonyabb | Közepes (infrastruktúra) | Legmagasabb (képzés + adat) |
| Frissítés | Szöveg szerkesztése | Az index frissítése | Újra képzés |
A rossz eszköz választása drága: az emberek gyakran próbálnak fine-tunezni a tudás hozzáadásához (amit a RAG jobban és olcsóbban csinál) vagy a viselkedés javításához (amit a prompt engineering kezel). Annak tudatában, hogy a prompt engineering a viselkedést formálja, a RAG a tudást biztosítja, és a fine-tuning a modellt változtatja, kiválaszthatod a legolcsóbb megközelítést, amely működik — és szándékosan kombinálhatod őket ahelyett, hogy véletlenül tenéd.