Questi sono tre modi per fare quello che vuoi con un LLM, operando a livelli diversi: il prompting modella il comportamento, il RAG inietta conoscenza, e il fine-tuning cambia il modello.
Questi sono tre modi per fare quello che vuoi con un LLM, operando a livelli diversi: il prompting modella il comportamento, il RAG inietta conoscenza, e il fine-tuning cambia il modello.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Modifica | Il prompt | Il prompt (+ retrieval) | I pesi del modello |
| Migliore per | Comportamento, formato, tono | Fatti aggiornati / privati | Stile coerente, compiti specializzati |
| Freschezza della conoscenza | N/A | Live (re-indicizzazione dati) | Congelata al momento dell'addestramento |
| Costo / sforzo | Più basso | Medio (infrastruttura) | Più alto (addestramento + dati) |
| Aggiornamento | Modifica il testo | Aggiorna l'indice | Ri-addestramento |
Usare lo strumento sbagliato è costoso: le persone spesso cercano di fare fine-tuning per aggiungere conoscenza (che il RAG fa meglio e più economicamente) o per correggere il comportamento (che il prompting gestisce). Sapendo che il prompting modella il comportamento, il RAG fornisce conoscenza, e il fine-tuning cambia il modello, puoi scegliere l'approccio più economico che funziona — e combinarli deliberatamente anziché per caso.