Qual è la differenza tra prompt engineering, RAG e fine-tuning, e quando utilizzi ciascuno?

Question

Accepted Answer

Questi sono tre modi per fare quello che vuoi con un LLM, operando a **livelli diversi**: il prompting modella il *comportamento*, il RAG inietta *conoscenza*, e il fine-tuning cambia il *modello*.

## I tre approcci

- **Prompt engineering** — modella il comportamento del modello attraverso istruzioni, contesto ed esempi nel prompt. Nulla nel modello cambia; comunichi semplicemente meglio (system prompts, few-shot examples, formato output). Il più economico e veloce; il tuo **primo tentativo**.
- **RAG (retrieval-augmented generation)** — al momento della query, recupera documenti rilevanti (da un vector store, database o ricerca) e inseriscili nel prompt. Il modello risponde *basandosi su* il contesto fornito. Migliore quando la conoscenza è **esterna, privata o in continuo cambiamento**.
- **Fine-tuning** — continua l'addestramento del modello sui tuoi esempi, regolando i suoi **pesi**. Questo incorpora uno stile, un formato o un'abilità specializzata coerente. Potente ma costoso e **statico** — la conoscenza è congelata al momento dell'addestramento.

## Confronto

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Modifica** | Il prompt | Il prompt (+ retrieval) | I pesi del modello |
| **Migliore per** | Comportamento, formato, tono | Fatti aggiornati / privati | Stile coerente, compiti specializzati |
| **Freschezza della conoscenza** | N/A | Live (re-indicizzazione dati) | Congelata al momento dell'addestramento |
| **Costo / sforzo** | Più basso | Medio (infrastruttura) | Più alto (addestramento + dati) |
| **Aggiornamento** | Modifica il testo | Aggiorna l'indice | Ri-addestramento |

## Guida alle decisioni

- Inizia con **prompting** — risolvi il problema gratuitamente prima.
- Hai bisogno di fatti che il modello non conosce, o che cambiano (documenti, prezzi, dati interni)? Usa **RAG**.
- Hai bisogno di uno stile/formato affidabile o di un compito specializzato su larga scala, e il prompting non è sufficientemente coerente? **Fine-tuning**.
- Questi **si combinano**: un modello fine-tuned con RAG e un buon prompt è comune in produzione.

## Perché è importante

Usare lo strumento sbagliato è costoso: le persone spesso cercano di fare fine-tuning per aggiungere conoscenza (che il RAG fa meglio e più economicamente) o per correggere il comportamento (che il prompting gestisce). Sapendo che **il prompting modella il comportamento, il RAG fornisce conoscenza, e il fine-tuning cambia il modello**, puoi scegliere l'approccio più economico che funziona — e combinarli deliberatamente anziché per caso.

	Prompt engineering	RAG	Fine-tuning
Modifica	Il prompt	Il prompt (+ retrieval)	I pesi del modello
Migliore per	Comportamento, formato, tono	Fatti aggiornati / privati	Stile coerente, compiti specializzati
Freschezza della conoscenza	N/A	Live (re-indicizzazione dati)	Congelata al momento dell'addestramento
Costo / sforzo	Più basso	Medio (infrastruttura)	Più alto (addestramento + dati)
Aggiornamento	Modifica il testo	Aggiorna l'indice	Ri-addestramento