Quelle est la différence entre l'ingénierie des prompts, la RAG et le fine-tuning, et quand utilisez-vous chacun ?

Question

Accepted Answer

Ce sont trois façons de faire faire à un LLM ce que vous voulez, fonctionnant à **différentes couches** : l'ingénierie des prompts façonne le *comportement*, la RAG injecte la *connaissance*, et le fine-tuning modifie le *modèle*.

## Les trois approches

- **Ingénierie des prompts** — façonner le comportement du modèle par des instructions, du contexte et des exemples dans le prompt. Rien ne change dans le modèle ; vous communiquez juste mieux (prompts système, exemples few-shot, format de sortie). Le moins cher et le plus rapide ; votre **premier recours**.
- **RAG (retrieval-augmented generation)** — au moment de la requête, récupérer les documents pertinents (d'un vector store, d'une base de données ou d'une recherche) et les insérer dans le prompt. Le modèle répond *à partir de* ce contexte fourni. Idéal quand la connaissance est **externe, privée ou changeante**.
- **Fine-tuning** — continuer l'entraînement du modèle sur vos propres exemples, en ajustant ses **poids**. Cela intègre un style cohérent, un format ou une compétence spécialisée. Puissant mais coûteux et **statique** — la connaissance est figée au moment de l'entraînement.

## Comparaison

| | Ingénierie des prompts | RAG | Fine-tuning |
|---|---|---|---|
| **Modifie** | Le prompt | Le prompt (+ récupération) | Les poids du modèle |
| **Idéal pour** | Comportement, format, ton | Faits à jour / privés | Style cohérent, tâches spécialisées |
| **Fraîcheur de la connaissance** | N/A | Actuelle (réindexer les données) | Figée au moment de l'entraînement |
| **Coût / effort** | Le plus bas | Moyen (infra) | Le plus élevé (entraînement + données) |
| **Mise à jour** | Éditer le texte | Mettre à jour l'index | Réentraîner |

## Guide de décision

- Commencer par les **prompts** — résolvez-le gratuitement d'abord.
- Avez-vous besoin de faits que le modèle ne connaît pas, ou qui changent (documents, prix, données internes) ? Utilisez la **RAG**.
- Avez-vous besoin d'un style/format fiable ou d'une tâche spécialisée à grande échelle, et l'ingénierie des prompts n'est pas assez cohérente ? **Fine-tuner**.
- Ces approches **se combinent** : un modèle fine-tuné avec RAG et un bon prompt est courant en production.

## Pourquoi c'est important

Utiliser le mauvais outil est coûteux : les gens essaient souvent de fine-tuner pour ajouter de la connaissance (que la RAG fait mieux et moins cher) ou pour corriger le comportement (que l'ingénierie des prompts gère). Savoir que **l'ingénierie des prompts façonne le comportement, la RAG fournit la connaissance, et le fine-tuning modifie le modèle** vous permet de choisir l'approche la moins chère qui fonctionne — et de les combiner délibérément plutôt que par accident.

	Ingénierie des prompts	RAG	Fine-tuning
Modifie	Le prompt	Le prompt (+ récupération)	Les poids du modèle
Idéal pour	Comportement, format, ton	Faits à jour / privés	Style cohérent, tâches spécialisées
Fraîcheur de la connaissance	N/A	Actuelle (réindexer les données)	Figée au moment de l'entraînement
Coût / effort	Le plus bas	Moyen (infra)	Le plus élevé (entraînement + données)
Mise à jour	Éditer le texte	Mettre à jour l'index	Réentraîner