Ce sont trois façons de faire faire à un LLM ce que vous voulez, fonctionnant à différentes couches : l'ingénierie des prompts façonne le comportement, la RAG injecte la connaissance, et le fine-tuning modifie le .
Ce sont trois façons de faire faire à un LLM ce que vous voulez, fonctionnant à différentes couches : l'ingénierie des prompts façonne le comportement, la RAG injecte la connaissance, et le fine-tuning modifie le .
| Ingénierie des prompts | RAG | Fine-tuning | |
|---|---|---|---|
| Modifie | Le prompt | Le prompt (+ récupération) | Les poids du modèle |
| Idéal pour | Comportement, format, ton | Faits à jour / privés | Style cohérent, tâches spécialisées |
| Fraîcheur de la connaissance | N/A | Actuelle (réindexer les données) | Figée au moment de l'entraînement |
| Coût / effort | Le plus bas | Moyen (infra) | Le plus élevé (entraînement + données) |
| Mise à jour | Éditer le texte | Mettre à jour l'index | Réentraîner |
Utiliser le mauvais outil est coûteux : les gens essaient souvent de fine-tuner pour ajouter de la connaissance (que la RAG fait mieux et moins cher) ou pour corriger le comportement (que l'ingénierie des prompts gère). Savoir que l'ingénierie des prompts façonne le comportement, la RAG fournit la connaissance, et le fine-tuning modifie le modèle vous permet de choisir l'approche la moins chère qui fonctionne — et de les combiner délibérément plutôt que par accident.