Évaluer les modèles ML signifie mesurer leurs performances — en utilisant des métriques appropriées (accuracy, precision, recall, etc.) sur des données de test que le modèle n'a pas vues. Une évaluation appropriée est essentielle pour savoir si un modèle fonctionne réellement et est fiable.
Évaluation sur des données non vues
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
