Machine learning modellen evalueren betekent meten hoe goed ze presteren — met behulp van passende metreken (nauwkeurigheid, precisie, recall, etc.) op testdata die het model niet heeft gezien. Juiste evaluatie is essentieel om te weten of een model daadwerkelijk werkt en betrouwbaar is.
Evaluatie op onzichtbare data
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
