Att utvärdera ML-modeller innebär att mäta hur väl de presterar — med lämpliga mätvärden (noggrannhet, precision, återkallelse, etc.) på testdata som modellen inte har sett tidigare. Korrekt utvärdering är väsentlig för att veta om en modell faktiskt fungerar och är tillförlitlig.
Utvärdering på osedd data
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
