Die Evaluierung von ML-Modellen bedeutet, zu messen, wie gut sie funktionieren — unter Verwendung geeigneter Metriken (Genauigkeit, Präzision, Recall usw.) auf Testdaten, die das Modell noch nicht gesehen hat. Eine ordnungsgemäße Evaluierung ist essentiell, um zu wissen, ob ein Modell tatsächlich funktioniert und zuverlässig ist.
Warum es wichtig ist
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
