Оценка моделей ML означает измерение их производительности — использование соответствующих метрик (accuracy, precision, recall и т.д.) на тестовых данных, которые модель не видела. Правильная оценка необходима для определения того, действительно ли модель работает и является надежной.
Оценка на невидимых данных
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
