Η αξιολόγηση των μοντέλων ML σημαίνει μέτρηση της απόδοσής τους — χρησιμοποιώντας κατάλληλες μετρικές (accuracy, precision, recall, κ.λπ.) σε test data που το μοντέλο δεν έχει δει. Η σωστή αξιολόγηση είναι απαραίτητη για να γνωρίζετε αν ένα μοντέλο λειτουργεί πραγματικά και είναι αξιόπιστο.
Αξιολόγηση σε δεδομένα που δεν έχουν δει
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
