मशीन लर्निंग मॉडेल्सचे मूल्यांकन म्हणजे ते कितीतरी चांगल्या प्रकारे कार्य करतात हे मोजणे — योग्य मेट्रिक्स (अचूकता, precision, recall, इ.) वापरून चाचणी डेटावर जो मॉडेलने पाहिलेला नाही. योग्य मूल्यांकन आवश्यक आहे हे जाणून घेण्यासाठी की मॉडेल खरोखर कार्य करतो आणि विश्वासार्ह आहे.
न पाहिलेल्या डेटावर मूल्यांकन
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
