مشین لرننگ ماڈلز کا جائزہ لینا اس بات کی پیمائش کرنا ہے کہ وہ کتنی اچھی کارکردگی دیتے ہیں — مناسب metrics (accuracy، precision، recall، وغیرہ) استعمال کرتے ہوئے test data پر جو ماڈل نے پہلے سے نہیں دیکھا۔ صحیح جائزہ لینا ضروری ہے تاکہ معلوم ہو کہ ماڈل واقعی کام کرتا ہے اور قابل اعتماد ہے۔
غیر دیکھے گئے ڈیٹا پر تشخیص
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
