মেশিন লার্নিং মডেলগুলি মূল্যায়ন করার অর্থ হল তারা কতভাল পারফর্ম করছে তা পরিমাপ করা — উপযুক্ত metrics (accuracy, precision, recall, ইত্যাদি) ব্যবহার করে test data-তে যা মডেলটি কখনো দেখেনি। সঠিক মূল্যায়ন অপরিহার্য কারণ এটি জানার জন্য যে একটি মডেল আসলে কাজ করে এবং নির্ভরযোগ্য।
অদেখা ডেটায় মূল্যায়ন
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
