ML મોડલોનું મૂલ્યાંકન એટલે તેઓ કેટલી સારી રીતે કાર્ય કરે છે તે માપવું — યોગ્ય મેટ્રિક્સ (accuracy, precision, recall, વગેરે) નો ઉપયોગ કરીને ટેસ્ટ ડેટા પર જે મોડલે ક્યારેય જોયો નથી. યોગ્ય મૂલ્યાંકન આવશ્યક છે કારણ કે તમને જાણવું પડે છે કે મોડલ ખરેખર કાર્ય કરે છે અને વિશ્વસનીય છે કે નહીં.
અનદેખા ડેટા પર મૂલ્યાંકન
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
