მანქანური სწავლის მოდელების შეფასება ნიშნავს მათი წარმადობის შემფასებას — შესაბამის მეტრიკების (accuracy, precision, recall და ა.შ.) გამოყენებით ტესტ მონაცემებზე, რომელიც მოდელმა ადრე არ ნახა. სათანადო შეფასება აუცილებელია იმის জন্য, რომ იცოდეთ, მოდელი ნამდვილად მუშაობს თუ არა და საიმედოა.
დაუვიწყო მონაცემებზე შეფასება
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
