Mašininio mokymo modelių vertinimas reiškia matavimą, kaip gerai jie veikia — naudojant atitinkamas metrikos (tikslumą, precizikumą, pilnumą ir kt.) testiniuose duomenimis, kuriuos modelis anksčiau nematė. Tinkamas vertinimas yra būtinas norint sužinoti, ar modelis iš tikrųjų veikia ir yra patikimas.
Vertinimas nematytais duomenimis
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
