Evaluiranje ML modela znači mjerenje kako dobro funkcioniraju — koristeći odgovarajuće metrike (točnost, preciznost, odziv, itd.) na test podacima koje model nije vidio. Pravilna evaluacija je bitna za znanje je li model zaista pouzdan i funkcionalan.
Evaluiranje na neviđenim podacima
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
