Evaluar modelos de ML significa medir qué tan bien funcionan — usando métricas apropiadas (accuracy, precision, recall, etc.) en datos de prueba que el modelo no ha visto. La evaluación adecuada es esencial para saber si un modelo realmente funciona y es confiable.
Por qué es importante
→ evaluate on a TEST set the model did NOT train on → measures GENERALIZATION (real performance)
→ training accuracy alone is misleading (a model can memorize training data)
→ train/validation/test split; cross-validation → reliable performance estimates
