ઓવરફિટિંગ (મોડેલ ટ્રેનિંગ ડેટાને મેમોરાઈઝ કરે છે અને નવા ડેટા પર નિષ્ફળ જાય છે) અને અન્ડરફિટિંગ (મોડેલ પેટર્નને કેપ્ચર કરવા માટે ખૂબ સરળ છે) એ ML માં બે મૌલિક સમસ્યાઓ છે. તેમને સંતુલિત કરવું — સારી જનરેલાઈઝેશન હાંસલ કરવી — અસરકારક મોડેલ બનાવવા માટે કેન્દ્રીય છે.
ઓવરફિટિંગ વિ અન્ડરફિટિંગ
OVERFITTING → the model learns the training data TOO well (including noise) →
→ performs great on training data but POORLY on new/unseen data (doesn't generalize)
→ too complex; memorizes rather than learns general patterns
→ like memorizing answers vs understanding the concept
UNDERFITTING → the model is TOO SIMPLE to capture the underlying patterns →
→ performs poorly on BOTH training and new data
→ not enough complexity/capacity to learn the patterns
→ the goal is GENERALIZATION: learn real patterns → perform well on NEW data
