Overfitting は model が training data を memorizing し、新しい data で失敗することです。Underfitting は model が単純すぎて pattern を捉えられないことです。両者の balance を取り、良い generalization を得ることが effective model 作成の中心です。
Overfitting vs underfitting
text
OVERFITTING → training data を TOO well に学ぶ (noise まで含む):
→ training data では great、new/unseen data では POOR
→ model が complex すぎ、general pattern ではなく memorization になる
UNDERFITTING → model が TOO SIMPLE で underlying patterns を capture できない:
→ training data と new data の BOTH で poor performance
→ goal は GENERALIZATION: real patterns を学び NEW data で良く動くこと
見分け方
text
→ OVERFITTING → high training accuracy, LOW test accuracy (big gap)
→ UNDERFITTING → LOW training AND test accuracy
→ GOOD FIT → good training AND test accuracy
