**지도학습(supervised learning)**은 레이블이 있는 예시(입력과 정답 출력의 쌍)로 모델을 훈련해 새 입력에 대한 출력을 예측하도록 합니다. 가장 흔한 ML 유형으로 분류와 회귀에 사용됩니다. 이를 이해하면 ML 지식이 깊어집니다.
지도학습 작동 방식
레이블 있는 데이터로 훈련(입력 → 알려진 정답 출력):
1. 레이블이 있는 예시 DATASET 수집(예: 스팸/비스팸으로 레이블된 이메일)
2. 훈련 세트와 테스트 세트로 분할
3. model이 훈련 데이터에서 예측 오차를 최소화하며 입력 → 출력을 매핑하는 법을 학습
4. 테스트 세트(미본 데이터)로 EVALUATE → 일반화 정도를 측정
5. 훈련된 model로 새 입력의 출력을 PREDICT(추론)
→ 정답이 있는 예시로 학습 → 새 경우의 정답을 예측
분류 vs 회귀
분류(CLASSIFICATION) → 범주(이산 클래스)를 예측:
→ 스팸/비스팸, 고양이/개, 질병/비질병, 감정(긍정/부정)
회귀(REGRESSION) → 연속적인 수치(값)를 예측:
→ 집값, 온도, 수요, 나이
→ 둘 다 지도(레이블 있는 예시로 학습); 출력 유형이 다름
