감독되지 않는 학습은 레이블이 없는 데이터(주어진 답이 없음)에서 패턴과 구조를 찾습니다 — 그룹화, 차원 축소, 또는 이상 탐지를 자동으로 발견합니다. 데이터는 있지만 레이블이 없을 때 숨겨진 구조를 발견하는 데 사용됩니다.
감독되지 않는 학습이 작동하는 방식
UNSUPERVISED → learn from data WITHOUT labels (no given correct answers):
→ the algorithm finds STRUCTURE/patterns in the data on its own
→ no 'right answer' to learn from → it discovers groupings, relationships, or representations
→ for: exploring data, finding hidden structure, when labels are unavailable/expensive
주요 감독되지 않는 작업
CLUSTERING → group similar data points into clusters:
→ e.g. customer segmentation, grouping similar documents (k-means, hierarchical, DBSCAN)
DIMENSIONALITY REDUCTION → reduce features while preserving structure:
→ e.g. PCA → compress/visualize high-dimensional data; simplify for other models
ANOMALY DETECTION → find unusual/outlier data points:
→ e.g. fraud detection, defect detection, finding rare events
ASSOCIATION → find relationships (e.g. 'people who buy X also buy Y')
