Supervised learning huấn luyện một model trên các ví dụ có nhãn (input ghép với output đúng) để nó học cách dự đoán output cho input mới. Đây là loại ML phổ biến nhất, dùng cho classification và regression. Hiểu nó giúp đào sâu kiến thức ML.
Cách supervised learning hoạt động
HUẤN LUYỆN trên dữ liệu CÓ NHÃN (input → output đúng đã biết):
1. thu thập một TẬP DỮ LIỆU các ví dụ có nhãn (vd email gắn nhãn spam/không-spam)
2. chia thành tập TRAINING và TEST
3. model học cách ánh xạ input → output bằng cách tối thiểu hóa lỗi dự đoán trên dữ liệu training
4. ĐÁNH GIÁ trên tập test (dữ liệu chưa thấy) → đo mức độ tổng quát hóa
5. dùng model đã huấn luyện để DỰ ĐOÁN output cho input mới (inference)
→ học từ các ví dụ có đáp án → dự đoán đáp án cho các trường hợp mới
