Chuẩn hóa (normalization) là quá trình tổ chức dữ liệu để giảm dư thừa và cải thiện tính toàn vẹn bằng cách tách dữ liệu thành các bảng liên quan, tuân theo một loạt "dạng chuẩn (normal form)". Mục tiêu: mỗi mẩu dữ liệu được lưu một lần, tránh trùng lặp và các bất thường mà nó gây ra.
Vấn đề: một bảng phi chuẩn hóa (dư thừa)
❌ bảng orders chứa mọi thứ ở một chỗ — dữ liệu bị TRÙNG LẶP:
order_id | customer_name | customer_email | product | price
1 | Ann | [email protected] | Phone | 999
2 | Ann | [email protected] | Case | 20 ← thông tin của Ann bị lặp lại!
Vấn đề (bất thường):
✗ Bất thường khi UPDATE — đổi email của Ann → phải cập nhật MỌI đơn hàng của cô ấy
✗ Bất thường khi INSERT — không thể thêm một khách hàng nếu không có đơn hàng
✗ Bất thường khi DELETE — xóa đơn hàng cuối của Ann làm mất hẳn thông tin của cô ấy
✗ Lãng phí lưu trữ và rủi ro không nhất quán
