La normalisation est le processus d'organisation des données pour réduire la redondance et améliorer l'intégrité en divisant les données en tables associées, en suivant une série de « formes normales ». L'objectif : chaque donnée est stockée une seule fois, en évitant la duplication et les anomalies qu'elle provoque.
Le problème : une table dénormalisée (redondante)
❌ orders table with everything in one place — data is DUPLICATED:
order_id | customer_name | customer_email | product | price
1 | Ann | [email protected] | Phone | 999
2 | Ann | [email protected] | Case | 20 ← Ann's info repeated!
Problems (anomalies):
✗ UPDATE anomaly — change Ann's email → must update EVERY one of her orders
✗ INSERT anomaly — can't add a customer without an order
✗ DELETE anomaly — deleting Ann's last order loses her info entirely
✗ Wasted storage and inconsistency risk
