Normalisierung ist der Prozess, Daten so zu organisieren, dass Redundanz reduziert und die Integrität verbessert wird, indem Daten in zusammenhängende Tabellen aufgeteilt werden, wobei einer Reihe von "Normalformen" gefolgt wird. Das Ziel: Jede Information wird einmal gespeichert, wodurch Duplizierung und die dadurch verursachten Anomalien vermieden werden.
Das Problem: eine denormalisierte (redundante) Tabelle
❌ orders table with everything in one place — data is DUPLICATED:
order_id | customer_name | customer_email | product | price
1 | Ann | [email protected] | Phone | 999
2 | Ann | [email protected] | Case | 20 ← Ann's info repeated!
Problems (anomalies):
✗ UPDATE anomaly — change Ann's email → must update EVERY one of her orders
✗ INSERT anomaly — can't add a customer without an order
✗ DELETE anomaly — deleting Ann's last order loses her info entirely
✗ Wasted storage and inconsistency risk
