Consistent hashing to technika dystrybucji danych między węzły (serwery), która minimalizuje redystrybucję cuando węzły są dodawane lub usuwane — w przeciwieństwie do prostego haszowania, które zmienia mapowanie większości kluczy gdy liczba węzłów się zmienia. Jest to ważne dla rozproszczonych cache'y, baz danych i dystrybucji obciążenia.
Problem z prostym haszowaniem
Simple approach: node = hash(key) % N (N = number of nodes)
✗ when N CHANGES (add/remove a node), N changes → MOST keys remap to different nodes →
massive data movement / cache invalidation (almost everything moves!)
→ adding/removing a server causes huge disruption → bad for dynamic distributed systems.
