Consistent hashing là một kỹ thuật để phân tán dữ liệu qua các node (server) mà giảm thiểu việc tái phân bố khi node được thêm hoặc bớt — khác với hashing đơn giản, vốn remap hầu hết các key khi số lượng node thay đổi. Nó quan trọng cho distributed cache, database, và phân tán tải.
Vấn đề với hashing đơn giản
Cách đơn giản: node = hash(key) % N (N = số node)
✗ khi N THAY ĐỔI (thêm/bớt một node), N đổi → HẦU HẾT key remap sang node khác →
di chuyển dữ liệu / cache invalidation lớn (gần như mọi thứ đều di chuyển!)
→ thêm/bớt một server gây xáo trộn lớn → tệ cho distributed system động.
