Load balancing phân tán các request đến qua nhiều server — cho phép horizontal scaling, cải thiện availability, và ngăn không cho bất kỳ server đơn lẻ nào bị quá tải. Đây là một thành phần cơ bản của các hệ thống scalable, reliable.
Một load balancer làm gì
Một LOAD BALANCER nằm phía trước nhiều server và phân tán request giữa chúng:
Client → LOAD BALANCER → ┬→ Server 1
├→ Server 2
└→ Server 3
→ trải đều tải → không server đơn lẻ nào bị quá tải (cho phép HORIZONTAL scaling)
→ định tuyến tránh các server đã LỖI (health checks) → high AVAILABILITY
→ một điểm vào duy nhất cho client
Tại sao load balancing quan trọng
✓ SCALABILITY → phân tán tải qua nhiều server → xử lý nhiều traffic hơn bằng cách thêm server
✓ AVAILABILITY → nếu một server lỗi, định tuyến sang server khỏe → không có single point of failure
✓ PERFORMANCE → ngăn bất kỳ server nào bị quá tải → thời gian phản hồi ổn định
✓ Cho phép deploy ZERO-DOWNTIME, bảo trì (đưa server ra khỏi vòng quay)
→ một nền tảng của các hệ thống scalable, high-availability.
