Load balancing distribuisce le richieste in arrivo su più server — abilitando il scaling orizzontale, migliorando la disponibilità e impedendo a qualsiasi singolo server di essere sopraffatto. È una componente fondamentale di sistemi scalabili e affidabili.
Cosa fa un load balancer
A LOAD BALANCER sits in front of multiple servers and distributes requests among them:
Client → LOAD BALANCER → ┬→ Server 1
├→ Server 2
└→ Server 3
→ spreads load → no single server is overwhelmed (enables HORIZONTAL scaling)
→ routes around FAILED servers (health checks) → high AVAILABILITY
→ a single entry point for clients
