Auto Scaling regola automaticamente il numero di risorse in esecuzione (ad es. istanze EC2) in base alla domanda — aggiungendo capacità quando il carico aumenta e rimuovendola quando il carico diminuisce. È fondamentale per costruire applicazioni che sono sia affidabili (gestiscono i picchi di traffico) che efficienti in termini di costi (non over-provisioning).
Cosa fa l'auto scaling
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
