Auto Scaling ajuste automatiquement le nombre de ressources en cours d'exécution (par exemple, instances EC2) en fonction de la demande — en ajoutant de la capacité lorsque la charge augmente et en la supprimant lorsqu'elle diminue. C'est clé pour construire des applications qui sont à la fois fiables (gérer les pics de trafic) et rentables (ne pas sur-provisionner).
Que fait l'auto-scaling
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
