Auto Scaling past het aantal actieve resources (bijv. EC2-instanties) automatisch aan op basis van vraag — voegt capaciteit toe wanneer de belasting toeneemt en verwijdert deze wanneer de belasting afneemt. Het is essentieel voor het bouwen van applicaties die zowel betrouwbaar zijn (verkeersspitzen afhandelen) als kostenefficiënt (niet over-inrichten).
Wat auto scaling doet
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
