Auto Scaling justerer automatisk antallet kjørende ressurser (f.eks. EC2-instanser) basert på etterspørsel — legger til kapasitet når belastningen øker og fjerner den når belastningen synker. Det er nøkkelen til å bygge applikasjoner som er både pålitelige (håndterer trafikkstopper) og kostnadseffektive (ikke overbestilling).
Hva auto scaling gjør
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
