Auto Scaling justerer automatisk antallet af kørende ressourcer (f.eks. EC2-instanser) baseret på efterspørgsel — tilføjer kapacitet når belastningen stiger og fjerner den når belastningen falder. Det er nøglen til at bygge applikationer, der er både pålidelige (håndtere trafikspidser) og cost-effektive (ikke over-provision).
Hvad auto scaling gør
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
