Auto Scaling samodejno prilagodi število tekoče delujoče se virov (npr. EC2 instanc) glede na povpraševanje — doda zmogljivost, ko se obremenitev poveča, in jo odstrani, ko se obremenitev zmanjša. Ključno je za gradnjo aplikacij, ki so hkrati zanesljive (lahko rokovajo s sunki prometa) in stroškovno učinkovite (ne preobremenijo se).
Kaj počne samodejno skaliranje
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
