Auto Scaling automatski prilagođava broj pokrenenih resursa (npr. EC2 instanci) na osnovu potražnje — dodajući kapacitet kada se opterećenje povećava i uklanjajući ga kada se opterećenje smanjuje. Ključan je za građenje aplikacija koje su istovremeno pouzdane (mogu podnijeti skokove u prometu) i isplative (ne provjere preplanirane kapacitete).
Što auto scaling čini
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
