Auto Scaling ajustează automat numărul de resurse în execuție (de ex. instanțe EC2) pe baza cererii — adaugă capacitate atunci când încărcarea crește și o elimină atunci când încărcarea scade. Este esențial pentru construirea aplicațiilor care sunt atât fiabile (gestionează creșterea traficului) cât și eficiente din punct de vedere al costurilor (nu supraprovizionează).
Ce face auto scaling
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
