Auto Scaling rregullon automatikisht numrin e burimeve në ekzekutim (p.sh. instancë EC2) bazuar në kërkesë — duke shtuar kapacitet kur ngarkesa rritet dhe duke e hequr atë kur ngarkesa zvogëlohet. Është kyç për ndërtimin e aplikacioneve që janë si të besueshme (përballojnë kulmet e trafikut) ashtu edhe të efektshme në kosto (mos mbi-furnizim).
Çfarë bën auto scaling
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
