Auto Scaling secara otomatis menyesuaikan jumlah resource yang berjalan (misalnya EC2 instances) berdasarkan permintaan — menambah kapasitas ketika beban meningkat dan menguranginya ketika beban menurun. Ini adalah kunci untuk membangun aplikasi yang reliable (menangani lonjakan traffic) dan cost-efficient (tidak over-provision).
Apa yang dilakukan auto scaling
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
