Auto Scaling tự động điều chỉnh số lượng tài nguyên đang chạy (ví dụ EC2 instances) dựa trên nhu cầu — thêm capacity khi tải tăng và loại bỏ nó khi tải giảm. Đây là chìa khóa để xây dựng các ứng dụng vừa đáng tin cậy (xử lý đỉnh lưu lượng) vừa hiệu quả chi phí (không cấp phát quá mức).
Auto scaling làm gì
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
