High availability (HA) nghĩa là thiết kế các hệ thống để duy trì hoạt động bất chấp sự cố — thông qua redundancy, triển khai đa AZ, tự phục hồi và loại bỏ các điểm lỗi đơn lẻ. Đây là một mục tiêu nền tảng cho hệ thống production và một lĩnh vực then chốt của kiến trúc AWS.
Các nguyên tắc HA cốt lõi
✓ ELIMINATE SINGLE POINTS OF FAILURE — no single component whose failure takes down
the system → redundancy everywhere (multiple instances, AZs, etc.)
✓ Deploy across MULTIPLE AVAILABILITY ZONES — survive an AZ (data center) failure
✓ AUTOMATIC RECOVERY — detect failures and recover/replace automatically (no manual fix)
✓ DECOUPLE components — failures isolated; one component's failure doesn't cascade
