Alta disponibilidade (HA) significa projetar sistemas para permanecerem operacionais apesar de falhas — através de redundância, implantação multi-AZ, auto-recuperação e eliminação de pontos únicos de falha. É um objetivo fundamental para sistemas em produção e uma área-chave da arquitetura AWS.
Princípios principais de HA
✓ ELIMINATE SINGLE POINTS OF FAILURE — no single component whose failure takes down
the system → redundancy everywhere (multiple instances, AZs, etc.)
✓ Deploy across MULTIPLE AVAILABILITY ZONES — survive an AZ (data center) failure
✓ AUTOMATIC RECOVERY — detect failures and recover/replace automatically (no manual fix)
✓ DECOUPLE components — failures isolated; one component's failure doesn't cascade
