Alta disponibilidad (HA) significa diseñar sistemas que permanezcan operativos a pesar de fallos — a través de redundancia, implementación multi-AZ, recuperación automática y eliminación de puntos únicos de fallo. Es un objetivo fundamental para sistemas en producción y un área clave de la arquitectura de AWS.
Principios centrales de HA
✓ ELIMINATE SINGLE POINTS OF FAILURE — no single component whose failure takes down
the system → redundancy everywhere (multiple instances, AZs, etc.)
✓ Deploy across MULTIPLE AVAILABILITY ZONES — survive an AZ (data center) failure
✓ AUTOMATIC RECOVERY — detect failures and recover/replace automatically (no manual fix)
✓ DECOUPLE components — failures isolated; one component's failure doesn't cascade
