**재해 복구(DR)**는 주요 실패나 재해 이후 시스템과 데이터를 어떻게 복구할지 계획하는 것입니다. AWS는 복구 속도, 데이터 손실, 비용 사이의 서로 다른 트레이드오프를 가진 DR 전략을 제공하며 — RTO와 RPO 목표로 정의됩니다.
핵심 개념: RTO와 RPO
RTO (Recovery Time Objective) → 얼마나 빨리 복구해야 하는지 (허용 가능한 다운타임)
RPO (Recovery Point Objective) → 얼마나 많은 데이터 손실이 허용되는지 (얼마나
최근 시점까지 복구 — 예: "최대 5분의 데이터 손실")
→ 낮은 RTO/RPO (더 빠른 복구, 적은 데이터 손실) = 더 높은 비용/복잡성.
비즈니스 요구에 기반하여 정의; 이들이 DR 전략 선택을 주도.
DR 전략 (비용 vs 복구 속도 트레이드오프)
1. 백업 & 복원 → 데이터 백업 (S3, 스냅샷); 재해 후 복원
→ 가장 저렴; 가장 느린 복구 (시간); 높은 RPO. 허용적인 워크로드용.
2. 파일럿 라이트 → 핵심 시스템 (예: 데이터베이스, 복제됨)을 최소/준비 상태로 유지;
재해 시 나머지 확장 → 중간 비용, 더 빠른 복구
3. 웜 스탠바이 → 다른 region에 축소되었지만 실행 중인 복사본; 페일오버 시 확장
→ 높은 비용, 빠른 복구 (분)
4. 멀티 사이트 액티브-액티브 → 여러 region에서 트래픽을 처리하는 완전한 실행 복사본
→ 가장 높은 비용/복잡성; 거의 제로 RTO/RPO. 가장 중요한 시스템용.
