기본은 rollback입니다 — 알려진 정상 상태로 복구하는 가장 빠르고 신뢰할 만한 방법입니다. rollback이 불가능하거나 앞으로 고치는 것보다 더 위험할 때에만 hotfix를 시도합니다. 진행 중인 incident에서 우선순위는 먼저 출혈을 멈추고 진단은 나중에 하는 것입니다.
| 상황 | 선택 |
|---|---|
| 이전 버전 알려진 정상, 마이그레이션 없음 | Rollback |
| 되돌릴 수 없는 DB 마이그레이션 출시됨 | Hotfix / 앞으로 고치기 |
| 원인 미상, 심각한 영향 | Rollback (시간 벌기) |
| 사소하고 잘 이해된 한 줄짜리 | Hotfix |
| rollback 자체가 위험/미검증 | Hotfix |
이 결정은 최악의 순간에 일어납니다 — 시스템 다운, 시계는 돌아가고, 모두가 보고 있습니다. 이에 대한 명확하고 리허설된 규칙을 가진 Tech Lead는 MTTR을 극적으로 줄이고, 지루한 revert가 바로 거기 있었는데도 incident 한복판에서 영리해지려는 고전적 실수를 방지합니다. 먼저 복구하고, 영리함은 나중에.