Semasa insiden, pekerjaan anda adalah memulihkan perkhidmatan dengan tenang dan menyelaraskan tindak balas, bukan menjadi pahlawan yang memperbaikinya sendiri. Peranan yang jelas, komunikasi tenang, dan bias untuk mengurangkan dahulu memisahkan tindak balas yang lancar dari kekacauan.
Cara menjalankan insiden
1. ASSIGN roles — incident commander (coordinates), responders (fix),
comms (updates stakeholders). One person can't do all three.
2. MITIGATE first — stop the bleeding (roll back, feature-flag off)
before chasing root cause.
3. COMMUNICATE on a cadence — even "still investigating" every 15-30 min.
4. STAY CALM — the team mirrors your energy. Blame comes later, or never.
5. After: BLAMELESS post-mortem — fix the system, not the person.
