Durante um incidente, seu trabalho é restaurar o serviço com calma e coordenar a resposta, não ser o herói que o corrige sozinho. Funções claras, comunicação calma e uma tendência de mitigar primeiro separam uma resposta tranquila do caos.
Como executar um incidente
1. ASSIGN roles — incident commander (coordinates), responders (fix),
comms (updates stakeholders). One person can't do all three.
2. MITIGATE first — stop the bleeding (roll back, feature-flag off)
before chasing root cause.
3. COMMUNICATE on a cadence — even "still investigating" every 15-30 min.
4. STAY CALM — the team mirrors your energy. Blame comes later, or never.
5. After: BLAMELESS post-mortem — fix the system, not the person.
