Während eines Vorfalls ist deine Aufgabe, den Service ruhig wiederherzustellen und die Reaktion zu koordinieren, nicht der Held zu sein, der es allein behebt. Klare Rollen, ruhige Kommunikation und die Priorität, zuerst Schadensbekämpfung zu betreiben, trennen eine reibungslose Reaktion von Chaos.
Wie du einen Vorfall leitest
1. ASSIGN roles — incident commander (coordinates), responders (fix),
comms (updates stakeholders). One person can't do all three.
2. MITIGATE first — stop the bleeding (roll back, feature-flag off)
before chasing root cause.
3. COMMUNICATE on a cadence — even "still investigating" every 15-30 min.
4. STAY CALM — the team mirrors your energy. Blame comes later, or never.
5. After: BLAMELESS post-mortem — fix the system, not the person.
