Suojaa ihmisiä, jotta he voivat suojata järjestelmää. Pitkässä incidentissä työmoraali romahtaa kaaoksesta, uupumuksesta ja syyttelyn pelosta — joten tehtäväsi Tech Leadina on poistaa kaikki kolme: tuo rakennetta, pakota lepoa ja imeydytä painetta ylhäältä, jotta tiimi voi ajatella.
Mitä oikeasti teen
- Luo selkeät roolit. Nimeä Incident Commander, viestintähenkilö ja kädet savessa olevat vastaajat. Kun kaikki tietävät kaistansa, paniikki laskee ja fokus palaa.
- Suojaa tiimiä. Ota stakeholder-päivitykset ja johdon paine itsellesi. Debuggaavien insinöörien ei pitäisi myös vastailla "onko jo korjattu?" joka kymmenes minuutti.
- Rotatoi ja pakota tauot. Uupuneet ihmiset pahentavat katkosta. Mistä tahansa monituntisesta, järjestä vuorot, jotta kukaan ei aja viimeisillä voimillaan — väsyneet vastaajat aiheuttavat toisen incidentin.
- Pysy rauhallisena ja konkreettisena. Tasainen sävy, pienet seuraavat askeleet, näkyvä edistyminen. Rauhallisuus on tarttuvaa; niin on paniikkikin. Tunnusta stressi rehellisesti sen sijaan että teeskentelisit kaiken olevan kunnossa.
- Ruoki ja tahdita ihmisiä. Tilaa ruokaa, kutsu eksplisiittisiä taukoja, juhli pieniä voittoja ("virhetaso laskee"). Pitkittynyt kriisi tarvitsee kestävän rytmin.
Kun se on ohi
- Kiitä ihmisiä konkreettisesti ja julkisesti, ja varmista että johto näkee ponnistuksen.
- Anna palautumisaikaa — kova incident ansaitsee levon, ei suoraa paluuta sprinttiin.
- Aja syyllistämätön postmortem, jotta stressi muuntuu pysyväksi parannukseksi, eikä kukaan kanna yksityistä syyllisyyttä.
Kompromissit ja sudenkuopat
- Sankarikulttuuri — yhden henkilön antaminen ahertaa 18 tuntia tuntuu sankarilliselta mutta polttaa hänet loppuun ja luo bus-factor-riskin. Vastusta sitä.
- Myrkyllinen positiivisuus — "pysy positiivisena!" ilman todellisuuden tunnustamista tulkitaan vähättelynä ja rapauttaa luottamusta.
- Syyttely hetkessä on työmoraalimyrkkyä; lykkää kaikki arvioiminen postmortemiin, ja pidä sekin syyllistämättömänä.
- Älä ohita ihmisen palautumista näyttääksesi tuottavalta; loppuunpalaminen ilmestyy kahden viikon päästä vaihtuvuutena.
Miksi se on tärkeää
Incidentit testaavat kulttuuria enemmän kuin osaamista. Se, miten tiimiä kohdellaan sen pahimpina hetkinä, muistetaan vuosia ja muovaa sitä, jäävätkö hyvät insinöörit. Tech Lead, joka pitää ihmiset vakaina, levänneinä ja syyllistämättöminä paineen alla, rakentaa sellaista luottamusta ja resilienssiä, jota mikään tyynen sään johtaminen ei voi ostaa.
