Họ muốn thấy bạn giữ được sự bình tĩnh, có phương pháp và không đổ lỗi (blameless) dưới sức ép — khôi phục dịch vụ trước, chẩn đoán sau, và ngăn tái diễn cuối cùng. Hãy dùng STAR.
Cách tiếp cận
text
THỨ TỰ XỬ LÝ SỰ CỐ
1. Ổn định — chặn "chảy máu" (rollback, failover, giảm thiểu)
2. Giao tiếp — cập nhật cho stakeholder trên một kênh rõ ràng
3. Chẩn đoán — tìm nguyên nhân gốc khi đã ổn định, không phải trong lúc đang cháy
4. Ngăn ngừa — một buổi post-mortem không đổ lỗi với các hạng mục hành động
