›Bạn sẽ thiết kế monitoring cho một ứng dụng từ con số 0 như thế nào?Middle#Observability#Monitoring#Sli#Sre#ReliabilityChi tiết →
›Metrics, logs và traces là gì, và khi nào dùng cái nào?Middle#Observability#Metrics#Logging#Tracing#SreChi tiết →
›Bạn chọn ngưỡng alert thế nào để tránh alert fatigue và false positive?Middle#Alerting#Monitoring#Slo#Sre#ReliabilityChi tiết →
›Bốn golden signal của monitoring là gì?Middle#Observability#Monitoring#Golden Signals#Sre#MetricsChi tiết →
›Các công cụ monitoring phổ biến là gì và chọn giữa chúng thế nào?Middle#Observability#Monitoring#Tooling#Prometheus#SreChi tiết →
›Làm sao phát hiện vấn đề trước khi user phàn nàn?Middle#Observability#Monitoring#Slo#Reliability#SreChi tiết →
›Một trang web hoặc API bị chậm — bạn tìm nguyên nhân thế nào?Middle#Hiệu năng#Debugging#Profiling#Observability#SreChi tiết →
›Bạn tối ưu một query database chậm như thế nào?Middle#Database#Hiệu năng#Optimization#Sql#SreChi tiết →
›Làm sao biết một bottleneck là CPU, memory, I/O, hay network?Middle#Hiệu năng#Profiling#Linux#Troubleshooting#SreChi tiết →
›Làm sao quyết định cache cái gì và cache trong bao lâu (TTL)?Middle#Caching#Hiệu năng#Reliability#SreChi tiết →
›Graceful degradation là gì khi một dependency bị lỗi?Middle#Resilience#Availability#Reliability#SreChi tiết →
›Circuit breaker và retry với backoff hoạt động thế nào trong hệ thống phân tán?Middle#Resilience#Reliability#Availability#SreChi tiết →
›Làm sao phân biệt một cuộc tấn công DDoS với một đợt tăng traffic tự nhiên?Middle#Ddos#Security#Sre#Incident ResponseChi tiết →