Theo cuốn SRE của Google, bốn golden signal là latency, traffic, errors và saturation. Nếu bạn chỉ đo được bốn thứ về một hệ thống hướng người dùng, hãy đo những thứ này — cùng nhau chúng bắt được phần lớn các vấn đề.
Bốn signal
LATENCY một request mất bao lâu
→ tách latency THÀNH CÔNG vs THẤT BẠI (một 500 nhanh không phải là "nhanh")
→ theo dõi percentile (p50/p95/p99), không phải trung bình
TRAFFIC hệ thống đang chịu bao nhiêu nhu cầu
→ requests/giây, transactions/giây, phiên đồng thời
ERRORS tỷ lệ request thất bại
→ tường minh (HTTP 500) và ngầm (sai nội dung, quá chậm)
SATURATION hệ thống "đầy" đến đâu — tài nguyên bị ràng buộc nhất của nó
→ CPU, memory, I/O, queue depth; một chỉ báo sớm của rắc rối
