Google کی SRE کتاب سے، چار سنہری اشارے ہیں latency, traffic, errors, اور saturation۔ اگر آپ صرف کسی صارف کے سامنے نظام کے بارے میں چار چیزیں ماپ سکتے ہیں، تو یہ ماپیں — یہ مل کر مسائل کی بہت بڑی اکثریت پکڑتے ہیں۔
چار اشارے
LATENCY how long a request takes
→ split SUCCESSFUL vs FAILED latency (a fast 500 isn't "fast")
→ track percentiles (p50/p95/p99), not averages
TRAFFIC how much demand the system is under
→ requests/sec, transactions/sec, concurrent sessions
ERRORS rate of failing requests
→ explicit (HTTP 500) and implicit (wrong content, too slow)
SATURATION how "full" the system is — its most constrained resource
→ CPU, memory, I/O, queue depth; a leading indicator of trouble
