Google-এর SRE বই থেকে, চারটি সোনালি সংকেত হল latency, traffic, errors এবং saturation। যদি আপনি একটি ব্যবহারকারী-মুখী সিস্টেম সম্পর্কে শুধুমাত্র চারটি জিনিস পরিমাপ করতে পারেন, এগুলি পরিমাপ করুন — একসাথে তারা বেশিরভাগ সমস্যা ধরে ফেলে।
চারটি সংকেত
LATENCY how long a request takes
→ split SUCCESSFUL vs FAILED latency (a fast 500 isn't "fast")
→ track percentiles (p50/p95/p99), not averages
TRAFFIC how much demand the system is under
→ requests/sec, transactions/sec, concurrent sessions
ERRORS rate of failing requests
→ explicit (HTTP 500) and implicit (wrong content, too slow)
SATURATION how "full" the system is — its most constrained resource
→ CPU, memory, I/O, queue depth; a leading indicator of trouble
