Observability کسی نظام کی داخلی حالت کو اس کے بیرونی نتائج سے سمجھنے کی صلاحیت ہے — logs، metrics، اور traces کے ذریعے۔ یہ نظام کو چلانے، ڈیبگ کرنے، اور برقرار رکھنے کے لیے ضروری ہے (خاص طور پر distributed نظام میں)، جہاں آپ وہ کچھ بھی منیج نہیں کر سکتے جو آپ نہیں دیکھ سکتے۔
Observability کے تین ستون
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
