Observability అనేది system యొక్క internal state ను దాని external outputs ద్వారా అర్థం చేసుకోవడానికి సామర్థ్యం — logs, metrics, మరియు traces ద్వారా. ఇది systems లను operate చేయడానికి, debug చేయడానికి, మరియు maintain చేయడానికి అవసరం (ప్రత్యేకించి distributed ones లో), ఇక్కడ మీరు చూడని వాటిని manage చేయలేరు.
The three pillars of observability
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
