Observability është aftësia për të kuptuar gjendjen e brendshme të një sistemi nga rezultatet e tij të jashtme — përmes logs, metrics, dhe traces. Është thelbësore për operimin, debugimin dhe mirëmbajtjen e sistemeve (veçanërisht atyre të shpërndarë), ku nuk mund të menaxhosh atë që nuk mund të shohësh.
Tre shtyllat e observability
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
