Observability är förmågan att förstå ett systems interna tillstånd från dess externa utmatningar — genom logs, metrics och traces. Det är essentiellt för att driva, debugga och underhålla system (särskilt distribuerade sådana), där du inte kan hantera vad du inte kan se.
De tre pelarna för observability
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
