Observability is het vermogen om de interne toestand van een systeem te begrijpen aan de hand van externe outputs — via logs, metrics en traces. Het is essentieel voor het bedrijven, debuggen en onderhouden van systemen (vooral gedistribueerde systemen), waar je niet kunt beheren wat je niet kunt zien.
De drie pijlers van observability
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
