Observability είναι η ικανότητα να κατανοούμε την εσωτερική κατάσταση ενός συστήματος από τα εξωτερικά του αποτελέσματα — μέσω logs, metrics, και traces. Είναι απαραίτητη για τη λειτουργία, την αποσφαλμάτωση και τη συντήρηση συστημάτων (ειδικά κατανεμημένων), όπου δεν μπορείτε να διαχειριστείτε αυτό που δεν μπορείτε να δείτε.
Τα τρία στοιχεία της παρατηρησιμότητας
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
