Observability என்பது ஒரு சிஸ்டேமின் உள் நிலையை அதன் வெளிப்புற வெளிப்பাடுகள் மூலம் புரிந்துகொள்ளும் திறமை — logs, metrics, மற்றும் traces-ன் மூலம். இது சிஸ்டேம்களை இயக்க, பிழைதிருத்த, மற்றும் பராமரிக்க அவசியம் (குறிப்பாக விநியோகிக்கப்பட்ட சிஸ்டேம்களில்), நீங்கள் என்ன பார்க்க முடியாதவற்றை நிர்வகிக்க முடியாது.
Observability-ன் மூன்று நெடுவரிசைகள்
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
