Kaj je opazljivost (observability) in zakaj je pomembna pri oblikovanju sistemov?

Question

Accepted Answer

**Opazljivost** je sposobnost razumevanja notranjega stanja sistema na podlagi njegovih zunanjih rezultatov — preko **logov**, **metrik** in **sledov** (traces). Je ključna za obratovanje, odpravljanje napak in vzdrževanje sistemov (zlasti porazdeljenih), kjer ne morete upravljati tega, česar ne vidite.

## Trije stebri opazljivosti

```text
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
  aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
  find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
```

## Zakaj je opazljivost pomembna

```text
✓ You can't operate/debug what you can't SEE → essential for understanding system behavior
✓ DETECT problems → metrics + alerting catch issues (before/as users hit them)
✓ DEBUG → logs and traces find root causes (especially in distributed systems where a
  request crosses many services — hard to debug without tracing)
✓ UNDERSTAND performance → find bottlenecks, optimize
✓ Maintain RELIABILITY → observability enables fast detection and resolution (lower MTTR)
```

## Opazljivost v primerjavi z monitoringom

```text
MONITORING → watching KNOWN metrics/conditions (predefined dashboards, alerts) → "is it
  working?"
OBSERVABILITY → ability to ASK NEW questions / explore the unknown → "WHY is it behaving
  this way?" (debug novel/unexpected issues)
→ observability is broader → understand system behavior, including unforeseen problems
✓ practices: structured logging, distributed tracing (OpenTelemetry), good metrics, alerting
```

## Zakaj je to pomembno

Razumevanje opazljivosti je pomembno znanje na višji ravni, ker **obratovanje in vzdrževanje sistemov zahteva razumevanje njihovega vedenja**, in opazljivost je za to ključna (zlasti pri porazdeljenih sistemih), zato je bistveni vidik oblikovanja upravljljivih sistemov.

Opazljivost — razumevanje notranjega stanja sistema na podlagi njegovih zunanjih rezultatov — je ključna, ker **ne morete upravljati, obratovati ali odpravljati napak v tem, česar ne vidite**, kar jo naredi kritično za zanesljivo obratovanje sistemov.

Razumevanje **treh stebrov** — **logov** (zapisi dogodkov za podrobno odpravljanje napak), **metrik** (numerične meritve za skupno zdravje, nadzorne plošče in opozarjanje) in **sledov** (sledenje poti zahtevka čez storitve) — ter kako skupaj omogočajo razumevanje, kaj se je zgodilo, splošnega stanja in tokov zahtevkov, je temeljno znanje. **Sledi** so posebej pomembne v porazdeljenih sistemih, kjer zahtevek prečka številne storitve in odpravljanje napak je zelo težko brez sledenja poti, da ugotovite, katera storitev je bila spora ali je propadla.

Razumevanje **zakaj je opazljivost pomembna** — ker je ključna za obratovanje in odpravljanje napak v sistemih, odkrivanje problemov (metrike in opozarjanje, ki ujamejo težave), odpravljanje temeljnih vzrokov (logi in sledi, zlasti v porazdeljenih sistemih), razumevanje zmogljivosti in omogočanje hitrega odkrivanja in reševanja (nižji MTTR za zanesljivost) — pojasni njeno kritično operativno vlogo.

Razumevanje **opazljivosti v primerjavi z monitoringom** — monitoring nadzira znane pogoje ("ali deluje?") v primerjavi z opazljivostjo, ki omogoča postavljanje novih vprašanj in raziskovanje neznanega ("zakaj se tako obnaša?", odpravljanje novih težav) — odraža globji koncept sposobnosti razumevanja nepredvidenih problemov, važnega za kompleksne sisteme.

Oblikovanje sistemov s poudarkom na opazljivosti (strukturirani logi, porazdeljeno sledenje, dobre metrike, opozarjanje) je bistveno za upravljive, vzdržljive sisteme.

Ker obratovanje in vzdrževanje sistemov zahteva razumevanje njihovega vedenja in opazljivost (logi, metrike, sledi) je za to ključna — zlasti pri porazdeljenih sistemih, kjer je odpravljanje napak brez nje težko — in ker omogoča hitro odkrivanje, odpravljanje in reševanje problemov, je razumevanje opazljivosti pomembno znanje na višji ravni — bistveno za zanesljivo obratovanje in vzdrževanje sistemov, ključni vidik oblikovanja upravljljivih sistemov (zlasti porazdeljenih, kjer je sledenje ključno) in odraz operativne zrelosti, ki se pričakuje od višjih vlog, ki oblikujejo sisteme, ki jih je treba razumeti, odpravljati in vzdržavati zanesljivo v produkciji.