Što je opservabilnost i zašto je važna u dizajnu sustava?

Question

Accepted Answer

**Opservabilnost** je sposobnost razumijevanja unutarnjeg stanja sustava iz njegovih vanjskih izlaza — kroz **logove**, **metrike** i **tragove**. Ona je neophodno potrebna za upravljanje, otklanjanje grešaka i održavanje sustava (pogotovo distribuiranih), gdje ne možete upravljati onim što ne vidite.

## Tri stupa opservabilnosti

```text
LOGS → timestamped records of events (what happened) → detailed, for debugging specific issues
METRICS → numerical measurements over time (CPU, latency, request rate, error rate) →
  aggregate health/performance; dashboards; alerting
TRACES → follow a request's path through the system (across services) → understand flows,
  find bottlenecks/failures in DISTRIBUTED systems (which service was slow?)
→ together: understand WHAT happened, the OVERALL state, and the PATH of requests.
```

## Zašto je opservabilnost važna

```text
✓ You can't operate/debug what you can't SEE → essential for understanding system behavior
✓ DETECT problems → metrics + alerting catch issues (before/as users hit them)
✓ DEBUG → logs and traces find root causes (especially in distributed systems where a
  request crosses many services — hard to debug without tracing)
✓ UNDERSTAND performance → find bottlenecks, optimize
✓ Maintain RELIABILITY → observability enables fast detection and resolution (lower MTTR)
```

## Opservabilnost naspram monitoringa

```text
MONITORING → watching KNOWN metrics/conditions (predefined dashboards, alerts) → "is it
  working?"
OBSERVABILITY → ability to ASK NEW questions / explore the unknown → "WHY is it behaving
  this way?" (debug novel/unexpected issues)
→ observability is broader → understand system behavior, including unforeseen problems
✓ practices: structured logging, distributed tracing (OpenTelemetry), good metrics, alerting
```

## Zašto je to bitno

Razumijevanje opservabilnosti je važno znanje na seniskoj razini jer **upravljanje i održavanje sustava zahtijeva razumijevanje njihova ponašanja**, a opservabilnost je za to neophodno potrebna (pogotovo u distribuiranim sustavima), pa je to ključni aspekt dizajniranja upotrebljivih sustava.

Opservabilnost — razumijevanje unutarnjeg stanja sustava iz njegovih vanjskih izlaza — je neophodno potrebna jer **ne možete upravljati, koristiti ili otklanjati greške onom što ne vidite**, što je je kritično za pouzdano pokretanje sustava.

Razumijevanje **tri stupa** — **logove** (zapise događaja za detaljno otklanjanje grešaka), **metrike** (numerička mjerenja za zbrojeno zdravlje, nadzorne ploče i uzbunjivanje) i **tragove** (praćenje puta zahtjeva kroz servise) — i kako zajedno omogućavaju razumijevanje što se dogodilo, cjelokupnog stanja i tokova zahtjeva, je temeljno znanje. **Tragovi** su posebno važni u distribuiranim sustavima, gdje zahtjev prelazi mnoge servise i otklanjanje grešaka je veoma teško bez praćenja puta kako bi se pronašao koji je servis bio spor ili dao grešku.

Razumijevanje **zašto je opservabilnost važna** — budući neophodno potrebna za upravljanje i otklanjanje grešaka u sustavima, otkrivanje problema (metrike i uzbunjivanje koja hvataju probleme), otklanjanje korijena uzroka (logovi i tragovi, pogotovo u distribuiranim sustavima), razumijevanje performansi i omogućavanje brzog otkrivanja i rješavanja (niži MTTR za pouzdanost) — pojašnjava njezinu kritičnu operativnu ulogu.

Razumijevanje **opservabilnosti naspram monitoringa** — monitoring koji prati poznate uvjete ("radi li?") naspram opservabilnosti koja omogućava postavljanje novih pitanja i istraživanja nepoznatoga ("zašto se to tako ponaša?", otklanjanje novih problema) — odražava dublji koncept mogućnosti razumijevanja nepredviđenih problema, važno za složene sustave.

Dizajniranje sustava s opservabilnosti na umu (strukturirano logiranje, distribuirano praćenje, dobre metrike, uzbunjivanje) je neophodno potrebno za upotrebljive, održive sustave.

Budući da upravljanje i održavanje sustava zahtijeva razumijevanje njihova ponašanja i opservabilnost (logovi, metrike, tragovi) je za to neophodno potrebna — pogotovo u distribuiranim sustavima gdje je otklanjanje grešaka teško bez toga — i budući da omogućava brzo otkrivanje, otklanjanje i rješavanje problema, razumijevanje opservabilnosti je važno znanje na seniskoj razini — neophodno potrebno za pouzdano upravljanje i održavanje sustava, ključni aspekt dizajniranja upotrebljivih sustava (pogotovo distribuiranih gdje je praćenje ključno) i odražava operativnu zrelost koju se očekuje od seniskih uloga koje dizajniraju sustave koji se moraju razumijevati, otklanjati greške i čuvati kao pouzdani u produkciji.