Začnite , ne pa od spodaj navzgor od infrastrukture. Najbolj zanesljiva gostitelska flota je neuporabna, če zahtevki ne uspevajo, zato začnite z uporabniku dostopnimi — , , — nato dodajte štiri zlate signale, nato infrastrukturne metrike nazadnje.
Začnite , ne pa od spodaj navzgor od infrastrukture. Najbolj zanesljiva gostitelska flota je neuporabna, če zahtevki ne uspevajo, zato začnite z uporabniku dostopnimi — , , — nato dodajte štiri zlate signale, nato infrastrukturne metrike nazadnje.
1. USER-FACING SLIs → what the user experiences (latency, errors, availability)
2. GOLDEN SIGNALS → latency, traffic, errors, saturation per service
3. INFRA METRICS → CPU, memory, disk, network (causes, not symptoms)
Če opazujete samo CPU in disk (od spodaj navzgor), lahko ste povsem zeleni, medtem ko uporabniki dobijo 500s. Če opazujete SLI prve (od zgoraj navzdol), pomeni, da opozarjate na simptome, ki jih uporabniki dejansko občutijo, nato pa se poglabljate v zlate signale in infrastrukturo, da najdete vzrok.
INSTRUMENT app emits metrics/logs/traces (e.g. request_duration_seconds histogram)
↓
COLLECT a TSDB scrapes/ingests them (Prometheus, Datadog agent)
↓
DASHBOARD visualize SLIs + golden signals (Grafana) for humans to read
↓
ALERT fire on SLO violations / burn rate, routed to on-call
# Availability SLI: fraction of requests that succeed
sum(rate(http_requests_total{status!~"5.."}[5m]))
/ sum(rate(http_requests_total[5m]))
# Latency SLI: p99 request latency
histogram_quantile(0.99, sum by (le) (rate(http_request_duration_seconds_bucket[5m])))
Definirajte SLO za vsak SLI (npr. 99,9% razpoložljivosti, p99 < 300ms), ju prikaži na nadzorni plošči in opozori, ko je SLO v nevarnosti — ne pa pri vsakem nihanju.
Spremljanje, zgrajeno od spodaj navzgor, ti pove, da je disk 80% poln, ne pa da kupci ne morejo zaključiti nakupa. Začetek s SLI, dostopnimi uporabniku, veže vsako nadzorno ploščo in opozorilo nazaj na pravo uporabnikovo učinkovitost, drži hrup nizek in daje jasen pot vrtanja (simptom → zlati signal → vzrok infrastrukture), ko se kaj zlomi.