Počnite , ne od dna prema gore od infrastrukture. Najpouzdanija flota poslužitelja je beskorisna ako zahtjevi ne uspijevaju, pa počnite s okrenuti prema korisniku — , , — zatim dodajte četiri zlatna signala, te infra metrike na kraju.
Počnite , ne od dna prema gore od infrastrukture. Najpouzdanija flota poslužitelja je beskorisna ako zahtjevi ne uspijevaju, pa počnite s okrenuti prema korisniku — , , — zatim dodajte četiri zlatna signala, te infra metrike na kraju.
1. USER-FACING SLIs → what the user experiences (latency, errors, availability)
2. GOLDEN SIGNALS → latency, traffic, errors, saturation per service
3. INFRA METRICS → CPU, memory, disk, network (causes, not symptoms)
Ako samo gledate CPU i disk (od dna prema gore), možete biti potpuno zeleni dok korisnici dobivaju 500e. Promatranje SLI-ja prvo (od vrha prema dolje) znači da obavijest izdajete na simptome koje korisnici zaista osjećaju, zatim istražujete dublje u zlatne signale i infra kako biste pronašli uzrok.
INSTRUMENT app emits metrics/logs/traces (e.g. request_duration_seconds histogram)
↓
COLLECT a TSDB scrapes/ingests them (Prometheus, Datadog agent)
↓
DASHBOARD visualize SLIs + golden signals (Grafana) for humans to read
↓
ALERT fire on SLO violations / burn rate, routed to on-call
# Availability SLI: fraction of requests that succeed
sum(rate(http_requests_total{status!~"5.."}[5m]))
/ sum(rate(http_requests_total[5m]))
# Latency SLI: p99 request latency
histogram_quantile(0.99, sum by (le) (rate(http_request_duration_seconds_bucket[5m])))
Definirajte SLO na svakom SLI-ju (npr. 99,9% dostupnost, p99 < 300ms), prikazujte ih na kontrolnoj ploči, te izdajte obavijest kada je SLO u riziku — ne pri svakom blipanju.
Monitoring izgrađen od dna prema gore vam kaže da je disk 80% pun ali ne da klijenti ne mogu završiti kupovinu. Početak od SLI-ja okrenutih prema korisniku veže svaku kontrolnu ploču i obavijest natrag na pravi utjecaj na korisnike, держава buku niskom, i daje jasan put istrage (simptom → zlatni signal → uzrok infra) kada se nešto prekine.