Mulai , bukan dari bawah ke atas dari infrastruktur. Armada host yang paling andal tidak berguna jika permintaan gagal, jadi mulai dengan yang menghadap pengguna — , , — kemudian tambahkan empat sinyal emas, lalu metrik infra terakhir.
Mulai , bukan dari bawah ke atas dari infrastruktur. Armada host yang paling andal tidak berguna jika permintaan gagal, jadi mulai dengan yang menghadap pengguna — , , — kemudian tambahkan empat sinyal emas, lalu metrik infra terakhir.
1. USER-FACING SLIs → what the user experiences (latency, errors, availability)
2. GOLDEN SIGNALS → latency, traffic, errors, saturation per service
3. INFRA METRICS → CPU, memory, disk, network (causes, not symptoms)
Jika anda hanya menonton CPU dan disk (dari bawah ke atas), anda bisa sepenuhnya hijau sementara pengguna mendapat 500. Menonton SLI terlebih dahulu (dari atas ke bawah) berarti anda mengingatkan tentang gejala yang benar-benar dirasakan pengguna, kemudian mengebor ke sinyal emas dan infra untuk menemukan penyebabnya.
INSTRUMENT app emits metrics/logs/traces (e.g. request_duration_seconds histogram)
↓
COLLECT a TSDB scrapes/ingests them (Prometheus, Datadog agent)
↓
DASHBOARD visualize SLIs + golden signals (Grafana) for humans to read
↓
ALERT fire on SLO violations / burn rate, routed to on-call
# Availability SLI: fraction of requests that succeed
sum(rate(http_requests_total{status!~"5.."}[5m]))
/ sum(rate(http_requests_total[5m]))
# Latency SLI: p99 request latency
histogram_quantile(0.99, sum by (le) (rate(http_request_duration_seconds_bucket[5m])))
Tentukan SLO pada setiap SLI (misalnya ketersediaan 99,9%, p99 < 300ms), dasbor mereka, dan peringatan ketika SLO berisiko — bukan pada setiap kesalahan kecil.
Pemantauan yang dibangun dari bawah ke atas memberi tahu anda bahwa disk 80% penuh tetapi bukan bahwa pelanggan tidak dapat melakukan checkout. Dimulai dari SLI yang menghadap pengguna mengikat setiap dasbor dan peringatan kembali ke dampak pengguna nyata, menjaga kebisingan rendah, dan memberikan jalur bor-ke-bawah yang jelas (gejala → sinyal emas → penyebab infra) ketika sesuatu rusak.