Kas yra metrikos, žurnalai ir ślapiai, ir kada pasiklypdami po kiekvieną iš jų?

Question

Accepted Answer

Tai yra **trys stebėjimo stulpai**. Jie atsakyti į skirtingus klausimus: metrikos jums sako, kad **kažkas** negerai, žurnalai jums sako, **kas** nutiko, o šlapiai sako jums, **kur** paskleistame tėkmėje nuėjo laikas arba klaida.

## Kodėl tai svarbu

```text
METRICS  aggregate numbers over time (counters, gauges, histograms)
         → cheap, low cardinality, great for trends & ALERTING
         → e.g. error rate = 2%, p99 latency = 800ms

LOGS     discrete, timestamped events with detail (often structured JSON)
         → rich context for DEBUGGING a specific request
         → e.g. {"level":"error","user":123,"msg":"payment declined"}

TRACES   the path of one request across services, with timing per span
         → shows latency BREAKDOWN and where a call fails
         → e.g. checkout 800ms = api 50ms + db 700ms + email 50ms
```

## Kada sekti kiekvieną — vienas incidentas

```text
1. METRIC alerts: "checkout p99 latency jumped to 2s"   → you know THERE's a problem
2. TRACE a slow request: 1.8s of 2s is spent in the inventory service
                                                        → you know WHERE it is
3. LOGS of the inventory service at that time: "slow query: missing index"
                                                        → you know WHAT happened
```

Metrikos siaurinti jūs į simptomą ir laiko langą; ślapiai jį sutvarko į paslaugą arba skambutį; žurnalai suteikia tikslią priežastį. Eiti tiesiai prie žurnalų be metrikų reiškia aklas ieškotis.

## Kaštai ir kardinalumas

Metrikos yra susumuojamos, todėl jos išlieka pigiaus net ir skalėje — idealu visada įjungtiems prietaisams ir perspėjimams. Žurnalai ir ślapiai yra pagal įvykį ir brangūs, todėl jie dažniausiai yra **mėginiai** ir klausiami pareikalavus tyrinėjimo metu.

## Kodėl tai svarbu

Klaidos stulpo naudojimas švaisty laiką: jūs negalite efektyviai įspėti apie neapdorotus žurnalus (per daug triukšmo, per daug brangūs), ir jūs negalite derinti konkrečios nepavykusios užklausos iš sumuoto metrikų. Žinant, kad metrikos aptinka, ślapiai lokalizuoja ir žurnalai paaiškina, jums suteikia greitą, pakartojamą kelią nuo „kažkas negerai