Tai yra trys stebėjimo stulpai. Jie atsakyti į skirtingus klausimus: metrikos jums sako, kad kažkas negerai, žurnalai jums sako, kas nutiko, o šlapiai sako jums, paskleistame tėkmėje nuėjo laikas arba klaida.
Tai yra trys stebėjimo stulpai. Jie atsakyti į skirtingus klausimus: metrikos jums sako, kad kažkas negerai, žurnalai jums sako, kas nutiko, o šlapiai sako jums, paskleistame tėkmėje nuėjo laikas arba klaida.
METRICS aggregate numbers over time (counters, gauges, histograms)
→ cheap, low cardinality, great for trends & ALERTING
→ e.g. error rate = 2%, p99 latency = 800ms
LOGS discrete, timestamped events with detail (often structured JSON)
→ rich context for DEBUGGING a specific request
→ e.g. {"level":"error","user":123,"msg":"payment declined"}
TRACES the path of one request across services, with timing per span
→ shows latency BREAKDOWN and where a call fails
→ e.g. checkout 800ms = api 50ms + db 700ms + email 50ms
1. METRIC alerts: "checkout p99 latency jumped to 2s" → you know THERE's a problem
2. TRACE a slow request: 1.8s of 2s is spent in the inventory service
→ you know WHERE it is
3. LOGS of the inventory service at that time: "slow query: missing index"
→ you know WHAT happened
Metrikos siaurinti jūs į simptomą ir laiko langą; ślapiai jį sutvarko į paslaugą arba skambutį; žurnalai suteikia tikslią priežastį. Eiti tiesiai prie žurnalų be metrikų reiškia aklas ieškotis.
Metrikos yra susumuojamos, todėl jos išlieka pigiaus net ir skalėje — idealu visada įjungtiems prietaisams ir perspėjimams. Žurnalai ir ślapiai yra pagal įvykį ir brangūs, todėl jie dažniausiai yra mėginiai ir klausiami pareikalavus tyrinėjimo metu.
Klaidos stulpo naudojimas švaisty laiką: jūs negalite efektyviai įspėti apie neapdorotus žurnalus (per daug triukšmo, per daug brangūs), ir jūs negalite derinti konkrečios nepavykusios užklausos iš sumuoto metrikų. Žinant, kad metrikos aptinka, ślapiai lokalizuoja ir žurnalai paaiškina, jums suteikia greitą, pakartojamą kelią nuo „kažkas negerai