અવલોકનીયતા ત્રણ સ્તંભો પર આધારિત છે — લૉગ્સ, મેટ્રિક્સ અને ટ્રેસેસ — અને લક્ષ્ય એ છે કે "શું ખોટું છે અને કેમ" એમ જવાબ આપવું એવી સિસ્ટમ માટે જે હાથથી તપાસવા માટે ખૂબ મોટી છે. મોટા પ્રમાણે, વ્યૂહ સંબંધ, નમૂનાકરણ અને ખર્ચ વિશે છે.
અવલોકનીયતા ત્રણ સ્તંભો પર આધારિત છે — લૉગ્સ, મેટ્રિક્સ અને ટ્રેસેસ — અને લક્ષ્ય એ છે કે "શું ખોટું છે અને કેમ" એમ જવાબ આપવું એવી સિસ્ટમ માટે જે હાથથી તપાસવા માટે ખૂબ મોટી છે. મોટા પ્રમાણે, વ્યૂહ સંબંધ, નમૂનાકરણ અને ખર્ચ વિશે છે.
| સ્તંભ | પ્રશ્નનો જવાબ આપે છે | સાધનો |
|---|
| મેટ્રિક્સ | શું કંઈક ખોટું છે? (દર, વિલંબ) | Prometheus, Grafana |
| ટ્રેસેસ | પ્રવાહમાં ક્યાં? | OpenTelemetry, Jaeger |
| લૉગ્સ | તેમ બરાબર શું થયું? | ELK, Loki |
Metrics alert ─▶ trace pinpoints the slow service ─▶ logs explain the cause
(broad) (path) (detail)
ટ્રેસ/સહસંબંધ ID મેટ્રિક્સ લેબલ્સ, લૉગ લાઇનો અને સ્પેનમાં દિવ્ય હોવું જોઈએ, જેથી તમે તેમની વચ્ચે પિવટ કરી શકો.
log line: level=error trace_id=abc123 service=payments msg="gateway timeout"
^^^^^^^^^^^^^^^ same id appears in the trace + metrics
✓ Standardize: OpenTelemetry across all services
✓ Use structured (JSON) logs — queryable, not grep-only
✓ Sample traces (e.g. keep all errors + 1% of success) to control cost
✓ Define SLOs and alert on symptoms (latency/error rate), not noise
✓ RED/USE method for dashboards (Rate, Errors, Duration)
100% પર બધું લૉગ કરવું અશક્ય અને સંકેતને ડૂબી દે છે. તેની જગ્યાએ નમૂનો, રચના અને SLO પર સતર્ક કરો.
સેંકડો સેવાઓ સાથે, તમે SSH માં જઈ શકતા નથી અને જોઈ શકતા નથી — અવલોકનીયતા એ ઉત્પાદન વર્તણૂક સમજવાનો એક માત્ર માર્ગ છે.
જીતી નીતિ સંબંધિત, નમૂનાયુક્ત અને SLO-સંચાલિત છે: તે વાસ્તવિક સમસ્યાઓને ટેલીમેટ્રી સંગ્રહ પર તમને નિર્ધનમાં કર્યા વિના અથવા ઓન-કોલને અવાજમાં ડૂબી દીધા વિના ઝડપથી સમાધાન કરે છે.