ما المقاييس والسجلات والتتبع، وفي أي حالة تستخدم كلاً منها؟

Question

Accepted Answer

هذه هي **الأعمدة الثلاثة للمراقبة (observability)**. فهي تجيب على أسئلة مختلفة: المقاييس تخبرك **أن** شيئاً ما خاطئ، والسجلات تخبرك **بما** حدث، والتتبع يخبرك **بأين** في سير التدفق الموزع ذهب الوقت أو الخطأ.

## الأعمدة الثلاثة

```text
METRICS  aggregate numbers over time (counters, gauges, histograms)
         → cheap, low cardinality, great for trends & ALERTING
         → e.g. error rate = 2%, p99 latency = 800ms

LOGS     discrete, timestamped events with detail (often structured JSON)
         → rich context for DEBUGGING a specific request
         → e.g. {"level":"error","user":123,"msg":"payment declined"}

TRACES   the path of one request across services, with timing per span
         → shows latency BREAKDOWN and where a call fails
         → e.g. checkout 800ms = api 50ms + db 700ms + email 50ms
```

## متى تستخدم كل واحد — حادث واحد

```text
1. METRIC alerts: "checkout p99 latency jumped to 2s"   → you know THERE's a problem
2. TRACE a slow request: 1.8s of 2s is spent in the inventory service
                                                        → you know WHERE it is
3. LOGS of the inventory service at that time: "slow query: missing index"
                                                        → you know WHAT happened
```

تقلل المقاييس البحث إلى عرض زمني ومؤشر واحد؛ التتبع يحصره في خدمة أو استدعاء؛ والسجلات تعطيك السبب الدقيق. الذهاب مباشرة إلى السجلات دون مقاييس يعني البحث عمياء.

## التكلفة والمعالجة

المقاييس مجمعة، لذا تبقى رخيصة حتى على نطاق واسع — مثالية لوحات التحكم والتنبيهات الدائمة. السجلات والتتبع يكونان لكل حدث وغاليان جداً، لذا يتم عادة **أخذ عينات** منهما والاستعلام عنهما عند الحاجة أثناء التحقيق.

## لماذا يهم

استخدام العمود الخاطئ يهدر الوقت: لا يمكنك تنبيه فعال على السجلات الخام (مزعجة جداً وباهظة الثمن)، ولا يمكنك تصحيح طلب فاشل معين من مقياس مجمع. معرفة أن المقاييس تكتشف والتتبع يحصر والسجلات توضح يعطيك مسار سريع وقابل للتكرار من "حدث خطأ ما" إلى السبب الجذري.