Estos son los tres pilares de la observabilidad. Responden a preguntas diferentes: las métricas te dicen que algo está mal, los logs te dicen qué sucedió, y los traces te dicen en un flujo distribuido se fue el tiempo o el error.
Estos son los tres pilares de la observabilidad. Responden a preguntas diferentes: las métricas te dicen que algo está mal, los logs te dicen qué sucedió, y los traces te dicen en un flujo distribuido se fue el tiempo o el error.
METRICS aggregate numbers over time (counters, gauges, histograms)
→ cheap, low cardinality, great for trends & ALERTING
→ e.g. error rate = 2%, p99 latency = 800ms
LOGS discrete, timestamped events with detail (often structured JSON)
→ rich context for DEBUGGING a specific request
→ e.g. {"level":"error","user":123,"msg":"payment declined"}
TRACES the path of one request across services, with timing per span
→ shows latency BREAKDOWN and where a call fails
→ e.g. checkout 800ms = api 50ms + db 700ms + email 50ms
1. METRIC alerts: "checkout p99 latency jumped to 2s" → you know THERE's a problem
2. TRACE a slow request: 1.8s of 2s is spent in the inventory service
→ you know WHERE it is
3. LOGS of the inventory service at that time: "slow query: missing index"
→ you know WHAT happened
Las métricas te reducen a un síntoma y una ventana de tiempo; los traces lo localizan en un servicio o una llamada; los logs te dan la causa exacta. Ir directamente a los logs sin métricas significa buscar a ciegas.
Las métricas se agregan, por lo que permanecen económicas incluso a gran escala — ideales para dashboards y alertas siempre activos. Los logs y traces son por evento y costosos, por lo que generalmente se muestrean y se consultan bajo demanda durante la investigación.
Usar el pilar incorrecto desperdicia tiempo: no puedes alertar eficazmente en logs sin procesar (demasiado ruidosos, demasiado costosos), y no puedes depurar una solicitud fallida específica a partir de una métrica agregada. Saber que las métricas detectan, los traces localizan y los logs explican te proporciona un camino rápido y repetible desde "algo está mal" hasta la causa raíz.