Bức tranh chia theo trụ cột — metrics, logs, traces — cộng các nền tảng managed all-in-one. Lựa chọn quy về self-hosted vs managed, được dẫn dắt bởi quy mô team, ngân sách và scale.
Công cụ theo trụ cột
METRICS Prometheus → scrape kiểu pull, time-series DB, ngôn ngữ truy vấn PromQL
Grafana → dashboard đặt trên Prometheus (và nhiều nguồn khác)
LOGS ELK → Elasticsearch + Logstash + Kibana (mạnh, nặng để vận hành)
Loki → "Prometheus cho logs": rẻ, index theo label chứ không phải full text
TRACES Jaeger → distributed tracing, tương thích OpenTelemetry
Tempo → backend trace ghép cùng Grafana/Loki
ALL-IN-ONE Datadog → managed metrics + logs + traces + APM trong một sản phẩm
