Die Landschaft unterteilt sich nach Säule — Metriken, Logs, Traces — plus All-in-One-verwaltete Plattformen. Die Wahl läuft auf Self-Hosted vs Managed hinaus, getrieben durch Teamgröße, Budget und Skalierung.
Tools nach Säule
METRICS Prometheus → pull-based scraping, time-series DB, PromQL query language
Grafana → dashboards on top of Prometheus (and many other sources)
LOGS ELK → Elasticsearch + Logstash + Kibana (powerful, heavy to run)
Loki → "Prometheus for logs": cheap, indexes labels not full text
TRACES Jaeger → distributed tracing, OpenTelemetry-compatible
Tempo → trace backend that pairs with Grafana/Loki
ALL-IN-ONE Datadog → managed metrics + logs + traces + APM in one product
