ল্যান্ডস্কেপ স্তম্ভ দ্বারা বিভক্ত — মেট্রিক্স, লগ, ট্রেস — প্লাস সর্ব-এক-সাথে পরিচালিত প্ল্যাটফর্ম। পছন্দটি স্ব-হোস্টেড বনাম পরিচালিত এর উপর নির্ভর করে, দল আকার, বাজেট এবং স্কেল দ্বারা চালিত।
স্তম্ভ দ্বারা সরঞ্জাম
METRICS Prometheus → pull-based scraping, time-series DB, PromQL query language
Grafana → dashboards on top of Prometheus (and many other sources)
LOGS ELK → Elasticsearch + Logstash + Kibana (powerful, heavy to run)
Loki → "Prometheus for logs": cheap, indexes labels not full text
TRACES Jaeger → distributed tracing, OpenTelemetry-compatible
Tempo → trace backend that pairs with Grafana/Loki
ALL-IN-ONE Datadog → managed metrics + logs + traces + APM in one product
কেন Prometheus + Grafana সাধারণ ওপেন-সোর্স কোর
Prometheus লক্ষ্য থেকে মেট্রিক্স টানে যা এটি স্ক্র্যাপ করে (সেবা /metrics প্রকাশ করে), সেগুলি একটি সময়-সিরিজ ডাটাবেসে সংরক্ষণ করে এবং PromQL দিয়ে প্রশ্ন করে। টানা লক্ষ্য আবিষ্কার এবং স্বাস্থ্য-পরীক্ষা সহজ করে। Grafana ভিজ্যুয়ালাইজেশনের জন্য শীর্ষে বসে। Loki এবং Tempo একই স্ট্যাক লগ এবং ট্রেসে প্রসারিত করে, সবকিছু একটি Grafana ইউআই-তে অনুসন্ধানযোগ্য।
# PromQL: per-route error ratio over 5 minutes
sum by (route) (rate(http_requests_total{status=~"5.."}[5m]))
/ sum by (route) (rate(http_requests_total[5m]))
স্ব-হোস্টেড বনাম পরিচালিত ট্রেডঅফ
SELF-HOSTED (Prometheus/Grafana/Loki/Tempo)
✓ no per-host bill, full control, no data leaves your infra
✗ you run, scale, and patch it; storage & HA are your problem
MANAGED (Datadog, Grafana Cloud)
✓ no ops burden, integrations out of the box, scales for you
✗ costs grow fast with hosts/volume; some vendor lock-in
কীভাবে নির্বাচন করবেন
Small team / tight budget → self-hosted Prometheus + Grafana (+ Loki)
Fast-moving, ops-light team → managed (Datadog / Grafana Cloud)
Large scale / strict cost → self-host the core, but budget for the ops team
কেন এটি গুরুত্বপূর্ণ
কোনো সর্বজনীনভাবে সেরা সরঞ্জাম নেই — শুধুমাত্র আপনার সীমাবদ্ধতার জন্য সঠিক ফিট। একটি 5-ব্যক্তির স্টার্টআপ একটি এইচএ Elasticsearch ক্লাস্টার পরিচালনা করার চেষ্টা করে ডুবে যায়; একটি বড় এন্টারপ্রাইজ বছরে ছয় অঙ্কের সংখ্যা ব্যয় করতে পারে একটি পরিচালিত প্ল্যাটফর্মে যা এটি স্ব-হোস্ট করতে পারে। জানা যে প্রতিটি সরঞ্জাম কী করে এবং স্ব-হোস্টেড-বনাম-পরিচালিত ট্রেডঅফ আপনাকে দল আকার, বাজেট এবং স্কেলের সাথে পর্যবেক্ষণযোগ্যতা মিলাতে দেয় যা জনপ্রিয় তা cargo-culting এর পরিবর্তে।
