অনুমান করবেন না — প্রথমে পরিমাপ করুন। ধীরতা ক্লায়েন্ট, নেটওয়ার্ক, সার্ভার বা ডাটাবেস থেকে আসতে পারে। একটি পদ্ধতিগত পদ্ধতি কোথায় সময় যায় তা খুঁজে পায়, তারপর সবচেয়ে বড় অবদানকারী ঠিক করে, বরং এলোমেলোভাবে অপ্টিমাইজ করার পরিবর্তে।
অনুমান করবেন না — প্রথমে পরিমাপ করুন। ধীরতা ক্লায়েন্ট, নেটওয়ার্ক, সার্ভার বা ডাটাবেস থেকে আসতে পারে। একটি পদ্ধতিগত পদ্ধতি কোথায় সময় যায় তা খুঁজে পায়, তারপর সবচেয়ে বড় অবদানকারী ঠিক করে, বরং এলোমেলোভাবে অপ্টিমাইজ করার পরিবর্তে।
1. MEASURE → where is the time spent? client render, network, server, DB?
2. REPRODUCE → confirm it reliably (same endpoint, payload, user)
3. TRACE → use APM/distributed traces to find the slow span
4. CHECK RECENT CHANGES → deploys, config, traffic, data growth
5. ISOLATE → layer by layer, narrow to one component
6. FIX the biggest contributor → re-measure to confirm
ব্রাউজার Network/Performance ট্যাব এবং সার্ভার timing ব্যবহার করুন মোটকে ভাগ করতে। একটি দরকারী ভাঙ্গন:
Total 1200ms =
DNS/connect 20ms
server TTFB 900ms ← the bottleneck is server-side
download 80ms
client render 200ms
গড় নয়, শতাংশ দেখুন: p50 (সাধারণ ব্যবহারকারী) বনাম p99 (সবচেয়ে খারাপ ক্ষেত্রে)। দ্রুত p50 সহ ধীর p99 মাঝেমাঝে সমস্যা নির্দেশ করে — লক প্রতিযোগিতা, ঠান্ডা ক্যাশ, একটি ধীর DB প্রতিলিপি, বা GC পজ — একটি ইউনিফর্ম সমস্যা নয়।
APM সরঞ্জামগুলি (traces) ঠিক দেখায় যেখানে সময় একটি অনুরোধের মধ্যে যায়:
GET /orders 950ms
├─ auth check 10ms
├─ SELECT orders 30ms
└─ loop: SELECT user per order 900ms ← N+1 query, the real cause
ট্রেস সরাসরি আপত্তিকর কলটিতে নির্দেশ করে। তারপর সম্প্রতি পরিবর্তন চেক করুন — একটি স্থাপনা, একটি মিসিং সূচক, বা 10x ডাটা বৃদ্ধি প্রায়ই একটি আকস্মিক রিগ্রেশন ব্যাখ্যা করে।
অনুমান করা গলত স্তর অপ্টিমাইজ করতে ঘন্টা নষ্ট করে। প্রথমে পরিমাপ করা, ধীর স্প্যান ট্রেস করা, এবং p50 বনাম p99 দেখা একটি অস্পষ্ট "এটি ধীর" একটি নির্দিষ্ট, ফিক্সেবল কারণে পরিণত করে — এবং পুনঃপরিমাপ প্রমাণ করে যে ঠিক সত্যিই কাজ করেছে।