একটি ওয়েব পৃষ্ঠা বা API ধীর — আপনি কীভাবে কারণটি খুঁজে পান?

Question

Accepted Answer

**অনুমান করবেন না — প্রথমে পরিমাপ করুন।** ধীরতা ক্লায়েন্ট, নেটওয়ার্ক, সার্ভার বা ডাটাবেস থেকে আসতে পারে। একটি পদ্ধতিগত পদ্ধতি *কোথায়* সময় যায় তা খুঁজে পায়, তারপর **সবচেয়ে বড় অবদানকারী** ঠিক করে, বরং এলোমেলোভাবে অপ্টিমাইজ করার পরিবর্তে।

## একটি পদ্ধতিগত ক্রম

```text
1. MEASURE → where is the time spent? client render, network, server, DB?
2. REPRODUCE → confirm it reliably (same endpoint, payload, user)
3. TRACE → use APM/distributed traces to find the slow span
4. CHECK RECENT CHANGES → deploys, config, traffic, data growth
5. ISOLATE → layer by layer, narrow to one component
6. FIX the biggest contributor → re-measure to confirm
```

## প্রথমে পরিমাপ করুন: সময় কোথায়?

ব্রাউজার **Network/Performance** ট্যাব এবং সার্ভার **timing** ব্যবহার করুন মোটকে ভাগ করতে। একটি দরকারী ভাঙ্গন:

```text
Total 1200ms =
  DNS/connect      20ms
  server TTFB     900ms   ← the bottleneck is server-side
  download         80ms
  client render   200ms
```

**গড় নয়, শতাংশ** দেখুন: **p50** (সাধারণ ব্যবহারকারী) বনাম **p99** (সবচেয়ে খারাপ ক্ষেত্রে)। দ্রুত p50 সহ ধীর p99 মাঝেমাঝে সমস্যা নির্দেশ করে — লক প্রতিযোগিতা, ঠান্ডা ক্যাশ, একটি ধীর DB প্রতিলিপি, বা GC পজ — একটি ইউনিফর্ম সমস্যা নয়।

## ধীর স্প্যান ট্রেস করুন

APM সরঞ্জামগুলি (traces) ঠিক দেখায় যেখানে সময় একটি অনুরোধের মধ্যে যায়:

```text
GET /orders                       950ms
  ├─ auth check                    10ms
  ├─ SELECT orders                 30ms
  └─ loop: SELECT user per order  900ms   ← N+1 query, the real cause
```

ট্রেস সরাসরি আপত্তিকর কলটিতে নির্দেশ করে। তারপর **সম্প্রতি পরিবর্তন** চেক করুন — একটি স্থাপনা, একটি মিসিং সূচক, বা 10x ডাটা বৃদ্ধি প্রায়ই একটি আকস্মিক রিগ্রেশন ব্যাখ্যা করে।

## কেন এটি গুরুত্বপূর্ণ

অনুমান করা গলত স্তর অপ্টিমাইজ করতে ঘন্টা নষ্ট করে। প্রথমে পরিমাপ করা, ধীর স্প্যান ট্রেস করা, এবং **p50 বনাম p99** দেখা একটি অস্পষ্ট "এটি ধীর" একটি নির্দিষ্ট, ফিক্সেবল কারণে পরিণত করে — এবং পুনঃপরিমাপ প্রমাণ করে যে ঠিক সত্যিই কাজ করেছে।