আপনি রেট লিমিটিং কীভাবে ডিজাইন করবেন?

Question

Accepted Answer

**Rate limiting** ক্লায়েন্টকে একটি সময়-উইন্ডোতে কতগুলি অনুরোধ করতে পারে তা সীমাবদ্ধ করে — সিস্টেমগুলিকে অপব্যবহার থেকে রক্ষা করে, ওভারলোড প্রতিরোধ করে এবং ন্যায্য ব্যবহার নিশ্চিত করে। এটি একটি সাধারণ সিস্টেম-ডিজাইন উপাদান, বেশ কয়েকটি অ্যালগরিদম এবং বিবেচনা সহ।

## Rate limiting কেন প্রয়োজন

```text
✓ PROTECT against abuse → prevent attacks (brute force, scraping, DoS), excessive use
✓ PREVENT OVERLOAD → protect the system from being overwhelmed (stability)
✓ FAIR USAGE → ensure no single client monopolizes resources; tiered limits (free vs paid)
✓ COST control; protect downstream services
→ a common requirement for APIs and services.
```

## Rate limiting অ্যালগরিদম

```text
FIXED WINDOW → count requests per fixed time window (e.g. 100/minute); simple
  ✗ allows bursts at window boundaries (up to 2x at the edges)
SLIDING WINDOW → rolling time window → smoother, no boundary bursts (more accurate)
TOKEN BUCKET → tokens refill at a rate; each request takes a token → allows BURSTS up to
  the bucket size while limiting the average rate (popular, flexible)
LEAKY BUCKET → requests processed at a steady rate (smooths output)
```

## বাস্তবায়ন বিবেচনা

```text
✓ DISTRIBUTED → limits must be shared across servers → use a centralized store (REDIS is
  common: atomic counters, fast, shared across instances)
✓ Identify the client → by API key, user ID, IP
✓ Return clear responses → HTTP 429 (Too Many Requests); include limit/retry-after headers
✓ Where → at the API gateway, load balancer, or application layer
✓ Granularity → per user, per endpoint, global; different tiers/limits
```

## এটি কেন গুরুত্বপূর্ণ

Rate limiting ডিজাইন করতে বোঝা মূল্যবান কারণ এটি সিস্টেম রক্ষা এবং ন্যায্য ব্যবহার নিশ্চিত করার জন্য একটি **সাধারণ সিস্টেম-ডিজাইন উপাদান**, তাই এটি গুরুত্বপূর্ণ ব্যবহারিক জ্ঞান।

Rate limiting — একটি সময়-উইন্ডোতে ক্লায়েন্টকে কতগুলি অনুরোধ করতে পারে তা সীমাবদ্ধ করা — গুরুত্বপূর্ণ চাহিদা সমাধান করে: **অপব্যবহারের বিরুদ্ধে সুরক্ষা** (brute force, scraping, এবং DoS এর মতো আক্রমণ প্রতিরোধ করে), **ওভারলোড প্রতিরোধ** (সিস্টেম স্থিতিশীলতা রক্ষা করে), **ন্যায্য ব্যবহার** নিশ্চিত করা (কোনো ক্লায়েন্ট সম্পদ একচেটিয়া করে না, free এবং paid এর মতো স্তরযুক্ত সীমা সমর্থন করে), এবং খরচ নিয়ন্ত্রণ।

এগুলি rate limiting কে API এবং পরিষেবাগুলির জন্য একটি সাধারণ প্রয়োজনীয়তা করে তোলে।

**অ্যালগরিদম** এবং তাদের trade-off বোঝা — **fixed window** (সহজ কিন্তু সীমানা burst অনুমতি দেয়), **sliding window** (মসৃণ এবং আরও সঠিক), **token bucket** (নিয়ন্ত্রিত burst অনুমতি দেয় যখন গড় হার সীমাবদ্ধ করে — জনপ্রিয় এবং নমনীয়), এবং leaky bucket (আউটপুট মসৃণ করা) — মূল ডিজাইন জ্ঞান, কারণ সঠিক অ্যালগরিদম নির্বাচন আচরণ প্রভাবিত করে।

**বাস্তবায়ন বিবেচনা** বোঝা বিশেষভাবে গুরুত্বপূর্ণ: **বিতরণ করা rate limiting** পরিচালনা করা (একাধিক সার্ভার জুড়ে ভাগ করা সীমা, সাধারণত **Redis** ব্যবহার করে দ্রুত পারমাণবিক কাউন্টার যা উদাহরণ জুড়ে ভাগ করা হয় — কারণ প্রতি-সার্ভার সীমা বিতরণ করা সিস্টেমে কাজ করে না), ক্লায়েন্ট সনাক্ত করা (API কী, ব্যবহারকারী, বা IP দ্বারা), স্পষ্ট প্রতিক্রিয়া ফিরিয়ে দেওয়া (HTTP 429 retry-after শিরোনাম সহ), এটি কোথায় প্রয়োগ করবেন তা নির্বাচন করা (gateway, load balancer, বা অ্যাপ্লিকেশন), এবং granularity (প্রতি ব্যবহারকারী, প্রতি endpoint, স্তরযুক্ত)।

এগুলি বাস্তব বিতরণ করা সিস্টেমে কাজ করে এমন rate limiting ডিজাইন করা প্রতিফলিত করে।

Rate limiting একটি ঘন ঘন প্রয়োজনীয় উপাদান, প্রায়ই সিস্টেম ডিজাইন আলোচনা এবং সাক্ষাত্কারে উপস্থিত থাকে।

Rate limiting একটি সাধারণ, গুরুত্বপূর্ণ উপাদান কারণ এটি সিস্টেম রক্ষা করে (অপব্যবহার এবং ওভারলোড থেকে) এবং ন্যায্য ব্যবহার নিশ্চিত করে, এবং অ্যালগরিদম, তাদের trade-off, এবং বিশেষ করে বিতরণ করা বাস্তবায়ন (Redis এর মাধ্যমে ভাগ করা সীমা) বোঝা সুডিজাইন করার জন্য গুরুত্বপূর্ণ, rate limiting ডিজাইন করতে বোঝা মূল্যবান, ব্যবহারিক-প্রাসঙ্গিক সিস্টেম-ডিজাইন জ্ঞান — পরিষেবা রক্ষা এবং ন্যায্য ব্যবহার নিশ্চিত করার জন্য একটি সাধারণ উপাদান, অ্যালগরিদম এবং বিতরণ করা বাস্তবায়ন বোঝা প্রয়োজন, এবং শক্তিশালী, সুরক্ষিত সিস্টেম তৈরির জন্য সিস্টেম ডিজাইনে একটি ঘন ঘন আলোচিত বিষয়।