Rate limiting यह सीमित करता है कि एक client किसी समय-window में कितनी requests कर सकता है। आप इसे कई layers पर लागू करते हैं क्योंकि हर layer कुछ अलग देखती है, और आप इसे जो भी दुरुपयोगकर्ता की पहचान करता है उससे key करते हैं।
Rate limiting यह सीमित करता है कि एक client किसी समय-window में कितनी requests कर सकता है। आप इसे कई layers पर लागू करते हैं क्योंकि हर layer कुछ अलग देखती है, और आप इसे जो भी दुरुपयोगकर्ता की पहचान करता है उससे key करते हैं।
429 Too Many Requests को Retry-After के साथ लौटाएँ ताकि clients हथौड़े चलाने के बजाय शालीनता से पीछे हटें।# Define a shared-memory zone keyed by client IP.
# rate=10r/s = the steady refill rate (token bucket).
limit_req_zone $binary_remote_addr zone=api:10m rate=10r/s;
server {
location /api/ {
# burst=20: allow a short spike of 20 queued requests
# nodelay: serve the burst immediately instead of spacing it out
limit_req zone=api burst=20 nodelay;
# Return 429 (not the default 503) so clients see a rate-limit signal
limit_req_status 429;
proxy_pass http://backend;
}
}
यहाँ प्रत्येक IP 10 requests/second की दर से refill होता है, 20 तक burst कर सकता है, और उससे ज़्यादा कुछ भी 429 पाता है।
Rate limiting Layer 7 floods, credential stuffing, और बेकाबू scrapers के विरुद्ध आपकी सबसे सस्ती, हमेशा-चालू रक्षा है। इसे layer करना (मात्रा के लिए edge, origin के लिए proxy, business logic के लिए app) और सही ढंग से key करना दुरुपयोगकर्ताओं को रोकता है जबकि वास्तविक users — और वैध bursts — बिना रुके गुज़र जाते हैं। वास्तविक baselines से limits सेट करना ही इसे आपके अपने बनाए outage बनने से बचाता है।
विस्तृत उत्तरों के साथ IT इंटरव्यू प्रश्नों की एक लाइब्रेरी — जूनियर से सीनियर तक।
दान करें