Klíčová výhoda mikroslužeb je nezávislé škálování každé služby tak, aby odpovídalo vlastnímu zatížení, namísto škálování celé aplikace. Hledání úzkých míst se pak redukuje na měření na úrovni služby a přeskoků.
Klíčová výhoda mikroslužeb je nezávislé škálování každé služby tak, aby odpovídalo vlastnímu zatížení, namísto škálování celé aplikace. Hledání úzkých míst se pak redukuje na měření na úrovni služby a přeskoků.
# Kubernetes HPA: scale orders on CPU
minReplicas: 3
maxReplicas: 20
metric: cpu
targetUtilization: 70 # add pods when avg CPU > 70%
1. Metrics: which service has high latency / saturation? (RED/USE)
2. Traces: which SPAN in the request is slow?
3. Drill in: DB query? lock? N+1 calls? GC pause?
Gateway ──┤ Orders ──┤ Payments ████████████ ← 80% of latency here
Inventory ─┤
⚠️ Chatty synchronous calls (fan-out per request)
⚠️ Shared/overloaded database
⚠️ Missing or cold cache
⚠️ Unbounded retries amplifying load
Škálování služby, jejímž úzkým místem je sdílená databáze, pouze přenáší více zátěže na DB — škálujte skutečné omezení, ne příznak.
Nezávislé škálování vám umožní přesně nasměřovat kapacitu tam, kde je zátěž, což je mnohem levnější než celoživotní škálování monolitu.
Ale slepé škálování plýtvá penězi a může věci zhoršit; měření metrik na úrovni služby a trasování na úrovni přeskoků vám řekne skutečné omezení, které je třeba opravit.