Эксплуатация Kafka требует мониторинга ключевых метрик — особенно лага потребителя (насколько отстают потребители) — плюс здоровье брокеров, пропускная способность и статус партиций. Понимание мониторинга и лага потребителя важно для надежной эксплуатации Kafka.
Лаг потребителя (ключевая метрика)
CONSUMER LAG → how far BEHIND a consumer is = (latest offset) − (consumer's committed offset):
→ high/growing lag → the consumer can't keep up with the production rate (a problem!)
→ indicates: slow processing, too few consumers, a stuck/failed consumer, or a traffic spike
→ monitor lag → detect when consumers fall behind (a primary Kafka health signal)
