Vận hành Kafka đòi hỏi giám sát các metric then chốt — đặc biệt là consumer lag (consumer đang tụt lại bao xa) — cộng với sức khỏe broker, thông lượng và trạng thái partition. Hiểu giám sát và consumer lag là quan trọng để chạy Kafka tin cậy.
Consumer lag (một metric then chốt)
CONSUMER LAG → consumer TỤT LẠI bao xa = (offset mới nhất) − (offset đã commit của consumer):
→ lag cao/tăng dần → consumer không theo kịp tốc độ produce (một vấn đề!)
→ cho biết: xử lý chậm, quá ít consumer, một consumer bị kẹt/lỗi, hoặc một đợt tăng đột biến lưu lượng
→ giám sát lag → phát hiện khi consumer tụt lại (một tín hiệu sức khỏe Kafka chính)
