Vận hành Kafka trong production đòi hỏi chú ý đến kích thước cluster, replication, giám sát, bảo mật và bảo trì — Kafka là một hệ thống phân tán mạnh mẽ nhưng phức tạp về vận hành. Hiểu các cân nhắc vận hành (hoặc dùng Kafka quản lý) là quan trọng để chạy nó tin cậy.
Thiết lập cluster và độ tin cậy
✓ Đủ BROKER → định kích thước cluster cho nhu cầu thông lượng, lưu trữ và replication
✓ REPLICATION → replication factor ≥ 3, min.insync.replicas cho độ bền (không mất dữ liệu)
✓ Trải qua các rack/AZ → sống sót qua lỗi (rack awareness)
✓ PARTITION → lập kế hoạch số partition cho song song hóa và tăng trưởng (khó giảm sau này)
✓ Lập kế hoạch dung lượng → thông lượng, giữ lại/lưu trữ, tăng trưởng
