การ operate Kafka ใน production จำเป็นต้องใส่ใจเรื่อง cluster sizing, replication, monitoring, security และ maintenance — Kafka เป็นระบบ distributed ที่ทรงพลังแต่ซับซ้อนในการ operate การเข้าใจข้อพิจารณาด้านการ operate (หรือการใช้ managed Kafka) มีความสำคัญต่อการรันมันให้เชื่อถือได้
การตั้งค่า cluster และความน่าเชื่อถือ
✓ Adequate BROKERS → size the cluster for throughput, storage, and replication needs
✓ REPLICATION → replication factor ≥ 3, min.insync.replicas for durability (no data loss)
✓ Spread across racks/AZs → survive failures (rack awareness)
✓ PARTITIONS → plan partition counts for parallelism and growth (hard to reduce later)
✓ Capacity planning → throughput, retention/storage, growth
