production में Kafka को operate करने के लिए cluster sizing, replication, monitoring, security और maintenance पर ध्यान देना आवश्यक है — Kafka एक शक्तिशाली लेकिन operationally जटिल distributed system है। इसे विश्वसनीय रूप से चलाने के लिए operational विचारों को समझना (या managed Kafka का उपयोग करना) महत्वपूर्ण है।
Cluster setup और reliability
✓ Adequate BROKERS → size the cluster for throughput, storage, and replication needs
✓ REPLICATION → replication factor ≥ 3, min.insync.replicas for durability (no data loss)
✓ Spread across racks/AZs → survive failures (rack awareness)
✓ PARTITIONS → plan partition counts for parallelism and growth (hard to reduce later)
✓ Capacity planning → throughput, retention/storage, growth
