Работа с Kafka в production требует внимания к размеру кластера, репликации, мониторингу, безопасности и техническому обслуживанию — Kafka — это мощная, но операционно сложная распределённая система. Понимание операционных аспектов (или использование управляемого Kafka) важно для надёжной работы.
Настройка кластера и надёжность
✓ Adequate BROKERS → size the cluster for throughput, storage, and replication needs
✓ REPLICATION → replication factor ≥ 3, min.insync.replicas for durability (no data loss)
✓ Spread across racks/AZs → survive failures (rack awareness)
✓ PARTITIONS → plan partition counts for parallelism and growth (hard to reduce later)
✓ Capacity planning → throughput, retention/storage, growth
