Kafkaは大規模なスループット(毎秒数百万イベント)に対応し、パーティショニング、ブローカーとコンシューマーの追加、チューニングを通じてスケーリングします。Kafkaがどのようにスケーリングするかを理解することは、大量データ処理の本番環境にとって重要です。
スケーリングレバー
✓ PARTITIONS → the primary scaling unit: more partitions → more parallelism (producer and
consumer) → distribute data and load across brokers and consumers
✓ BROKERS → add brokers to the cluster → more storage, throughput, and capacity (spread
partitions across more machines)
✓ CONSUMERS → add consumers to a group (up to partition count) → parallel consumption
✓ PRODUCERS → batching, compression, multiple producers → high write throughput
→ Kafka scales HORIZONTALLY (add partitions/brokers/consumers)
