Partitioner är centrala för Kafkas design — de möjliggör parallellism och skalbarhet (distribuera data och konsumption) samtidigt som de ger orderingsgarantier inom varje partition. Att förstå partitioner är nyckeln till att förstå hur Kafka skaleras och ordnar händelser.
Partitioner möjliggör parallellism och skalning
A topic is split into multiple PARTITIONS, distributed across brokers:
→ data is spread across partitions → distribute storage and load
→ CONSUMER PARALLELISM → each partition consumed by one consumer in a group →
more partitions = more parallel consumers = higher throughput
→ scale a topic by adding partitions (and consumers)
→ partitions are the unit of PARALLELISM and horizontal scaling in Kafka
