Apache Kafka è una piattaforma di streaming di eventi distribuita — un sistema ad alto throughput e durevole per pubblicare, archiviare ed elaborare flussi di eventi (record). È utilizzato per messaging, pipeline dati in tempo reale, architetture event-driven e stream processing su larga scala.
Cos'è Kafka
Kafka = a distributed, durable, high-throughput EVENT STREAMING platform:
→ PUBLISH events (producers write) and SUBSCRIBE to them (consumers read)
→ STORE streams of events durably (a distributed, replicated commit LOG)
→ PROCESS streams in real time
→ think of it as a durable, scalable, append-only LOG of events that many systems can
write to and read from
