Apache Kafka là một nền tảng event streaming phân tán — một hệ thống thông lượng cao, bền vững để phát hành, lưu trữ và xử lý các luồng sự kiện (record). Nó được dùng cho messaging, data pipeline thời gian thực, kiến trúc hướng sự kiện (event-driven) và xử lý luồng (stream processing) ở quy mô lớn.
Kafka là gì
Kafka = một nền tảng EVENT STREAMING phân tán, bền vững, thông lượng cao:
→ PUBLISH sự kiện (producer ghi) và SUBSCRIBE chúng (consumer đọc)
→ LƯU TRỮ các luồng sự kiện một cách bền vững (một commit LOG phân tán, được replicate)
→ XỬ LÝ các luồng theo thời gian thực
→ hãy hình dung nó như một LOG sự kiện chỉ-thêm (append-only), bền vững, có khả năng mở rộng mà nhiều
hệ thống có thể ghi vào và đọc ra
