Kafka được dùng trong nhiều kịch bản liên quan đến dữ liệu khối lượng lớn, thời gian thực hoặc streaming — messaging, data pipeline, kiến trúc event-driven, stream processing, tổng hợp log, và nhiều hơn nữa. Hiểu các use case làm rõ Kafka phù hợp ở đâu.
Các use case phổ biến
✓ MESSAGING / event streaming → pub/sub tách rời giữa các service ở quy mô lớn
✓ DATA PIPELINE / tích hợp → stream dữ liệu tin cậy giữa các hệ thống (database, service,
data warehouse, analytics) — một "xương sống" dữ liệu trung tâm
✓ KIẾN TRÚC EVENT-DRIVEN → service phát ra và phản ứng với sự kiện; event sourcing (sự kiện là
nguồn chân lý)
✓ STREAM PROCESSING → xử lý/analytics thời gian thực trên luồng sự kiện (Kafka Streams, Flink)
✓ TỔNG HỢP LOG → thu thập log/metrics từ nhiều service vào một luồng
✓ THEO DÕI HOẠT ĐỘNG → hoạt động người dùng, clickstream, telemetry ở khối lượng lớn
✓ CHANGE DATA CAPTURE (CDC) → stream các thay đổi database tới các hệ thống khác
✓ METRICS / monitoring → thu thập và xử lý metrics thời gian thực
