Kafka Streams là một library cho stream processing — xây dựng các ứng dụng xử lý và biến đổi dữ liệu trong topic Kafka theo thời gian thực (lọc, biến đổi, tổng hợp, join các luồng). Nó cho phép xử lý dữ liệu thời gian thực trực tiếp trên Kafka.
Stream processing là gì
STREAM PROCESSING → xử lý dữ liệu LIÊN TỤC khi nó đến (theo thời gian thực), vs batch
(xử lý dữ liệu đã lưu định kỳ):
→ tiêu thụ sự kiện từ topic, biến đổi/phân tích chúng, tạo ra kết quả (thường tới topic khác)
→ thời gian thực: phản ứng và xử lý sự kiện ngay khi chúng xảy ra (độ trễ thấp)
→ dành cho: analytics thời gian thực, biến đổi, monitoring, làm giàu, tổng hợp
