Batching (gộp tin nhắn) và nén (compress dữ liệu) là các kỹ thuật then chốt cho thông lượng Kafka cao — giảm overhead theo từng tin nhắn và chi phí mạng/lưu trữ. Hiểu chúng giúp đạt hiệu năng cao của Kafka.
Batching — gộp tin nhắn
BATCHING → producer gộp nhiều tin nhắn vào một BATCH duy nhất trước khi gửi:
→ ít request hơn, lớn hơn thay vì nhiều request nhỏ → THÔNG LƯỢNG cao hơn nhiều (ít
overhead mỗi request, ít round-trip mạng hơn)
→ được kiểm soát bởi: batch.size (giới hạn kích thước batch) + linger.ms (thời gian chờ để tích lũy một batch)
→ đánh đổi: ĐỘ TRỄ cao hơn một chút (chờ để batch) đổi lấy thông lượng cao hơn nhiều
→ batching là thiết yếu cho việc produce thông lượng cao
