Bên trong, Kafka lưu dữ liệu như một log chỉ-thêm trên đĩa (tổ chức theo các segment), dùng các kỹ thuật I/O hiệu quả, và quản lý metadata cluster qua ZooKeeper (trước đây) hoặc KRaft (nay). Hiểu các nội tại làm sâu sắc sự hiểu biết về hành vi và hiệu năng của Kafka.
Lưu trữ commit log
Mỗi partition là một LOG chỉ-thêm được lưu trên đĩa, chia thành các SEGMENT (file):
→ sự kiện mới được THÊM vào cuối (ghi tuần tự → nhanh)
→ sự kiện bất biến một khi được ghi; được xác định bởi OFFSET
→ các segment cũ bị xóa (giữ lại) hoặc nén compaction
→ một INDEX ánh xạ offset tới vị trí file (tra cứu nhanh)
→ log chỉ-thêm là cốt lõi của thiết kế Kafka (bền vững, tuần tự, hiệu quả)
