Kafka Connect là một framework để tích hợp Kafka với các hệ thống bên ngoài (database, storage, service) — di chuyển dữ liệu vào và ra khỏi Kafka mà không cần viết code tùy chỉnh, dùng các connector có thể tái sử dụng. Nó đơn giản hóa việc xây dựng data pipeline.
Kafka Connect làm gì
KAFKA CONNECT → một framework để stream dữ liệu GIỮA Kafka và các hệ thống bên ngoài:
→ connector SOURCE → kéo dữ liệu TỪ hệ thống bên ngoài VÀO Kafka (ví dụ một database → Kafka)
→ connector SINK → đẩy dữ liệu TỪ Kafka TỚI hệ thống bên ngoài (ví dụ Kafka → một data warehouse)
→ dùng các CONNECTOR có thể tái sử dụng (tích hợp dựng sẵn) thay vì code producer/consumer tùy chỉnh
→ "cắm" connector vào để tích hợp các hệ thống với Kafka
