Vận hành RabbitMQ đòi hỏi giám sát các metric chính (độ sâu queue, tốc độ message, sức khỏe consumer, tài nguyên) và dùng các công cụ quản lý. Hiểu giám sát và quản lý là quan trọng để chạy RabbitMQ đáng tin cậy.
Các metric chính cần giám sát
✓ ĐỘ SÂU QUEUE (length) → queue đang tăng = consumer không theo kịp (một tín hiệu chính!) — giống
consumer lag; điều tra (thêm consumer, sửa xử lý chậm)
✓ TỐC ĐỘ MESSAGE → tốc độ publish vs tốc độ deliver/ack (vào vs ra — chúng có cân bằng không?)
✓ Số lượng và sức khỏe CONSUMER → consumer có được kết nối và đang xử lý không?
✓ Message UNACKED → nhiều unacked = consumer chậm/bị kẹt
✓ TÀI NGUYÊN → bộ nhớ, đĩa, CPU, connection, file descriptor (RabbitMQ có cảnh báo bộ nhớ/đĩa
chặn publishing khi đạt ngưỡng!)
✓ Kích thước DEAD LETTER queue → message thất bại tích lũy (báo hiệu vấn đề)
