Training là quá trình dạy một model ML từ dữ liệu (học các mẫu, điều chỉnh parameter), trong khi inference là việc dùng model đã huấn luyện để đưa ra dự đoán trên dữ liệu mới. Đó là hai giai đoạn riêng biệt với các đặc điểm và chi phí khác nhau.
Training so với inference
TRAINING → dạy model (giai đoạn HỌC):
→ cung cấp nhiều DỮ LIỆU → model điều chỉnh các parameter của nó để học các mẫu
→ tốn TÀI NGUYÊN tính toán (nhiều dữ liệu, tính toán, thời gian — vd huấn luyện một LLM tốn
tài nguyên khổng lồ); làm một lần (hoặc định kỳ để cập nhật)
→ tạo ra một MODEL đã huấn luyện
INFERENCE → dùng model đã huấn luyện (giai đoạn DỰ ĐOÁN):
→ đưa cho model đã huấn luyện input MỚI → nó tạo ra một output (dự đoán/sinh)
→ RẺ HƠN/nhanh hơn nhiều so với training (một forward pass duy nhất); làm NHIỀU lần (mỗi
lần bạn dùng model)
→ huấn luyện một lần (tốn kém), inference nhiều lần (rẻ hơn, trong production)
