Đây là ba cách để khiến một LLM làm điều bạn muốn, hoạt động ở các tầng khác nhau: prompting định hình hành vi, RAG bơm vào kiến thức, và fine-tuning thay đổi model.
Đây là ba cách để khiến một LLM làm điều bạn muốn, hoạt động ở các tầng khác nhau: prompting định hình hành vi, RAG bơm vào kiến thức, và fine-tuning thay đổi model.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Thay đổi | Prompt | Prompt (+ truy xuất) | Trọng số model |
| Tốt nhất cho | Hành vi, định dạng, giọng điệu | Sự thật cập nhật / riêng tư | Phong cách nhất quán, tác vụ hẹp |
| Độ mới của kiến thức | Không áp dụng | Trực tiếp (lập chỉ mục lại dữ liệu) | Đóng băng tại lúc huấn luyện |
| Chi phí / công sức | Thấp nhất | Trung bình (hạ tầng) | Cao nhất (huấn luyện + dữ liệu) |
| Cập nhật | Sửa văn bản | Cập nhật chỉ mục | Huấn luyện lại |
Chọn nhầm công cụ thì tốn kém: người ta thường cố fine-tune để thêm kiến thức (việc RAG làm tốt hơn và rẻ hơn) hoặc để sửa hành vi (việc prompting xử lý). Biết rằng prompting định hình hành vi, RAG cung cấp kiến thức, và fine-tuning thay đổi model giúp bạn chọn cách tiếp cận rẻ nhất mà vẫn hiệu quả — và kết hợp chúng một cách có chủ đích thay vì tình cờ.