Sự khác biệt giữa prompt engineering, RAG và fine-tuning là gì, và khi nào dùng mỗi cái?

Question

Accepted Answer

Đây là ba cách để khiến một LLM làm điều bạn muốn, hoạt động ở **các tầng khác nhau**: prompting định hình *hành vi*, RAG bơm vào *kiến thức*, và fine-tuning thay đổi *model*.

## Ba cách tiếp cận

- **Prompt engineering** — định hình hành vi của model thông qua hướng dẫn, ngữ cảnh và ví dụ trong prompt. Không có gì về model thay đổi; bạn chỉ giao tiếp tốt hơn (system prompt, ví dụ few-shot, định dạng output). Rẻ và nhanh nhất; là **lựa chọn đầu tiên** của bạn.
- **RAG (retrieval-augmented generation)** — tại thời điểm truy vấn, truy xuất các tài liệu liên quan (từ vector store, cơ sở dữ liệu, hoặc tìm kiếm) và chèn vào prompt. Model trả lời *từ* ngữ cảnh được cung cấp đó. Tốt nhất khi kiến thức là **bên ngoài, riêng tư, hoặc thay đổi**.
- **Fine-tuning** — tiếp tục huấn luyện model trên các ví dụ của riêng bạn, điều chỉnh **trọng số (weights)** của nó. Việc này nung vào một phong cách, định dạng, hoặc kỹ năng hẹp nhất quán. Mạnh mẽ nhưng tốn kém và **tĩnh** — kiến thức bị đóng băng tại thời điểm huấn luyện.

## So sánh

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Thay đổi** | Prompt | Prompt (+ truy xuất) | Trọng số model |
| **Tốt nhất cho** | Hành vi, định dạng, giọng điệu | Sự thật cập nhật / riêng tư | Phong cách nhất quán, tác vụ hẹp |
| **Độ mới của kiến thức** | Không áp dụng | Trực tiếp (lập chỉ mục lại dữ liệu) | Đóng băng tại lúc huấn luyện |
| **Chi phí / công sức** | Thấp nhất | Trung bình (hạ tầng) | Cao nhất (huấn luyện + dữ liệu) |
| **Cập nhật** | Sửa văn bản | Cập nhật chỉ mục | Huấn luyện lại |

## Hướng dẫn quyết định

- Bắt đầu với **prompting** — giải quyết miễn phí trước đã.
- Cần sự thật mà model không biết, hoặc thay đổi (tài liệu, giá cả, dữ liệu nội bộ)? Dùng **RAG**.
- Cần một phong cách/định dạng đáng tin cậy hoặc một tác vụ chuyên biệt ở quy mô lớn, và prompting chưa đủ nhất quán? **Fine-tune**.
- Chúng **kết hợp được**: một model đã fine-tune cùng với RAG và một prompt tốt là phổ biến trong production.

## Tại sao điều này quan trọng

Chọn nhầm công cụ thì tốn kém: người ta thường cố fine-tune để thêm kiến thức (việc RAG làm tốt hơn và rẻ hơn) hoặc để sửa hành vi (việc prompting xử lý). Biết rằng **prompting định hình hành vi, RAG cung cấp kiến thức, và fine-tuning thay đổi model** giúp bạn chọn cách tiếp cận rẻ nhất mà vẫn hiệu quả — và kết hợp chúng một cách có chủ đích thay vì tình cờ.

	Prompt engineering	RAG	Fine-tuning
Thay đổi	Prompt	Prompt (+ truy xuất)	Trọng số model
Tốt nhất cho	Hành vi, định dạng, giọng điệu	Sự thật cập nhật / riêng tư	Phong cách nhất quán, tác vụ hẹp
Độ mới của kiến thức	Không áp dụng	Trực tiếp (lập chỉ mục lại dữ liệu)	Đóng băng tại lúc huấn luyện
Chi phí / công sức	Thấp nhất	Trung bình (hạ tầng)	Cao nhất (huấn luyện + dữ liệu)
Cập nhật	Sửa văn bản	Cập nhật chỉ mục	Huấn luyện lại