อะไรคือความแตกต่างระหว่าง prompt engineering, RAG และ fine-tuning และจะใช้แต่ละอย่างเมื่อไหร่?

Question

Accepted Answer

ทั้งสามอย่างนี้เป็นวิธีที่ทำให้ LLM ทำในสิ่งที่คุณต้องการ โดยทำงานใน**ชั้นที่แตกต่างกัน** prompting ปรับแต่ง *พฤติกรรม* RAG ฉีด *ความรู้* เข้าไป และ fine-tuning เปลี่ยน *ตัวโมเดล*

## สามแนวทาง

- **Prompt engineering** — ปรับแต่งพฤติกรรมของโมเดลผ่านคำสั่ง บริบท และตัวอย่างใน prompt ตัวโมเดลไม่มีอะไรเปลี่ยนแปลง คุณแค่สื่อสารให้ดีขึ้น (system prompt, few-shot examples, รูปแบบเอาต์พุต) ถูกและเร็วที่สุด เป็น **ทางเลือกแรก** ของคุณ
- **RAG (retrieval-augmented generation)** — ณ เวลาที่ query เข้ามา ดึงเอกสารที่เกี่ยวข้อง (จาก vector store, ฐานข้อมูล หรือการค้นหา) แล้วแทรกเข้าไปใน prompt โมเดลจะตอบ *จาก* บริบทที่จัดหามาให้นั้น เหมาะที่สุดเมื่อความรู้นั้น **อยู่ภายนอก เป็นความลับ หรือเปลี่ยนแปลงอยู่ตลอด**
- **Fine-tuning** — เทรนโมเดลต่อด้วยตัวอย่างของคุณเอง เพื่อปรับ **weights** ของมัน วิธีนี้จะฝังสไตล์ รูปแบบ หรือทักษะเฉพาะที่สม่ำเสมอเข้าไป ทรงพลังแต่มีต้นทุนสูงและเป็นแบบ **คงที่** ความรู้จะถูกแช่แข็งไว้ ณ เวลาที่เทรน

## เปรียบเทียบ

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **เปลี่ยนอะไร** | ตัว prompt | ตัว prompt (+ การ retrieval) | weights ของโมเดล |
| **เหมาะที่สุดสำหรับ** | พฤติกรรม รูปแบบ น้ำเสียง | ข้อเท็จจริงที่ทันสมัย / เป็นความลับ | สไตล์ที่สม่ำเสมอ งานเฉพาะทาง |
| **ความสดของความรู้** | ไม่เกี่ยวข้อง | สด (re-index ข้อมูลได้) | แช่แข็ง ณ เวลาเทรน |
| **ต้นทุน / ความพยายาม** | ต่ำสุด | ปานกลาง (โครงสร้างพื้นฐาน) | สูงสุด (เทรน + ข้อมูล) |
| **การอัปเดต** | แก้ข้อความ | อัปเดต index | เทรนใหม่ |

## แนวทางการตัดสินใจ

- เริ่มด้วย **prompting** ก่อน แก้ให้ได้แบบฟรี ๆ ก่อน
- ต้องการข้อเท็จจริงที่โมเดลไม่รู้ หรือที่เปลี่ยนแปลง (เอกสาร ราคา ข้อมูลภายใน) ใช่ไหม? ใช้ **RAG**
- ต้องการสไตล์/รูปแบบที่เชื่อถือได้ หรืองานเฉพาะทางในระดับสเกล และ prompting ยังไม่สม่ำเสมอพอ? **Fine-tune**
- ทั้งหมดนี้ **ผสมกันได้** โมเดลที่ fine-tune แล้วบวกกับ RAG และ prompt ที่ดี เป็นเรื่องปกติในงาน production

## ทำไมจึงสำคัญ

การหยิบเครื่องมือผิดมีราคาแพง ผู้คนมักพยายาม fine-tune เพื่อเพิ่มความรู้ (ซึ่ง RAG ทำได้ดีกว่าและถูกกว่า) หรือเพื่อแก้พฤติกรรม (ซึ่ง prompting จัดการได้) การรู้ว่า **prompting ปรับแต่งพฤติกรรม, RAG จัดหาความรู้ และ fine-tuning เปลี่ยนตัวโมเดล** ทำให้คุณเลือกแนวทางที่ถูกที่สุดที่ใช้ได้ผล และผสมผสานมันอย่างตั้งใจแทนที่จะเป็นโดยบังเอิญ

	Prompt engineering	RAG	Fine-tuning
เปลี่ยนอะไร	ตัว prompt	ตัว prompt (+ การ retrieval)	weights ของโมเดล
เหมาะที่สุดสำหรับ	พฤติกรรม รูปแบบ น้ำเสียง	ข้อเท็จจริงที่ทันสมัย / เป็นความลับ	สไตล์ที่สม่ำเสมอ งานเฉพาะทาง
ความสดของความรู้	ไม่เกี่ยวข้อง	สด (re-index ข้อมูลได้)	แช่แข็ง ณ เวลาเทรน
ต้นทุน / ความพยายาม	ต่ำสุด	ปานกลาง (โครงสร้างพื้นฐาน)	สูงสุด (เทรน + ข้อมูล)
การอัปเดต	แก้ข้อความ	อัปเดต index	เทรนใหม่