ทั้งสามอย่างนี้เป็นวิธีที่ทำให้ LLM ทำในสิ่งที่คุณต้องการ โดยทำงานในชั้นที่แตกต่างกัน prompting ปรับแต่ง พฤติกรรม RAG ฉีด ความรู้ เข้าไป และ fine-tuning เปลี่ยน ตัวโมเดล
ทั้งสามอย่างนี้เป็นวิธีที่ทำให้ LLM ทำในสิ่งที่คุณต้องการ โดยทำงานในชั้นที่แตกต่างกัน prompting ปรับแต่ง พฤติกรรม RAG ฉีด ความรู้ เข้าไป และ fine-tuning เปลี่ยน ตัวโมเดล
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| เปลี่ยนอะไร | ตัว prompt | ตัว prompt (+ การ retrieval) | weights ของโมเดล |
| เหมาะที่สุดสำหรับ | พฤติกรรม รูปแบบ น้ำเสียง | ข้อเท็จจริงที่ทันสมัย / เป็นความลับ | สไตล์ที่สม่ำเสมอ งานเฉพาะทาง |
| ความสดของความรู้ | ไม่เกี่ยวข้อง | สด (re-index ข้อมูลได้) | แช่แข็ง ณ เวลาเทรน |
| ต้นทุน / ความพยายาม | ต่ำสุด | ปานกลาง (โครงสร้างพื้นฐาน) | สูงสุด (เทรน + ข้อมูล) |
| การอัปเดต | แก้ข้อความ | อัปเดต index | เทรนใหม่ |
การหยิบเครื่องมือผิดมีราคาแพง ผู้คนมักพยายาม fine-tune เพื่อเพิ่มความรู้ (ซึ่ง RAG ทำได้ดีกว่าและถูกกว่า) หรือเพื่อแก้พฤติกรรม (ซึ่ง prompting จัดการได้) การรู้ว่า prompting ปรับแต่งพฤติกรรม, RAG จัดหาความรู้ และ fine-tuning เปลี่ยนตัวโมเดล ทำให้คุณเลือกแนวทางที่ถูกที่สุดที่ใช้ได้ผล และผสมผสานมันอย่างตั้งใจแทนที่จะเป็นโดยบังเอิญ