ทำไม LLM ถึง hallucinate และจะลดปัญหานี้ได้อย่างไร?

Question

Accepted Answer

LLM จะเกิดการ **hallucinate** เมื่อมันสร้างข้อความที่ฟังดูมั่นใจและน่าเชื่อถือ แต่ที่จริงแล้วผิดข้อเท็จจริงหรือเป็นเรื่องที่กุขึ้นมา เพื่อจะเข้าใจว่าทำไม คุณต้องเข้าใจก่อนว่าโมเดลทำอะไรจริง ๆ

## LLM ทำงานอย่างไร (โดยย่อ)

ในระดับภาพรวม LLM คือ **ตัวทำนาย token ถัดไป (next-token predictor)** เมื่อให้ข้อความที่มีมาจนถึงตอนนี้ มันจะทำนาย token (คำ/ชิ้นส่วน) ถัดไปที่น่าจะเป็นไปได้มากที่สุดโดยอาศัย **รูปแบบเชิงสถิติที่เรียนรู้มาระหว่างการเทรน** ไม่ใช่การไปค้นข้อเท็จจริงจากฐานข้อมูล

```text
input: "The capital of Australia is"
model: P(next token) → "Canberra" 0.71, "Sydney" 0.18, ...
→ samples a token, appends it, repeats
```

## ทำไมจึงเกิด hallucination

- **มันสร้างขึ้นมา ไม่ได้ดึงข้อมูลมา** โมเดลผลิตข้อความที่ *ดูน่าเชื่อ* ไม่ใช่ข้อเท็จจริงที่ *ได้รับการตรวจสอบ* ความลื่นไหลของภาษากับความจริงเป็นสิ่งที่เป็นอิสระต่อกัน
- **ไม่มีการตรวจสอบความจริงในตัว** ไม่มีอะไรภายในโมเดลที่นำผลลัพธ์ไปเทียบกับความเป็นจริง
- **ช่องว่างถูกเติมเต็มด้วยความมั่นใจ** เมื่อข้อมูลเทรนมีน้อย คลุมเครือ หรือขาดหายไป (API ที่หายาก เหตุการณ์ล่าสุด บุคคลที่ไม่เป็นที่รู้จัก) โมเดลก็ยังคงปล่อยข้อความต่อเนื่องที่มีโอกาสเป็นไปได้เชิงสถิติออกมา ซึ่งอาจผิดได้
- **ความมั่นใจไม่ใช่ความถูกต้อง** การอ้างอิงที่กุขึ้นมาดูลื่นไหลเหมือนกับการอ้างอิงจริงทุกประการ

## จะลดมันได้อย่างไร

- **ยึดโยงด้วย RAG / แหล่งข้อมูล** ดึงเอกสารที่เกี่ยวข้องมาใส่ไว้ใน prompt เพื่อให้โมเดลตอบ *จาก* ข้อความจริงแทนการพึ่งความจำ
- **ขอให้อ้างอิงแหล่งที่มา** แล้วตรวจสอบมัน เพราะการอ้างอิงที่กุขึ้นมาจะเผยให้เห็น hallucination
- **ลดค่า temperature** สำหรับงานที่เน้นข้อเท็จจริง เพื่อให้โมเดลเลือก token ที่มีความน่าจะเป็นสูง (ปลอดภัยกว่า)
- **อนุญาตให้พูดว่า "ไม่รู้"** สั่งโมเดลอย่างชัดเจนให้บอกว่าไม่รู้เมื่อไม่แน่ใจ เพื่อขจัดแรงกดดันให้ต้องกุขึ้นมา
- **ตรวจสอบด้วยเครื่องมือ** รันโค้ด สอบถามเครื่องคิดเลข/การค้นหา/ฐานข้อมูล หรือเรียก API แทนที่จะเชื่อความจำของโมเดล
- **จำกัดขอบเขตให้แคบลง** prompt ที่เฉพาะเจาะจงและมีขอบเขตชัดเจนจะ hallucinate น้อยกว่า prompt แบบปลายเปิด

## ทำไมจึงสำคัญ

LLM ถูกฝังเข้าไปในผลิตภัณฑ์ที่ผู้ใช้จริงไว้วางใจมากขึ้นเรื่อย ๆ เพราะโมเดล **สร้างข้อความที่ดูน่าเชื่อขึ้นมาแทนที่จะดึงข้อเท็จจริง** hallucination จึงเป็นพฤติกรรมโดยธรรมชาติ ไม่ใช่บั๊กที่เกิดขึ้นเป็นครั้งคราว ดังนั้นวิศวกรจึงต้องออกแบบโดยคำนึงถึงมัน การรู้ว่า *ทำไม* มันถึงเกิด (การทำนาย token ถัดไปโดยไม่มีการตรวจสอบความจริง) จะบอกคุณว่า *จะ* บรรเทามันได้ *อย่างไร* ทั้งการยึดโยงข้อมูล การอ้างอิงแหล่งที่มา การลดค่า temperature การอนุญาตให้งดตอบ และการตรวจสอบจากภายนอก การมองผลลัพธ์ของ LLM เป็นร่างที่ต้องตรวจสอบ ไม่ใช่คำพยากรณ์ที่เชื่อถือได้สมบูรณ์ คือความแตกต่างระหว่างฟีเจอร์ที่เชื่อถือได้กับภาระที่ดูมั่นใจแต่เป็นอันตราย