LLM จะเกิดการ hallucinate เมื่อมันสร้างข้อความที่ฟังดูมั่นใจและน่าเชื่อถือ แต่ที่จริงแล้วผิดข้อเท็จจริงหรือเป็นเรื่องที่กุขึ้นมา เพื่อจะเข้าใจว่าทำไม คุณต้องเข้าใจก่อนว่าโมเดลทำอะไรจริง ๆ
LLM ทำงานอย่างไร (โดยย่อ)
ในระดับภาพรวม LLM คือ เมื่อให้ข้อความที่มีมาจนถึงตอนนี้ มันจะทำนาย token (คำ/ชิ้นส่วน) ถัดไปที่น่าจะเป็นไปได้มากที่สุดโดยอาศัย ไม่ใช่การไปค้นข้อเท็จจริงจากฐานข้อมูล
