LLM 在生成听起来自信且合理但事实上错误或编造的文本时会发生幻觉。要理解原因,你首先必须理解该模型实际上做了什么。
LLM 如何工作(简要说明)
在高层次上,LLM 是一个next-token 预测器。给定目前为止的文本,它根据训练期间学到的统计模式预测最可能的下一个 token(单词/片段)——而不是通过在数据库中查找事实。
text
input: "The capital of Australia is"
model: P(next token) → "Canberra" 0.71, "Sydney" 0.18, ...
→ samples a token, appends it, repeats
