LLM が hallucinate するとは、confident で plausible に見えるが factually wrong または invented な text を出すことです。理由を理解するには、model が実際に何をしているかを理解する必要があります。
LLM の仕組み(簡単に)
LLM は高レベルでは next-token predictor です。これまでの text に基づき、training 中に学んだ statistical patterns から最もありそうな next token を予測します。database で fact を lookup しているわけではありません。
text
input: "The capital of Australia is"
model: P(next token) → "Canberra" 0.71, "Sydney" 0.18, ...
→ samples a token, appends it, repeats
