LLM은 자신감 있고 그럴듯하게 들리지만 사실과 다르거나 지어낸 텍스트를 생성할 때 **hallucinate(환각)**합니다. 그 이유를 이해하려면 먼저 모델이 실제로 무엇을 하는지 이해해야 합니다.
LLM의 작동 방식 (간략히)
높은 수준에서 LLM은 다음 토큰 예측기입니다. 지금까지의 텍스트가 주어지면, 훈련 중 학습한 통계적 패턴을 바탕으로 가장 가능성 높은 다음 토큰(단어/조각)을 예측합니다 — 데이터베이스에서 사실을 조회하는 것이 아닙니다.
text
input: "The capital of Australia is"
model: P(next token) → "Canberra" 0.71, "Sydney" 0.18, ...
→ 토큰을 샘플링하고 덧붙인 뒤 반복
