Transformer は 2017 年に導入された neural network architecture で、特に natural language processing を大きく変えました。attention mechanism により sequence を効果的に処理でき、GPT や Claude など modern LLM の foundation です。
transformer とは
text
TRANSFORMER → SEQUENCES (text など) を処理する neural network architecture:
→ 2017 paper 'Attention Is All You Need' で導入
→ strict sequential processing ではなく ATTENTION mechanism を使う
→ modern LLMs と modern AI の大きな foundation
attention mechanism
text
ATTENTION → 各 part を処理するとき、input の他の part の重要度を WEIGH する:
→ 各 word が relevant な他の word に attend し、context/relationship を capture
→ pronoun が何を指すか、long-range dependency などを扱える
→ SELF-ATTENTION → sequence 内の各 element を全 element と関連付ける
✓ long-range context, PARALLEL processing, relationship understanding を可能にする
