transformer는 AI, 특히 자연어 처리를 혁신한 신경망 아키텍처(2017년 도입)입니다. 그 attention 메커니즘은 시퀀스를 효과적으로 처리하게 하며, 현대 LLM(GPT, Claude 등)의 토대입니다.
transformer란
TRANSFORMER → 시퀀스(텍스트 등)를 처리하는 신경망 아키텍처:
→ 2017년 논문 'Attention Is All You Need'에서 도입
→ ATTENTION 메커니즘을 사용(엄격히 순차 처리하는 대신)
→ 현대 LLM과 현대 AI 상당 부분의 토대
→ NLP를 혁신하고 LLM 시대를 가능하게 함
attention 메커니즘(핵심 혁신)
ATTENTION → 각 부분을 처리할 때 입력의 서로 다른 부분의 중요도를 가중하게 함:
→ 각 단어에 대해 관련 있는 다른 단어에 주목(focus) → 문맥/관계를 포착
→ 예: 대명사가 무엇을 가리키는지 이해, 장거리 의존성
→ SELF-ATTENTION → 시퀀스 내 각 요소를 다른 모든 요소와 관련시킴
✓ 가능하게 함: 장거리 문맥 포착, 병렬(PARALLEL) 처리(순차적 RNN보다 빠른 훈련),
관계 이해
→ attention이 transformer가 언어를 잘 다루는 이유
