Transformer on neuroverkkoarkkitehtuuri (esitelty vuonna 2017), joka mullisti tekoälyn, erityisesti luonnollisen kielen käsittelyn. Sen attention-mekanismi mahdollistaa sekvenssien tehokkaan käsittelyn, ja se on nykyaikaisten LLM-mallien (GPT, Claude jne.) perusta.
Mitä transformerit ovat
TRANSFORMER → a neural network architecture for processing SEQUENCES (text, etc.):
→ introduced in the 2017 paper 'Attention Is All You Need'
→ uses an ATTENTION mechanism (instead of processing strictly sequentially)
→ the foundation of modern LLMs and much of modern AI
→ revolutionized NLP and enabled the LLM era
