El transformer es una arquitectura de red neuronal (introducida en 2017) que revolucionó la IA, especialmente el procesamiento del lenguaje natural. Su mecanismo de atención le permite procesar secuencias de manera efectiva, y es la base de los LLMs modernos (GPT, Claude, etc.).
Qué son los transformers
TRANSFORMER → a neural network architecture for processing SEQUENCES (text, etc.):
→ introduced in the 2017 paper 'Attention Is All You Need'
→ uses an ATTENTION mechanism (instead of processing strictly sequentially)
→ the foundation of modern LLMs and much of modern AI
→ revolutionized NLP and enabled the LLM era
