Transformer là một kiến trúc neural network (được giới thiệu năm 2017) đã cách mạng hóa AI, đặc biệt là xử lý ngôn ngữ tự nhiên. Cơ chế attention của nó cho phép xử lý các chuỗi hiệu quả, và nó là nền tảng của các LLM hiện đại (GPT, Claude, v.v.).
Transformer là gì
TRANSFORMER → một kiến trúc neural network để xử lý các CHUỖI (văn bản, v.v.):
→ được giới thiệu trong bài báo 2017 'Attention Is All You Need'
→ dùng cơ chế ATTENTION (thay vì xử lý nghiêm ngặt tuần tự)
→ nền tảng của các LLM hiện đại và phần lớn AI hiện đại
→ cách mạng hóa NLP và mở ra kỷ nguyên LLM
