Các kiến trúc neural network khác nhau phù hợp với dữ liệu và bài toán khác nhau — CNN cho ảnh, RNN cho chuỗi (sequence), và transformer cho ngôn ngữ (và ngày càng cho mọi thứ). Hiểu các loại chính làm rõ cách AI xử lý các vấn đề khác nhau.
Các kiến trúc chính
CNN (Convolutional Neural Network) → cho ẢNH/dữ liệu không gian:
→ dùng convolution để phát hiện đặc trưng cục bộ (cạnh, hình dạng) theo tầng
→ dùng cho: phân loại ảnh, object detection, computer vision
RNN (Recurrent Neural Network) → cho CHUỖI/time-series:
→ xử lý chuỗi từng bước, duy trì 'bộ nhớ' về các input trước
→ dùng cho: text, time-series, speech (cách tiếp cận cũ; biến thể LSTM/GRU)
⚠️ chật vật với chuỗi dài; phần lớn ĐÃ BỊ THAY THẾ bởi transformer cho ngôn ngữ
TRANSFORMER → cho CHUỖI (ngôn ngữ) và ngày càng cho mọi thứ:
→ cơ chế attention; song song; kiến trúc hiện đại thống trị (LLM)
→ dùng cho: ngôn ngữ (LLM), và nay cả vision, audio, multimodal
