異なる neural network architecture は、異なる data と task に向いています。CNNs は image、RNNs は sequence、transformers は language(そして今ではさらに多くの領域)に強いです。主な type を理解すると、AI が問題ごとにどう architecture を使い分けるかが分かります。
主な architecture
text
CNN (Convolutional Neural Network) → IMAGES/spatial data 向け:
→ convolutions で edges/shapes など local features を hierarchical に検出
→ image classification, object detection, computer vision
RNN (Recurrent Neural Network) → SEQUENCES/time-series 向け:
→ sequence を step by step に処理し、previous inputs の 'memory' を保つ
→ text, time-series, speech (older approach; LSTM/GRU variants)
⚠️ long sequences が苦手。language では transformers に大きく置き換えられた
TRANSFORMER → SEQUENCES (language) と increasingly everything:
→ attention mechanism; parallel; dominant modern architecture (LLMs)
→ language (LLMs), vision, audio, multimodal
