مختلف نیورل نیٹ ورک آرکیٹیکچرز مختلف ڈیٹا اور ٹاسکس کے لیے موزوں ہیں — CNNs تصویروں کے لیے، RNNs sequences کے لیے، اور transformers زبان کے لیے (اور بڑھتی ہوئی تعداد میں سب کچھ کے لیے)۔ بنیادی اقسام کو سمجھنا واضح کرتا ہے کہ AI مختلف مسائل کو کیسے سنبھالتا ہے۔
بنیادی آرکیٹیکچرز
CNN (Convolutional Neural Network) → for IMAGES/spatial data:
→ uses convolutions to detect local features (edges, shapes) hierarchically
→ for: image classification, object detection, computer vision
RNN (Recurrent Neural Network) → for SEQUENCES/time-series:
→ processes sequences step by step, maintaining a 'memory' of previous inputs
→ for: text, time-series, speech (older approach; LSTM/GRU variants)
⚠️ struggles with long sequences; largely SUPERSEDED by transformers for language
TRANSFORMER → for SEQUENCES (language) and increasingly everything:
→ attention mechanism; parallel; the dominant modern architecture (LLMs)
→ for: language (LLMs), and now vision, audio, multimodal
