서로 다른 신경망 아키텍처는 서로 다른 데이터와 작업에 적합합니다 — 이미지에는 CNN, 시퀀스에는 RNN, 언어(그리고 점점 더 모든 것)에는 transformer. 주요 유형을 이해하면 AI가 서로 다른 문제를 어떻게 다루는지 명확해집니다.
주요 아키텍처
CNN(합성곱 신경망) → 이미지/공간 데이터에:
→ 합성곱을 사용해 국소 특성(엣지, 형태)을 계층적으로 탐지
→ 용도: 이미지 분류, 객체 탐지, 컴퓨터 비전
RNN(순환 신경망) → 시퀀스/시계열에:
→ 시퀀스를 단계별로 처리하며 이전 입력의 '메모리'를 유지
→ 용도: 텍스트, 시계열, 음성(오래된 접근; LSTM/GRU 변형)
⚠️ 긴 시퀀스에 어려움; 언어에는 transformer로 대체됨
transformer → 시퀀스(언어)와 점점 더 모든 것에:
→ attention 메커니즘; 병렬; 지배적인 현대 아키텍처(LLM)
→ 용도: 언어(LLM), 이제는 비전, 오디오, 멀티모달도
