한 제품군 내의 모델들은 성능을 비용 및 지연과 맞바꿉니다: 더 작은 모델은 빠르고 저렴하지만 성능이 낮고; 더 큰 모델은 어려운 문제에서 더 잘 추론하지만 비용이 더 들고 응답이 느립니다. 핵심 역량은 항상 가장 큰 것을 집어 드는 게 아니라, 작업의 난이도에 모델을 맞추는 것입니다.
등급 (Anthropic 라인업)
Anthropic의 Claude 제품군을 예로 들면(최신 세대: Opus 4.8, Sonnet 4.6, Haiku 4.5):
text
Haiku → 가장 작고, 가장 빠르고, 가장 저렴
→ 대용량 / 단순 작업: classification, extraction, 빠른 수정
Sonnet → 비용/품질 균형
→ 일상적인 코딩과 일반 작업 (합리적인 기본값)
Opus → 가장 유능, 가장 높은 비용 & 지연
→ 가장 어려운 다단계 추론, 아키텍처, 까다로운 디버깅
순서는 상대적입니다: 가격과 지연 모두에서 이며, 순수 성능도 같은 순서입니다.
