同一系列的模型在能力、成本和延迟之间做出权衡:较小的模型更快更便宜但能力较弱;较大的模型在难题上推理更好但成本更高响应更慢。技巧在于将模型与任务难度相匹配,而不是总是选择最大的模型。
模型等级(Anthropic 的产品线)
以 Anthropic 的 Claude 系列为例(最新一代:Opus 4.8、Sonnet 4.6、Haiku 4.5):
text
Haiku → smallest, fastest, cheapest
→ high-volume / simple tasks: classification, extraction, quick edits
Sonnet → balanced cost/quality
→ everyday coding and general work (the sensible default)
Opus → most capable, highest cost & latency
→ hardest multi-step reasoning, architecture, tricky debugging
排序是相对的: 在价格和延迟上都是如此,原始能力也遵循相同的顺序。
