Modeliai šeimoje keičiasi galimybe prieš kaštus ir latenciją: mažesni modeliai yra greitesni ir pigesni, bet mažiau galintys; didesni modeliai geriau samprotauja sunkius uždavinius, bet brangesni ir atsakinėja lėčiau. Įgūdis yra suderinti modelį su uždavinio sunkumu, o ne visada siekti didžiausio.
Lygmenys (Anthropic linija)
Naudodami Anthropic Claude šeimą kaip pavyzdį (naujausias laikinasis: Opus 4.8, Sonnet 4.6, Haiku 4.5):
Haiku → smallest, fastest, cheapest
→ high-volume / simple tasks: classification, extraction, quick edits
Sonnet → balanced cost/quality
→ everyday coding and general work (the sensible default)
Opus → most capable, highest cost & latency
→ hardest multi-step reasoning, architecture, tricky debugging
Tvarka yra santykinė: Haiku < Sonnet < Opus tiek kaštais, tiek latencija, ir tą pačią tvarką turint pagrindines galimybes.
Kaip pasirinkti
- Pradėkite pigesniu. Pirmiausia pasirinkite Haiku arba Sonnet; dauguma uždavinių nepareikalaus aukščiausiojo lygio.
- Kelkite tik kai kokybė tai reikalauja. Jei pigesnio modelio išvestis yra neteisinga, paviršutinė arba nuolat nesugebėja pasiekti tikslo iš tikrai sunkios problemos, pereikite prie Opus.
- Pagalvokite apie apimtį. Uždavinys, kurį vykdote milijonus kartų (žymos, nukreipimas) turėtų būti Haiku net jei Opus šiek tiek geriau — kaštai ir latencija padauginami.
Classify 1M support tickets → Haiku (volume dominates; task is simple)
Implement a feature → Sonnet (balanced everyday coding)
Debug a subtle race condition → Opus (hard reasoning justifies the cost)
Kodėl tai svarbu
Standartiškai naudojant didžiausią modelį švaistomi pinigai ir didinama latencija uždaviniuose, kurie gerai tinka pigesniam lygiui; standartiškai naudojant mažiausią duodami prasti rezultatai iš tikrai sunkaus darbo. Sąmoningai pasirinkti — pradėti pigesniu, kelti tik kai kokybė tai reikalauja — išlaikyti sistemą greitą ir atpigintą dideliame mastelyje vis dar atnešant galingą modelį problemoms, kurias jis iš tikro reikalingas.
