પરિવારમાં મોડલ ક્ષમતા વિરુદ્ધ ખર્ચ અને latency ને વેપાર કરે છે: નાના મોડલ ઝડપી અને સસ્તા છે પરંતુ ઓછી ક્ષમતા ધરાવતા છે; મોટા મોડલ મુશ્કેલ સમસ્યાઓ પર વધુ સારી રીતે તર્ક કરે છે પરંતુ વધુ ખર્ચ કરે છે અને ધીમે જવાબ આપે છે। કૌશલ્ય એ છે કે મોડલને કાર્યની મુશ્કેલીને અનુરૂપ બનાવવું, હંમેશા સૌથી મોટો લેવું નહીં।
ટાયર્સ (Anthropic ની લાઇનઅપ)
Anthropoic ના Claude પરિવાર ને ઉદાહરણ તરીકે ઉપયોગ કરીને (સર્વશેષ પેઢી: , , ):
