Les modèles au sein d'une famille échangent capacité contre coût et latence : les modèles plus petits sont plus rapides et moins chers mais moins capables ; les plus grands raisonnent mieux sur les problèmes difficiles mais coûtent plus cher et répondent plus lentement. L'habileté consiste à adapter le modèle à la difficulté de la tâche, et non à toujours choisir le plus grand.
Les tiers (la gamme d'Anthropic)
En utilisant la famille Claude d'Anthropic comme exemple (dernière génération : , , ) :
