Modelos dentro de uma família trocam capacidade contra custo e latência: modelos menores são mais rápidos e mais baratos, mas menos capazes; modelos maiores raciocinam melhor em problemas difíceis, mas custam mais e respondem mais lentamente. A habilidade é alinhar o modelo com a dificuldade da tarefa, não sempre optar pelo maior.
Os níveis (Portfólio do Anthropic)
Usando a família Claude do Anthropic como exemplo (geração mais recente: , , ):
