Modelele dintr-o familie schimbă capacitate cu cost și latență: modelele mai mici sunt mai rapide și mai ieftine, dar mai puțin capabile; cele mai mari raționează mai bine pe probleme dificile, dar costă mai mult și răspund mai lent. Abilitatea constă în potrivirea modelului cu dificultatea sarcinii, nu în apelarea mereu la cel mai mare.
Nivelurile (portofoliul Anthropic)
Utilizând familia Claude a Anthropic ca exemplu (generația cea mai recentă: , , ):
