Token'lar, LLM'lerin metni işledikleri birimlerdir (sözcük parçaları), ve context window, bir LLM'in aynı anda dikkate alabileceği maksimum metin miktarıdır (token'lar). LLM'leri etkili bir şekilde kullanmak, maliyetleri yönetmek ve sınırlarıyla başa çıkmak için bunları anlamak önemlidir.
Token'lar nelerdir
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
