Tokens sind die Einheiten, in denen LLMs Text verarbeiten (Wortfragmente), und das Context Window ist die maximale Menge an Text (Tokens), die ein LLM gleichzeitig berücksichtigen kann. Das Verständnis dafür ist wichtig für die effektive Nutzung von LLMs, die Kostenverwaltung und den Umgang mit ihren Grenzen.
Was Tokens sind
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
