Tokens er de enheder, som LLM'er behandler tekst i (stavelsesdele), og kontekstvinduet er den maksimale mængde tekst (tokens), som en LLM kan behandle på én gang. Det er vigtigt at forstå dem for at bruge LLM'er effektivt, styre omkostninger og håndtere deres begrænsninger.
Hvad tokens er
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
