ટોકન્સ એ એકમો છે જેમાં LLMો ટેક્સ્ટ પ્રોસેસ કરે છે (શબ્દોના ટુકડાઓ), અને કોન્ટેક્સ્ટ વિન્ડો એ ટેક્સ્ટ (ટોકન્સ)નો મહત્તમ જથ્થો છે જે LLM એક જ સમયે વિચારી શકે છે. LLMોને અસરકારક રીતે ઉપયોગ કરવા, ખર્ચ વ્યવસ્થાપિત કરવા અને તેમની મર્યાદાઓ સંભાળવા માટે તેમને સમજવું મહત્વપૂર્ણ છે.
ટોકન્સ શું છે
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
