Tokens ती एकाइ हुन् जुन LLM हरूले पाठ प्रक्रिया गर्दछन् (शब्दको टुक्रा), र context window अधिकतम पाठ (tokens) हो जुन LLM एक साथ विचार गर्न सक्छ। LLM हरू प्रभावकारी रूपमा प्रयोग गर्न, लागत व्यवस्थापन गर्न, र तिनीहरूको सीमाहरू सामना गर्नको लागि तिनलाई बुझ्न महत्त्वपूर्ण छ।
टोकन के हुन्
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
