Tokens وہ units ہیں جن میں LLMs متن کو process کرتے ہیں (الفاظ کے ٹکڑے)، اور context window سب سے زیادہ متن (tokens) کی مقدار ہے جو ایک LLM ایک ساتھ سمجھ سکتا ہے۔ انہیں سمجھنا LLMs کو مؤثر طریقے سے استعمال کرنے، اخراجات کا نظم کرنے، اور ان کی حدود کو سنبھالنے کے لیے اہم ہے۔
Tokens کیا ہیں
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
