Token adalah unit di mana LLM memproses teks (kepingan perkataan), dan context window ialah jumlah maksimum teks (token) yang boleh dipertimbangkan oleh LLM pada satu masa. Memahaminya adalah penting untuk menggunakan LLM dengan berkesan, mengurus kos, dan mengendalikan hadnya.
Apakah itu token
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
