Token คือหน่วยที่ LLM ใช้ประมวลผลข้อความ (ชิ้นส่วนของคำ) และ context window คือปริมาณข้อความสูงสุด (วัดเป็น token) ที่ LLM สามารถพิจารณาได้ในคราวเดียว การเข้าใจสิ่งเหล่านี้สำคัญต่อการใช้ LLM อย่างมีประสิทธิภาพ การจัดการต้นทุน และการจัดการกับข้อจำกัดของมัน
token คืออะไร
TOKEN → the unit LLMs process text in (not words/characters, but PIECES):
→ text is split into tokens (roughly ~4 characters or ~0.75 words each in English)
→ e.g. 'unbelievable' might be 3 tokens; common words are often 1 token
→ the model processes and generates token by token
→ LLMs work in tokens (input and output are measured in tokens)
