Token là đơn vị mà LLM xử lý văn bản (các mảnh của từ), và context window là lượng văn bản tối đa (số token) mà LLM có thể xem xét cùng một lúc. Hiểu chúng quan trọng để dùng LLM hiệu quả, quản lý chi phí, và xử lý các giới hạn của chúng.
Token là gì
TOKEN → đơn vị LLM xử lý văn bản (không phải từ/ký tự, mà là các MẢNH):
→ văn bản được tách thành token (xấp xỉ ~4 ký tự hoặc ~0.75 từ mỗi token tiếng Anh)
→ vd 'unbelievable' có thể là 3 token; từ thông dụng thường là 1 token
→ model xử lý và sinh ra từng token một
→ LLM làm việc theo token (input và output được đo bằng token)
