Large Language Model (LLM) là một model AI được huấn luyện trên lượng lớn văn bản để hiểu và sinh ngôn ngữ con người — dự đoán và tạo ra văn bản. Các LLM (như GPT, Claude, Gemini) cung cấp sức mạnh cho các ứng dụng AI hiện đại như chatbot, trợ lý và sinh nội dung.
LLM là gì
LLM = một neural network lớn (transformer) được huấn luyện trên lượng văn bản KHỔNG LỒ:
→ học các mẫu của ngôn ngữ → hiểu và SINH văn bản giống con người
→ về cơ bản DỰ ĐOÁN token tiếp theo (từ/mảnh) dựa trên ngữ cảnh → tạo ra văn bản mạch lạc
→ LỚN → hàng tỷ parameter, huấn luyện trên các tập dữ liệu văn bản khổng lồ
→ ví dụ: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta)
