Didelis kalbos modelis (LLM) yra DI modelis, apmokytas didžiuliame tekstų kiekyje, kad suprastų ir generuotų žmogaus kalbą — spėliojant ir gaminant tekstą. LLM (tokios kaip GPT, Claude, Gemini) palaikomos šiuolaikines DI programas, tokias kaip chatbotai, asistentumai ir turinio generavimas.
Kas yra LLM
LLM = a large neural network (transformer) trained on MASSIVE amounts of text:
→ learns patterns of language → understands and GENERATES human-like text
→ fundamentally PREDICTS the next token (word/piece) given context → produces coherent text
→ LARGE → billions of parameters, trained on enormous text datasets
→ examples: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta)
