Upotukset ovat numeerisia vektorirepresentaatioita datasta (teksti, kuvat jne.), jotka säilyttävät semanttisen merkityksen — sijoittaen samankaltaiset kohteet lähelle toisiaan vektoriavaruudessa. Ne ovat perustavanlaatuisia nykyaikaiselle tekoälylle, mahdollistaen semanttisen haun, suositukset ja RAG:n.
Mitä upotukset ovat
EMBEDDING → a VECTOR (list of numbers) representing data (a word, sentence, image, etc.):
→ captures MEANING → semantically similar items have SIMILAR vectors (close in vector space)
→ e.g. 'king' and 'queen' have similar embeddings; 'cat' and 'dog' are closer than
'cat' and 'car'
→ produced by models (embedding models) that learn meaningful representations
→ turns data into numbers that capture semantic meaning (meaning as geometry)
