Embeddings は、text や image などの data を semantic meaning を捉える数値 vector として表現したものです。意味が近い item は vector space 上で近くなります。semantic search、recommendations、RAG を可能にする modern AI の基本要素です。
embeddings とは
text
EMBEDDING → data (word, sentence, image, etc.) を表す VECTOR (numbers list):
→ MEANING を capture → semantically similar items は similar vectors になる
→ 例: 'king' と 'queen' は近い。'cat' と 'dog' は 'cat' と 'car' より近い
→ embedding models が meaningful representation を生成する
→ meaning を geometry として扱えるようにする
何に役立つか
text
✓ SEMANTIC SIMILARITY → vector distance/cosine similarity で意味の近さを測る
✓ SEMANTIC SEARCH → keyword ではなく MEANING で search する
✓ RECOMMENDATIONS → similar embeddings の item を見つける
✓ RAG → documents と query を embed し、LLM に渡す relevant context を retrieve
✓ CLUSTERING, classification → semantic similarity で group/categorize
