벡터 데이터베이스는 embedding(벡터 표현)을 저장하고 유사도로 효율적으로 검색합니다 — 의미 검색, RAG, 추천 시스템을 가능하게 합니다. 이는 embedding으로 작업하는 현대 AI 애플리케이션의 핵심 인프라 구성 요소입니다.
벡터 데이터베이스가 하는 일
벡터 데이터베이스 → EMBEDDING(벡터)을 저장하고 유사도로 검색:
→ 수백만 개의 벡터(문서, 이미지 등을 나타내는)를 저장
→ 질의 벡터가 주어지면 가장 유사한 벡터(최근접 이웃)를 효율적으로 찾음
→ 규모에서 고차원 벡터 유사도 검색에 최적화
→ 대규모 embedding 집합에 대한 빠른 의미적 유사도 검색을 가능하게 함
왜 필요한가
→ 의미 검색/RAG는 embedding 유사도로 가장 관련 있는 항목을 찾아야 함
→ 질의를 수백만 벡터와 순진하게 비교하면 느림 → 벡터 DB는 빠른 유사도 검색을 위해
근사 최근접 이웃(ANN) 알고리즘을 사용
→ AI 애플리케이션이 규모에서 필요로 하는 벡터 유사도 검색에 특화 설계
