**RAG(검색 증강 생성)**는 LLM을 검색 시스템과 결합합니다 — 지식 베이스에서 관련 정보를 가져와 LLM에 문맥으로 제공해 정확하고 근거 있는 답변을 생성합니다. 이는 맞춤 데이터 위에 LLM 애플리케이션을 구축하는 핵심 기법입니다.
RAG가 하는 일
RAG → 검색된 관련 정보로 LLM의 생성을 증강:
1. 검색(RETRIEVE) → 질의에 관련된 정보를 지식 베이스(당신의 문서/데이터)에서 검색
2. 증강(AUGMENT) → 검색된 정보를 LLM의 prompt에 문맥으로 추가
3. 생성(GENERATE) → LLM이 제공된 문맥을 사용해 답변(당신의 데이터에 근거)
→ LLM이 훈련받지 않은 관련 있고 최신이며 구체적인 지식을 제공
RAG의 일반적 작동 방식
→ 데이터 색인: 문서를 청크로 분할 → embedding 생성 → 벡터 데이터베이스에 저장
→ 질의 시점: 질의를 embedding → 가장 유사한 청크를 찾음(의미 검색) → 검색
→ prompt 구성: '이 문맥을 사용해: [검색된 청크], 답하라: [질의]'
→ LLM이 검색된 문맥에 근거한 답변을 생성
