RAG (Retrieval-Augmented Generation) kết hợp một LLM với một hệ thống retrieval — lấy thông tin liên quan từ một knowledge base và cung cấp nó cho LLM như ngữ cảnh để sinh ra các câu trả lời chính xác, có căn cứ. Đây là một kỹ thuật then chốt để xây dựng các ứng dụng LLM trên dữ liệu tùy chỉnh.
RAG làm gì
RAG → tăng cường việc sinh của LLM với thông tin liên quan được RETRIEVE:
1. RETRIEVE → tìm trong một knowledge base (tài liệu/dữ liệu của bạn) thông tin liên quan đến truy vấn
2. AUGMENT → thêm thông tin đã retrieve vào prompt của LLM như NGỮ CẢNH
3. GENERATE → LLM trả lời dùng ngữ cảnh được cung cấp (có căn cứ trên dữ liệu của bạn)
→ cung cấp cho LLM kiến thức liên quan, cập nhật, cụ thể mà nó chưa được huấn luyện
