RAG (Retrieval-Augmented Generation) menggabungkan LLM dengan sistem retrieval — mengambil maklumat relevan daripada knowledge base dan memberikannya kepada LLM sebagai konteks untuk menjana jawapan yang tepat dan berasaskan. Ia adalah teknik utama untuk membina aplikasi LLM atas data tersuai.
Apa yang RAG lakukan
RAG → augment an LLM's generation with RETRIEVED relevant information:
1. RETRIEVE → search a knowledge base (your documents/data) for info relevant to the query
2. AUGMENT → add the retrieved info to the LLM's prompt as CONTEXT
3. GENERATE → the LLM answers using the provided context (grounded in your data)
→ gives the LLM relevant, up-to-date, specific knowledge it wasn't trained on
