ਇਹ ਤਿੰਨ ਤਰੀਕੇ ਹਨ ਕਿ ਤੁਸੀਂ ਇੱਕ LLM ਨੂੰ ਉਹ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਵੱਖ-ਵੱਖ ਪਰਤਾਂ 'ਤੇ ਕਾਰਜ ਕਰਦੇ ਹੋਏ: prompting ਰਵੱਈਆ ਨੂੰ ਰੂਪ ਦਿੰਦਾ ਹੈ, RAG ਜਾਣਕਾਰੀ ਨੂੰ ਦਾਖਲ ਕਰਦਾ ਹੈ, ਅਤੇ fine-tuning ਮਾਡਲ ਨੂੰ ਬਦਲਦਾ ਹੈ।
ਇਹ ਤਿੰਨ ਤਰੀਕੇ ਹਨ ਕਿ ਤੁਸੀਂ ਇੱਕ LLM ਨੂੰ ਉਹ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਵੱਖ-ਵੱਖ ਪਰਤਾਂ 'ਤੇ ਕਾਰਜ ਕਰਦੇ ਹੋਏ: prompting ਰਵੱਈਆ ਨੂੰ ਰੂਪ ਦਿੰਦਾ ਹੈ, RAG ਜਾਣਕਾਰੀ ਨੂੰ ਦਾਖਲ ਕਰਦਾ ਹੈ, ਅਤੇ fine-tuning ਮਾਡਲ ਨੂੰ ਬਦਲਦਾ ਹੈ।
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| ਬਦਲਾਅ | The prompt | The prompt (+ retrieval) | The model weights |
| ਸਭ ਤੋਂ ਵਧੀਆ | Behavior, format, tone | Up-to-date / private facts | Consistent style, narrow tasks |
| ਜਾਣਕਾਰੀ ਤਾਜ਼ਗੀ | N/A | Live (re-index data) | Frozen at train time |
| Cost / effort | Lowest | Medium (infra) | Highest (training + data) |
| ਅੱਪਡੇਟ ਕਰਨਾ | Edit text | Update the index | Re-train |
ਗਲਤ ਟੂਲ ਨੂੰ ਪਹੁੰਚਣਾ ਖਰਚੀਲਾ ਹੈ: ਲੋਕ ਆਮ ਤੌਰ 'ਤੇ knowledge ਜੋਡ਼ਨ ਲਈ fine-tune ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ (ਜੋ RAG ਬਿਹਤਰ ਅਤੇ ਸਸਤਾ ਕਰਦਾ ਹੈ) ਜਾਂ ਰਵੱਈਏ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ (ਜੋ prompting ਸੰਭਾਲਦਾ ਹੈ)। ਜਾਣਨਾ ਕਿ prompting ਰਵੱਈਏ ਨੂੰ ਰੂਪ ਦਿੰਦਾ ਹੈ, RAG ਜਾਣਕਾਰੀ ਦੀ ਪੂਰਤੀ ਕਰਦਾ ਹੈ, ਅਤੇ fine-tuning ਮਾਡਲ ਨੂੰ ਬਦਲਦਾ ਹੈ ਤੁਹਾਨੂੰ ਸਭ ਤੋਂ ਸਸਤਾ ਵਿਧੀ ਚੁਣਨ ਦਿੰਦਾ ਹੈ ਜੋ ਕੰਮ ਕਰਦੀ ਹੈ — ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਜਾਣਬੁੱਝ ਕੇ ਜੋਡ਼ੋ ਪ੍ਰਭਾਵ ਦੁਆਰਾ।