ਪ੍ਰੋਂਪਟ ਇੰਜੀਨੀਅਰਿੰਗ, RAG, ਅਤੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਵਿਚ ਕੀ ਅੰਤਰ ਹੈ, ਅਤੇ ਤੁਸੀਂ ਹਰੇਕ ਨੂੰ ਕਦੋਂ ਵਰਤਦੇ ਹੋ?

Question

Accepted Answer

ਇਹ ਤਿੰਨ ਤਰੀਕੇ ਹਨ ਕਿ ਤੁਸੀਂ ਇੱਕ LLM ਨੂੰ ਉਹ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, **ਵੱਖ-ਵੱਖ ਪਰਤਾਂ** 'ਤੇ ਕਾਰਜ ਕਰਦੇ ਹੋਏ: prompting *ਰਵੱਈਆ* ਨੂੰ ਰੂਪ ਦਿੰਦਾ ਹੈ, RAG *ਜਾਣਕਾਰੀ* ਨੂੰ ਦਾਖਲ ਕਰਦਾ ਹੈ, ਅਤੇ fine-tuning *ਮਾਡਲ* ਨੂੰ ਬਦਲਦਾ ਹੈ।

## ਤਿੰਨ ਤਰੀਕੇ

- **Prompt engineering** — instructions, context, ਅਤੇ prompt ਵਿੱਚ ਉਦਾਹਰਣਾਂ ਦੁਆਰਾ ਮਾਡਲ ਦੇ ਰਵੱਈਏ ਨੂੰ ਰੂਪ ਦਿਓ। ਮਾਡਲ ਬਾਰੇ ਕੁਝ ਵੀ ਨਹੀਂ ਬਦਲਦਾ; ਤੁਸੀਂ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਸੰਚਾਰ ਕਰਦੇ ਹੋ (system prompts, few-shot examples, output format)। ਸਭ ਤੋਂ ਸਸਤਾ ਅਤੇ ਵਾਧਾ; ਤੁਹਾਡਾ **ਪਹਲਾ ਹੱਲ**।
- **RAG (retrieval-augmented generation)** — query ਸਮੇਂ, relevant ਦਸਤਾਵੇਜ਼ (vector store, database, ਜਾਂ search ਤੋਂ) ਪ੍ਰਾਪਤ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ prompt ਵਿੱਚ insert ਕਰੋ। ਮਾਡਲ ਉਸ ਸਪਲਾਈ ਸੰਦਰਭ *ਤੋਂ* ਜਵਾਬ ਦਿੰਦਾ ਹੈ। ਸਭ ਤੋਂ ਵਧੀਆ ਜਦੋਂ ਜਾਣਕਾਰੀ **ਬਾਹਰੀ, ਨਿਜੀ, ਜਾਂ ਬਦਲ ਰਹੀ** ਹੋਵੇ।
- **Fine-tuning** — ਆਪਣੀ ਉਦਾਹਰਣਾਂ 'ਤੇ ਮਾਡਲ ਨੂੰ ਜਾਰੀ ਰੱਖਿਆ ਜ਼ੀ ਦੁਆਰਾ ਇਸ ਦੇ **weights** ਨੂੰ adjust ਕਰੋ। ਇਹ ਇੱਕ ਸੁਸਾਈ ਸਟਾਈਲ, ਫਾਰਮੈਟ, ਜਾਂ ਤੰਗ ਸਖਤ ਜੋਸ਼ ਭਰਦਾ ਹੈ। ਸ਼ਕਤੀਸ਼ਾਲੀ ਪਰ ਖਰਚੀਲਾ ਅਤੇ **static** — ਜਾਣਕਾਰੀ training ਸਮੇਂ ਫ੍ਰੀਜ਼ ਹੁੰਦੀ ਹੈ।

## ਤੁਲਨਾ

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **ਬਦਲਾਅ** | The prompt | The prompt (+ retrieval) | The model weights |
| **ਸਭ ਤੋਂ ਵਧੀਆ** | Behavior, format, tone | Up-to-date / private facts | Consistent style, narrow tasks |
| **ਜਾਣਕਾਰੀ ਤਾਜ਼ਗੀ** | N/A | Live (re-index data) | Frozen at train time |
| **Cost / effort** | Lowest | Medium (infra) | Highest (training + data) |
| **ਅੱਪਡੇਟ ਕਰਨਾ** | Edit text | Update the index | Re-train |

## ਫੈਸਲਾ ਮਾਰਗਦਰਸ਼ਨ

- **prompting** ਨਾਲ ਸ਼ੁਰੁ ਕਰੋ — ਪਹਿਲੇ ਖਿਲਾਫ ਇਸ ਨੂੰ ਵਾਲ ਬਣਾਓ।
- ਕੀ ਤਥ ਵਾਜ਼ ਮਾਡਲ ਨਹੀਂ ਜਾਣਦਾ, ਜਾਂ ਜੋ ਬਦਲਦੇ ਹਨ (docs, prices, internal data)? **RAG** ਵਰਤੋ।
- ਕੀ ਇੱਕ ਭਰੋਸੇਮੰਦ ਸਟਾਈਲ/ਫਾਰਮੈਟ ਜਾਂ ਸਕੇਲ 'ਤੇ ਮਖਸੂਸ ਕਾਰਜ ਦੀ ਲੋੜ ਹੈ, ਅਤੇ prompting ਕਾਫ਼ੀ ਸਾਂਬਬਆ ਨਹੀਂ ਹੈ? **Fine-tune**।
- ਇਹ **combine**: ਇੱਕ fine-tuned ਮਾਡਲ RAG ਅਤੇ ਇੱਕ ਵਾਜ਼ prompt ਦੇ ਨਾਲ production ਵਿੱਚ ਆਮ ਹੈ।

## ਕਿਉਂ ਇਸ ਨੂੰ ਮਹੱਤਵ ਹੈ

ਗਲਤ ਟੂਲ ਨੂੰ ਪਹੁੰਚਣਾ ਖਰਚੀਲਾ ਹੈ: ਲੋਕ ਆਮ ਤੌਰ 'ਤੇ knowledge ਜੋਡ਼ਨ ਲਈ fine-tune ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ (ਜੋ RAG ਬਿਹਤਰ ਅਤੇ ਸਸਤਾ ਕਰਦਾ ਹੈ) ਜਾਂ ਰਵੱਈਏ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ (ਜੋ prompting ਸੰਭਾਲਦਾ ਹੈ)। ਜਾਣਨਾ ਕਿ **prompting ਰਵੱਈਏ ਨੂੰ ਰੂਪ ਦਿੰਦਾ ਹੈ, RAG ਜਾਣਕਾਰੀ ਦੀ ਪੂਰਤੀ ਕਰਦਾ ਹੈ, ਅਤੇ fine-tuning ਮਾਡਲ ਨੂੰ ਬਦਲਦਾ ਹੈ** ਤੁਹਾਨੂੰ ਸਭ ਤੋਂ ਸਸਤਾ ਵਿਧੀ ਚੁਣਨ ਦਿੰਦਾ ਹੈ ਜੋ ਕੰਮ ਕਰਦੀ ਹੈ — ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਜਾਣਬੁੱਝ ਕੇ ਜੋਡ਼ੋ ਪ੍ਰਭਾਵ ਦੁਆਰਾ।

	Prompt engineering	RAG	Fine-tuning
ਬਦਲਾਅ	The prompt	The prompt (+ retrieval)	The model weights
ਸਭ ਤੋਂ ਵਧੀਆ	Behavior, format, tone	Up-to-date / private facts	Consistent style, narrow tasks
ਜਾਣਕਾਰੀ ਤਾਜ਼ਗੀ	N/A	Live (re-index data)	Frozen at train time
Cost / effort	Lowest	Medium (infra)	Highest (training + data)
ਅੱਪਡੇਟ ਕਰਨਾ	Edit text	Update the index	Re-train