Qual é a diferença entre engenharia de prompts, RAG e fine-tuning, e quando você usa cada um?

Question

Accepted Answer

Estas são três maneiras de fazer um LLM fazer o que você quer, funcionando em **camadas diferentes**: prompting molda o *comportamento*, RAG injeta *conhecimento*, e fine-tuning muda o *modelo*.

## As três abordagens

- **Engenharia de prompts** — molde o comportamento do modelo através de instruções, contexto e exemplos no prompt. Nada sobre o modelo muda; você apenas se comunica melhor (prompts do sistema, exemplos few-shot, formato de saída). Mais barato e rápido; seu **primeiro recurso**.
- **RAG (retrieval-augmented generation)** — no momento da consulta, recupere documentos relevantes (de um armazenamento vetorial, banco de dados ou busca) e insira-os no prompt. O modelo responde *a partir* daquele contexto fornecido. Melhor quando o conhecimento é **externo, privado ou em mudança**.
- **Fine-tuning** — continue treinando o modelo em seus próprios exemplos, ajustando seus **pesos**. Isso bake in um estilo consistente, formato ou habilidade específica. Poderoso mas custoso e **estático** — o conhecimento é congelado no momento do treinamento.

## Comparação

| | Engenharia de prompts | RAG | Fine-tuning |
|---|---|---|---|
| **Muda** | O prompt | O prompt (+ recuperação) | Os pesos do modelo |
| **Melhor para** | Comportamento, formato, tom | Fatos atualizados / privados | Estilo consistente, tarefas específicas |
| **Atualização de conhecimento** | N/A | Ao vivo (re-indexar dados) | Congelado no momento do treinamento |
| **Custo / esforço** | Mais baixo | Médio (infraestrutura) | Mais alto (treinamento + dados) |
| **Atualizando** | Editar texto | Atualizar o índice | Re-treinar |

## Guia de decisão

- Comece com **prompting** — resolva de graça primeiro.
- Precisa de fatos que o modelo não conhece, ou que mudam (documentos, preços, dados internos)? Use **RAG**.
- Precisa de um estilo/formato confiável ou uma tarefa especializada em escala, e prompting não é consistente o suficiente? **Fine-tune**.
- Estas **se combinam**: um modelo fine-tuned com RAG e um bom prompt é comum em produção.

## Por que isso importa

Usar a ferramenta errada é caro: as pessoas frequentemente tentam fazer fine-tuning para adicionar conhecimento (o que RAG faz melhor e mais barato) ou para corrigir comportamento (o que prompting resolve). Saber que **prompting molda o comportamento, RAG fornece conhecimento, e fine-tuning muda o modelo** permite que você escolha a abordagem mais barata que funciona — e as combine deliberadamente em vez de acidentalmente.

	Engenharia de prompts	RAG	Fine-tuning
Muda	O prompt	O prompt (+ recuperação)	Os pesos do modelo
Melhor para	Comportamento, formato, tom	Fatos atualizados / privados	Estilo consistente, tarefas específicas
Atualização de conhecimento	N/A	Ao vivo (re-indexar dados)	Congelado no momento do treinamento
Custo / esforço	Mais baixo	Médio (infraestrutura)	Mais alto (treinamento + dados)
Atualizando	Editar texto	Atualizar o índice	Re-treinar