Estas são três maneiras de fazer um LLM fazer o que você quer, funcionando em camadas diferentes: prompting molda o comportamento, RAG injeta conhecimento, e fine-tuning muda o modelo.
Estas são três maneiras de fazer um LLM fazer o que você quer, funcionando em camadas diferentes: prompting molda o comportamento, RAG injeta conhecimento, e fine-tuning muda o modelo.
| Engenharia de prompts | RAG | Fine-tuning | |
|---|---|---|---|
| Muda | O prompt | O prompt (+ recuperação) | Os pesos do modelo |
| Melhor para | Comportamento, formato, tom | Fatos atualizados / privados | Estilo consistente, tarefas específicas |
| Atualização de conhecimento | N/A | Ao vivo (re-indexar dados) | Congelado no momento do treinamento |
| Custo / esforço | Mais baixo | Médio (infraestrutura) | Mais alto (treinamento + dados) |
| Atualizando | Editar texto | Atualizar o índice | Re-treinar |
Usar a ferramenta errada é caro: as pessoas frequentemente tentam fazer fine-tuning para adicionar conhecimento (o que RAG faz melhor e mais barato) ou para corrigir comportamento (o que prompting resolve). Saber que prompting molda o comportamento, RAG fornece conhecimento, e fine-tuning muda o modelo permite que você escolha a abordagem mais barata que funciona — e as combine deliberadamente em vez de acidentalmente.