Estas son tres formas de hacer que un LLM haga lo que quieres, trabajando en capas diferentes: el prompting moldea el comportamiento, RAG inyecta conocimiento, y fine-tuning cambia el modelo.
Estas son tres formas de hacer que un LLM haga lo que quieres, trabajando en capas diferentes: el prompting moldea el comportamiento, RAG inyecta conocimiento, y fine-tuning cambia el modelo.
| Prompt engineering | RAG | Fine-tuning | |
|---|---|---|---|
| Cambia | El prompt | El prompt (+ recuperación) | Los pesos del modelo |
| Mejor para | Comportamiento, formato, tono | Hechos actualizados / privados | Estilo consistente, tareas específicas |
| Frescura del conocimiento | N/A | En vivo (re-indexar datos) | Congelado en tiempo de entrenamiento |
| Costo / esfuerzo | Más bajo | Medio (infra) | Más alto (entrenamiento + datos) |
| Actualización | Editar texto | Actualizar el índice | Re-entrenar |
Alcanzar la herramienta equivocada es caro: la gente a menudo intenta fine-tunear para agregar conocimiento (que RAG hace mejor y más barato) o para reparar comportamiento (que prompting maneja). Saber que prompting moldea comportamiento, RAG suministra conocimiento, y fine-tuning cambia el modelo te permite elegir el enfoque más barato que funcione — y combinarlos deliberadamente en lugar de por accidente.