¿Cuál es la diferencia entre prompt engineering, RAG y fine-tuning, y cuándo usas cada uno?

Question

Accepted Answer

Estas son tres formas de hacer que un LLM haga lo que quieres, trabajando en **capas diferentes**: el prompting moldea el *comportamiento*, RAG inyecta *conocimiento*, y fine-tuning cambia el *modelo*.

## Los tres enfoques

- **Prompt engineering** — moldea el comportamiento del modelo a través de instrucciones, contexto y ejemplos en el prompt. Nada del modelo cambia; simplemente te comunicas mejor (system prompts, ejemplos few-shot, formato de salida). Lo más barato y rápido; tu **primer recurso**.
- **RAG (retrieval-augmented generation)** — en tiempo de consulta, recupera documentos relevantes (de un vector store, base de datos o búsqueda) e insértalos en el prompt. El modelo responde *desde* ese contexto suministrado. Mejor cuando el conocimiento es **externo, privado o cambiante**.
- **Fine-tuning** — continúa entrenando el modelo con tus propios ejemplos, ajustando sus **pesos**. Esto integra un estilo, formato o habilidad estrecha consistente. Poderoso pero costoso y **estático** — el conocimiento se congela en tiempo de entrenamiento.

## Comparación

| | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| **Cambia** | El prompt | El prompt (+ recuperación) | Los pesos del modelo |
| **Mejor para** | Comportamiento, formato, tono | Hechos actualizados / privados | Estilo consistente, tareas específicas |
| **Frescura del conocimiento** | N/A | En vivo (re-indexar datos) | Congelado en tiempo de entrenamiento |
| **Costo / esfuerzo** | Más bajo | Medio (infra) | Más alto (entrenamiento + datos) |
| **Actualización** | Editar texto | Actualizar el índice | Re-entrenar |

## Guía de decisión

- Comienza con **prompting** — resuélvelo gratis primero.
- ¿Necesitas hechos que el modelo no conoce, o que cambian (documentos, precios, datos internos)? Usa **RAG**.
- ¿Necesitas un estilo/formato confiable o una tarea especializada a escala, y prompting no es lo suficientemente consistente? **Fine-tunea**.
- Estos **se combinan**: un modelo fine-tuneado con RAG y un buen prompt es común en producción.

## Por qué es importante

Alcanzar la herramienta equivocada es caro: la gente a menudo intenta fine-tunear para agregar conocimiento (que RAG hace mejor y más barato) o para reparar comportamiento (que prompting maneja). Saber que **prompting moldea comportamiento, RAG suministra conocimiento, y fine-tuning cambia el modelo** te permite elegir el enfoque más barato que funcione — y combinarlos deliberadamente en lugar de por accidente.

	Prompt engineering	RAG	Fine-tuning
Cambia	El prompt	El prompt (+ recuperación)	Los pesos del modelo
Mejor para	Comportamiento, formato, tono	Hechos actualizados / privados	Estilo consistente, tareas específicas
Frescura del conocimiento	N/A	En vivo (re-indexar datos)	Congelado en tiempo de entrenamiento
Costo / esfuerzo	Más bajo	Medio (infra)	Más alto (entrenamiento + datos)
Actualización	Editar texto	Actualizar el índice	Re-entrenar