Egy teljes 2000 soros fájl beillesztése tokeneket pazarol és ront a válasz minőségén. A cél az, hogy az AI-nak pontosan azt a kontextust adjuk meg, amire szüksége van a probléma megoldásához — és semmi mást.
Egy teljes 2000 soros fájl beillesztése tokeneket pazarol és ront a válasz minőségén. A cél az, hogy az AI-nak pontosan azt a kontextust adjuk meg, amire szüksége van a probléma megoldásához — és semmi mást.
db egy Postgres pool."# Bad: paste the whole 800-line user-service.ts
# → AI wades through unrelated code, may anchor on the wrong function
# Good: send only what matters
// file: src/services/user-service.ts
// context: called from POST /users; `db` is a Postgres pool (pg)
type User = { id: number; email: string };
async function createUser(email: string): Promise<User> {
const { rows } = await db.query( // <-- the function I need help with
"INSERT INTO users (email) VALUES ($1) RETURNING id, email",
[email],
);
return rows[0];
}
// Question: how do I handle a duplicate-email conflict here?
A második verzió megadja az AI-nak a függvényt, annak visszatérési típusát (User), és egy egysoros megjegyzést a db-ről — elég ahhoz, hogy pontosan válaszoljon, anélkül, hogy lenne zavaró, nem kapcsolódó kód.
Nem csak a költségről van szó. Az extra kód zavar: a modell ráköthet egy kapcsolódatlan függvényre, tükrözhet egy hibát a fájl másik részéből, vagy megoszthatja figyelmét több ezer irreleváns token között. A fókuszált prompt fókuszált, pontos választ produkál.
A token költségvetések végesek, és nagy adathalmazok romlanak a sebességet és a minőséget. A minimális releváns szelet küldése — a célul szolgáló függvény, annak típusai, egy kontextus-összefoglalás és fájl elérési útak — tokeneket takarít meg és élesíti a választ a zavaró tényezők eltávolításával. A kontextus kurálása az AI-vel való hatékony munka alapvető képessége: nem információt rejtegetsz, hanem a figyelmet a lényeges dolgokra irányítod.