Lijepljenje cijele datoteke od 2,000 redaka baca tokene i pogoršava kvalitetu odgovora. Cilj je dati AI-u točno kontekst koji mu treba da razmisli o vašem problemu — i ništa više.
Lijepljenje cijele datoteke od 2,000 redaka baca tokene i pogoršava kvalitetu odgovora. Cilj je dati AI-u točno kontekst koji mu treba da razmisli o vašem problemu — i ništa više.
db je Postgres pool."# Bad: paste the whole 800-line user-service.ts
# → AI wades through unrelated code, may anchor on the wrong function
# Good: send only what matters
// file: src/services/user-service.ts
// context: called from POST /users; `db` is a Postgres pool (pg)
type User = { id: number; email: string };
async function createUser(email: string): Promise<User> {
const { rows } = await db.query( // <-- the function I need help with
"INSERT INTO users (email) VALUES ($1) RETURNING id, email",
[email],
);
return rows[0];
}
// Question: how do I handle a duplicate-email conflict here?
Druga verzija daje AI-u funkciju, njen povratni tip (User), i bilješku u jednoj liniji o db — dovoljno da odgovori precizno, bez nepovezanog koda koji bi ga omeo.
Nije samo pitanje cijene. Dodatni kod je ometanje: model može uhvatiti nepovezanu funkciju, zrcaliti grešku negdje drugdje u datoteci, ili razrijediti svoju pažnju preko tisuća nepovezanih tokena. Fokusirani prompt daje fokusirani, točan odgovor.
Budžeti tokena su konačni i veliki ispisi degradiraju brzinu i kvalitetu. Slanje minimalnog relevantnog dijela — ciljne funkcije, njenih tipova, sažetka konteksta i putanja datoteka — štedi tokene i oštrи odgovor uklanjanjem distrakcija. Kuriranje konteksta je temeljna vještina rada s AI-om: ne skrivate informacije, već usmjeravate pažnju na ono što je važno.