Når en agent først kan handle — slette filer, kjøre shell-kommandoer, kalle eksterne API-er, bruke penger — blir feilene (eller en ondsinnet prompt) til virkelige konsekvenser. Forsvaret er minste rettighet pluss godkjenningspørter pluss isolasjon: gi det bare det det trenger, krever bekreftelse for alt som er irreversibelt, og kjør det der det ikke kan gjøre varig skade.
