Zodra een agent kan handelen — bestanden verwijderen, shell-commando's uitvoeren, externe API's aanroepen, geld besteden — worden zijn fouten (of een schadelijk prompt) werkelijke gevolgen. De verdediging is least privilege plus approval gates plus isolatie: geef het alleen wat het nodig heeft, vereist bevestiging voor alles wat onomkeerbaar is, en voer het uit waar het geen blijvende schade kan aanrichten.
