När en agent kan agera — ta bort filer, köra shell-kommandon, anropa externa API:er, spendera pengar — blir dess misstag (eller ett skadligt prompt) verkliga konsekvenser. Försvaret är minsta behörighet plus godkännandeportar plus isolering: ge den bara vad den behöver, kräv bekräftelse för allt irreversibelt, och kör det där det inte kan göra varaktig skada.
