Jakmile agent může jednat — mazat soubory, spouštět příkazy shell, volat externí API, utrácet peníze — jeho chyby (nebo škodlivý prompt) se stanou důsledky v reálném světě. Obrana spočívá v minimálních oprávněních plus schvalovacích branách plus izolaci: dejte mu pouze to, co potřebuje, vyžadujte potvrzení pro cokoli nezvratného a spusťte ho tam, kde nemůže způsobit trvalé škody.
