Odată ce un agent poate acționa — șterge fișiere, executa comenzi shell, apelează API-uri externe, cheltuie bani — greșelile sale (sau un prompt rău intenționat) devin consecințe în lumea reală. Apărarea este privilegiu minim plus porți de aprobare plus izolare: dă-i doar ceea ce are nevoie, cere confirmarea pentru orice este ireversibil și rulează-l acolo unde nu poate cauza daune permanente.
