Celem jest wyłapanie problemów zanim strona ulegnie awarii — znalezienie degradacji, gdy wciąż jest zapas do jej pochłonięcia. To oznacza obserwowanie wiodących wskaźników, definiowanie SLO z budżetami błędów oraz aktywne sondowanie systemu zamiast czekania aż się wysypie.
