Das Ziel ist es, Probleme zu erfassen, bevor die Seite ausfällt — Verschlechterungen zu finden, während noch Puffer vorhanden ist. Das bedeutet, führende Indikatoren zu überwachen, SLOs mit Fehlerbudgets zu definieren und das System aktiv zu testen, anstatt auf seinen Ausfall zu warten.
