目標はページ問題が発生する前に問題をキャッチすることです。つまり、それを吸収する余裕がまだある間に劣化を見つけることです。これは先行指標を監視し、エラーバジェット付きの SLO を定義し、システムが失敗するのを待つのではなく積極的にシステムをプロービングすることを意味します。
SLO とエラーバジェット
は信頼性を数値に変えます (例: リクエストの 99.9% が成功)。残りの 0.1% がです。を追跡することで、実際に SLO に違反してユーザーが気づく前に、バジェットを使いすぎている速度でアラートを発することができます。
