El objetivo es detectar problemas antes de que caiga la página — encontrar degradación mientras aún hay margen para absorberla. Eso significa vigilar indicadores adelantados, definir SLOs con presupuestos de errores y probar activamente el sistema en lugar de esperar a que falle.
