O objetivo é saber que seu sistema está unhealthy antes de seus usuários te avisarem. Uma boa observabilidade permite que você responda perguntas que não antecipou, não apenas verificar um conjunto fixo de dashboards. Como tech lead, você configura isso antes do incidente, não durante.
