Цель — узнать о нездоровом состоянии системы раньше, чем об этом расскажут пользователи. Хорошая наблюдаемость позволяет ответить на вопросы, которые вы не предвидели, а не просто проверять фиксированный набор дашбордов. Как tech lead вы настраиваете это до инцидента, а не во время него.
