Как рассчитать срабатывание оповещений в оповещениях Прометея и добавить их к ярлыкам оповещений?
Например, у меня есть 2 хоста, предупреждение будет срабатывать, когда процессор> 90%. Я могу открыть пользовательский интерфейс Prometheus UI & Alert Manager, и вижу оповещения, запускаемые для двух хостов.
Я использую webhook в качестве приемника, я хочу получить количество предупреждений для ЦП> 90% для каждого хоста, как я могу этого добиться?
Я считаю, что если я могу получить значение счетчика откуда-то, то я могу добавить его в метку оповещения, и, наконец, я могу получить значение из меток в интерфейсе webhook.
Я сослался на количество предупреждений, сгенерированных прометеем, они используют функцию изменений, но они не могут покрыть, если значение не изменяется (скажем, CPU сохраняет 90%).
1 ответ
Как считается, я думаю, что Prometheus и Alert manager не поддерживают эту ситуацию, потому что это не имеет смысла.
Для пользователя, если он / она хочет знать, сколько предупреждений было сгенерировано определенным правилом (скажем, ЦП> 90%) за последний 1 час, они будут сосредоточены только на том, сколько предупреждений было получено, а не на количестве запущенных предупреждений. Прометей.
Как мы знаем, Alert Manger имеет правила "group_wait","repeat_interval" и "Inhibited", их параметры будут влиять на то, сколько и как часто оповещение отправляется с помощью Alert Manager. Даже если бы я мог получать оповещения о срабатывании Прометея, но этот номер был бы неправильным для пользователя, так как Менеджер оповещений мог бы "Запрещать" оповещение.