Как рассчитать срабатывание оповещений в оповещениях Прометея и добавить их к ярлыкам оповещений?

Например, у меня есть 2 хоста, предупреждение будет срабатывать, когда процессор> 90%. Я могу открыть пользовательский интерфейс Prometheus UI & Alert Manager, и вижу оповещения, запускаемые для двух хостов.

Я использую webhook в качестве приемника, я хочу получить количество предупреждений для ЦП> 90% для каждого хоста, как я могу этого добиться?

Я считаю, что если я могу получить значение счетчика откуда-то, то я могу добавить его в метку оповещения, и, наконец, я могу получить значение из меток в интерфейсе webhook.

Я сослался на количество предупреждений, сгенерированных прометеем, они используют функцию изменений, но они не могут покрыть, если значение не изменяется (скажем, CPU сохраняет 90%).

1 ответ

Решение

Как считается, я думаю, что Prometheus и Alert manager не поддерживают эту ситуацию, потому что это не имеет смысла.

Для пользователя, если он / она хочет знать, сколько предупреждений было сгенерировано определенным правилом (скажем, ЦП> 90%) за последний 1 час, они будут сосредоточены только на том, сколько предупреждений было получено, а не на количестве запущенных предупреждений. Прометей.

Как мы знаем, Alert Manger имеет правила "group_wait","repeat_interval" и "Inhibited", их параметры будут влиять на то, сколько и как часто оповещение отправляется с помощью Alert Manager. Даже если бы я мог получать оповещения о срабатывании Прометея, но этот номер был бы неправильным для пользователя, так как Менеджер оповещений мог бы "Запрещать" оповещение.

Другие вопросы по тегам