Сигнал тревоги Grafana с определенным интервалом
Я создал оповещение для своих данных о прометее, которое колеблется каждые 30 секунд, что является заданным интервалом, который я установил для проверки. Я пытаюсь проверить, не соответствует ли желаемое количество модулей количеству доступных модулей в моем кластере k8s за весь 15-минутный период. Похоже, в предупреждении указано, что указанная мной метрика является значением, которое было при его последнем оповещении, но если я нажму "проверить предупреждение", возвращаемый json указывает, что сейчас не должно быть предупреждения. Я не уверен, почему это колебание, и любое понимание будет с благодарностью. Вот соответствующая информация:
Alert Query:(sum(kube_deployment_spec_replicas{namespace="default"}) without (deployment, instance, pod)) - (sum(kube_deployment_status_replicas_available{namespace="default"}) without (deployment, instance, pod))
Condtion: WHEN min() OF query(G,15m,now) IS ABOVE 0.5
Если данные отсутствуют или все значения равны нулю, установите для состояния Ok
Если ошибка выполнения или таймаут установлены, чтобы сохранить последнее состояние
Изменить: Когда я запускаю запрос непосредственно против Прометея, я получаю следующий ответ:
curl -k -s 'https://prometheus-k8s/api/v1/query?query=(sum(kube_deployment_spec_replicas%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))%20-%20(sum(kube_deployment_status_replicas_available%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))'
{"status":"success","data":{"resultType":"vector","result":[{"metric":{"endpoint":"https-main","job":"kube-state-metrics","namespace":"default","service":"kube-state-metrics"},"value":[1529946877.247,"0"]}]}}%