Прометей, чтобы получить сигнал тревоги, когда узел находится в неконтролируемом состоянии

Может кто-нибудь помочь мне в написании запроса Promql, чтобы получить статус узла, является ли узел планируемым или нет. Заранее спасибо.

1 ответ

Если вы используете Прометей-оператор, kube-state-metrics вернуть kube_node_status_condition метрика:

sum(kube_node_status_condition{condition="Ready",status!="true"})

Приведенный выше ответ покажет, готов ли узел к этому или нет - узел может быть готов, но не имеет расписания (например, если вы оцепили узел с помощью:

kubectl cordon NODE)

Пример ниже должен охватывать готовый узел, который не подлежит планированию и также доступен через kube-state-metrics

sum(kube_node_spec_unschedulable) by (node)

Я имею в виду machine_cpu_coresметрика. Он покажет только готовые узлы в кластере Kubernetes.

Другие вопросы по тегам