NoneExpr в шаблоне jinja для генерации действительного числа предупреждений в prometheus

Необходимо написать expr в alertrule.yaml.j2, чтобы оповещения генерировались при сбоях более 50% в заданном диапазоне времени (10 минут), где сбой измеряется метрикой: metric_Failures{name="\"EndpointA\""} общее количество запросов, измеренных метрикой: metric_total {name = "\" EndpointA \ ""}

alertrule.yaml.j2:

- name: prometheusAlertRules
  rules:
  - alert: failure_alert
    expr: "round(metric_Failures{ name=\"{{"}}EndpointA{{"}}\" {{ '}' }} [10m] / metric_total{ name=\"{{"}}EndpointA{{"}}\" {{ '}' }} [10m])  > 0.50"
    for: 3m
    labels:
      service: '{{ '{{' }} $labels.application {{ '}}' }}'
      severity: critical
      value: '{{ '{{' }} $value {{ '}}' }}'


Он не генерирует ожидаемое количество предупреждений! Не уверен, что ошибка в expr, как новичок в этом.

0 ответов

Другие вопросы по тегам