alertmanager 设置 repeat_interval 不生效

这个问题其实并不是repeat_interval真的没生效,而是告警没有重复,人家发的是新的告警,没有命中repeat_interval规则。

举个栗子

- alert: HighCpuLoad
          expr: 100-(avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance)* 100) > 70
          for: 1m
          labels:
            severity: warning
          annotations:
            summary: "Host high CPU load (instance {{ $labels.instance }})"
            description: "CPU load is > 80% VALUE = {{ $value }} LABELS = {{ $labels }}"

 

它当前值确切到小数点后很多位了,导致每次查出来数字都不一样,所以认为是新的告警。可以把当前值去掉或者只保留整数位再四舍五入一下。

 

posted @ 2024-04-26 17:57  高佳丰  阅读(166)  评论(0)    收藏  举报