提升应用服务系统可用性,制定相关业务监控项

背景:对业务增加监控后,出现了大量的垃圾告警信息,通过告警信息无法区分是系统出现故障还是当前系统没人使用。

问题解决思路:通过表中数据分析,业务发生的时间间隔,来制定监控频率,最大限度优化垃圾告警信息出现

SELECT sc 时间间隔, count(1) 出现频率
  FROM (SELECT round(((to_date(a.next_ti, 'yyyy-mm-dd hh24:mi') -
                     to_date(a.ti, 'yyyy-mm-dd hh24:mi')) * 24 * 60),
                     0) sc
          FROM (SELECT ti, lead(t.ti, 1, null) over(order by t.ti) next_ti
                  FROM (SELECT to_char(ddxx.ddscsj, 'yyyy-mm-dd hh24:mi') ti
                          from aakkf ddxx
                         WHERE ddxx.ddscsj >= trunc(sysdate - 1)
                           and ddxx.ddscsj < trunc(sysdate)
                           and ddxx.qddm = '160'
                           and ((ddxx.zffs_dm = '112' and ddxx.respcode = '15') or
                               (ddxx.zffs_dm = '104' and ddxx.respcode = '12'))
                         group by to_char(ddxx.ddscsj, 'yyyy-mm-dd hh24:mi')) t) a
         WHERE a.next_ti is not null)
 group by sc
 order by sc desc;
说明:
时间间隔:上次一次下单和下一次下单的时间间隔

出现频率:时间间隔出现频率

结论:

对订单信息表的监控频率调整成40分/次,就不会出现误告警的情况。每个月通过数据分析得到监控频率,实时调整避免出现无效监控。

posted @ 2022-06-24 18:47  shiyunyier  阅读(46)  评论(0)    收藏  举报