提升应用服务系统可用性,制定相关业务监控项
背景:对业务增加监控后,出现了大量的垃圾告警信息,通过告警信息无法区分是系统出现故障还是当前系统没人使用。
问题解决思路:通过表中数据分析,业务发生的时间间隔,来制定监控频率,最大限度优化垃圾告警信息出现
SELECT sc 时间间隔, count(1) 出现频率 FROM (SELECT round(((to_date(a.next_ti, 'yyyy-mm-dd hh24:mi') - to_date(a.ti, 'yyyy-mm-dd hh24:mi')) * 24 * 60), 0) sc FROM (SELECT ti, lead(t.ti, 1, null) over(order by t.ti) next_ti FROM (SELECT to_char(ddxx.ddscsj, 'yyyy-mm-dd hh24:mi') ti from aakkf ddxx WHERE ddxx.ddscsj >= trunc(sysdate - 1) and ddxx.ddscsj < trunc(sysdate) and ddxx.qddm = '160' and ((ddxx.zffs_dm = '112' and ddxx.respcode = '15') or (ddxx.zffs_dm = '104' and ddxx.respcode = '12')) group by to_char(ddxx.ddscsj, 'yyyy-mm-dd hh24:mi')) t) a WHERE a.next_ti is not null) group by sc order by sc desc;
说明:
时间间隔:上次一次下单和下一次下单的时间间隔
出现频率:时间间隔出现频率

结论:
对订单信息表的监控频率调整成40分/次,就不会出现误告警的情况。每个月通过数据分析得到监控频率,实时调整避免出现无效监控。
开源改变生活

浙公网安备 33010602011771号