监控工具 - IT监控系统成熟度
IT监控系统成熟度
发展阶段
监控系统有4个发展阶段,也是度量监控系统的方法,以及对监控改进的指南,可用于评估当前监控系统的成熟度级别以及可采用的改进步骤。
第1级 组件监控,反映每个组件的状态并根据策略进行警报通知。
第2级 层级监控,从各个层级、角度收集运行信息,包括各种指标度量值、输出日志、服务追踪信息等。
第3级 动态监控,不仅查看所有的状态、事件和度量,还查看依赖关系并跟踪动态变更情况,数据用可视化工具展现,以实时洞察整个系统的总体运行情况。
第4级 智能监控,能够在发生故障之前发送警报,通过扩展或重路由服务来实现自我治愈、异常检测等。
输入输出 与 阶段演化
监控系统成熟度各级的采集数据和结果输出
# 第1级:
状态信息,事件 ---》告警信息,收集单个组件的状态信息,输出告警
第1级到第2级,将获得对系统更深入的洞察力,将更好地理解服务的可用性和性能
# 第2级:
度量指标、日志、追踪信息 ---》仪表盘展示,从各个层级、角度收集运行信息,对各层级监控
第2级到第3级,采用更加主动的监控方法,在整个IT系统中获得全栈的可见性,并精确地理解业务流程、应用程序和基础架构之间的依赖关系。
# 第3级:
动态变更、依赖关系 ---》洞悉全局、全栈可视,包含状态信息、依赖关系、变更等,可以洞察全局、全栈可视
第3级到第4级,将获得预测分析能力,这将帮助企业预测可能发生的问题、指出可能的原因,IT维护更智能、敏捷、高效。
# 第4级:
机器学习、智能化 ---》可预测性,机器学习、高级信号处理、异常检测、自愈机制,提供可预期的结果
应用系统信息分类
- 基本情况:运维联系人、变更实施人、操作系统
- 功能效用:交易处理效率、业务高峰时段、系统服务能力
- 容量:资源使用率、存储空间使用率、CPU使用率
- 连续性:变更实施效率、应急频繁度、事件频繁度
- 可用性:可维护性、数据保存时间、系统可用率
- 安全性:恶意访问风险、系统警告次数、资源访问情况
行动是绝望的解药!
欢迎转载和引用,但请在明显处保留原文链接和原作者信息!
本博客内容多为个人工作与学习的记录,少数内容来自于网络并略有修改,已尽力标明原文链接和转载说明。如有冒犯,即刻删除!
以所舍,求所得,有所获,方所成。
 
                    
                
 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号