当前,企业运维监控的难度日益增大,缺乏统一性、集成化、灵活性的运维管理已经无法适用当前的工作要求,运维人员往往需要使用多个不同的监控系统,容易造成无法及时发现和处理问题的情况,不但增加了工作负担和成本,同时影响运维效率和质量。

  • 企业监控运维缺乏统一性和集成性,导致运维人员需要使用多个不同的监控系统工
  • 企业监控运维缺乏有效性和准确性,导致运维人员无法及时发现和定位问题
  • 企业监控运维缺乏可扩展性和灵活性,导致运维人员无法适应不断变化的业务需求和技术环境

企业级一站式监控解决方案

众安基于云原生技术构建新一代DevCube研发运维一体化平台,其中DevCube Seraph运维监控平台是面向应用的全方位可视化、态势感知监控运维平台,通过自定义监控大屏,将不同监控指标的可视化图表做统一展示,实现面向不同监控场景的开箱即用,并通过统一告警平台,秒级捕获线上故障,使企业实时、精准地捕获业务及IT资源的健康状态,提升运维质量。

监控对象包括应用所依赖的基础设施、容器、中间件、网关,以及应用自身的接口、调用链、前端性能、日志等。

  • 基础设施+中间件监控,后端稳定运行的基石

通过采集基础设施和中间件的关键指标数据,配合监控告警平台,进行基础资源的容量监控、运行状态监控、以及中间件服务监控,确保基础设施和中间件、支撑上层业务的稳定运行。

  • 调用链监控,全链路定位性能瓶颈

通过查看服务请求的拓扑图,追踪请求从接收到处理完成的全生命周期路径,基于调用拓扑图梳理应用和上下游应用的调用关系和相互间的性能表现,快速定位系统性能瓶颈。

  • 日志监控,多维度异常排查

将应用系统运行或者程序执行过程中产生的日志信息,通过日志采集、提取关键字段、分析存储等操作,配合告警能力,详细描述系统运行动作,进行排查故障。

  • 前端监控,让用户体验可视化

提供Web及APP前端性能的监控与分析,量化前端用户体验指标,采集网页JS错误及页面请求错误,快速定位前端性能问题,辅助进行前端性能优化,实现用户体验可视化。

  • 告警模块,实现智能多方告警触达

通过告警的多规则配置、分级通知、去重降噪等能力,实现线上故障的秒级响应和精准捕捉,全面接入邮件、语音、短信、微信、钉钉等触达渠道,提升企业运维的时效性和可靠性。

  • 自定义可视化大屏

可便捷查询出接入平台的各项指标监控指标,并配置成合适的展示图表,满足个性化的监控指标查看需求,应对不同业务场景下的自助可视化需求。

一体化监控和运维体系

当企业系统架构复杂、监控数据来源于不同工具和提供方,当运维人员需要对不同维度和来源的数据在不同平台间切换管理,当计算、分析和告警数据都散落在不同系统,数据相互割裂。那么,搭建一体化的监控和运维体系,就是数据得以整合,实现统一管理和工作能效提升的有效路径。

众安运维监控平台Seraph支持对接主流工具采集的数据源(filebeat、OpenTelemetry、Prometheus等),提供统一的数据清洗、存储、计算、指标定义和告警平台,通过数据的聚合与分析可以形成清晰完整的业务系统运作拓扑,帮助运维人员统一日常所有任务的门户入口,降低企业运维工作成本,提高人员工作效率和质量。

该系统支持数据的开放接入,可将用户已有的指标、日志、调用链数据接入平台、供汇总和告警使用,从而降低客户整体的改造成本。同时,众安也可针对客户的监控建设现状,做整体诊断和定制化方案规划,为保险、证券、汽车、智能制造、互联网等行业客户打造可落地的一体化监控产品和方案。

目前,众安运维监控系统已在某互联网保险集团公司内部大规模使用,内置监控指标400+个,达到分钟级线上故障告警,实现缩短76%服务恢复耗时,3名人员即可运维万台服务器,集群资源使用率达75%以上,节省2000w集群IT成本。

Copyright © 2024 众安工程效能
Powered by .NET 8.0 on Kubernetes