摘要: alarm 功能 处理judge 产生的告警event 区分告警优先级,优先处理级别比较高的告警 为用户提供回调接口 生成告警msg 展示未恢复的告警 配置文件 Alarm模块收到告警事件的处理流程 高优先级 从redis list中获取事件 将事件记录在map(g.Events, event id 阅读全文
posted @ 2017-04-17 13:10 Fuzengjie 阅读(3038) 评论(0) 推荐(0) 编辑
摘要: dashboard 功能 为用户展示监控数据 配置文件 gunicorn.conf rrd/config.py Portal 功能 用于设置报警策略 维护机器分组 配置策略表达式 配置策略模版 设置机器维护周期 配置插件关联的分组 配置文件 frame/config.py 数据库表 关系: 进程监控 阅读全文
posted @ 2017-04-17 13:06 Fuzengjie 阅读(5373) 评论(0) 推荐(0) 编辑
摘要: 功能 存储agent push的数据 为query 提供查询数据接口 参考RRDtool的理念,在数据每次存入的时候,会自动进行采样、归档。在默认的归档策略,一分钟push一次的频率下, 历史数据保存5年。同时为了不丢失信息量,数据归档的时候,会按照平均值采样、最大值采样、最小值采样存三份。 用户在 阅读全文
posted @ 2017-04-17 13:05 Fuzengjie 阅读(4023) 评论(2) 推荐(0) 编辑
摘要: 功能 query组件,提供统一的绘图数据查询入口。query组件接收查询请求,根据一致性哈希算法去相应的graph实例查询不同metric的数据,然后汇总拿到的数据,最后统一返回给用户。 配置文件 默认端口 http:9966 提供一组查询接口API API接口 http://127.0.0.1:9 阅读全文
posted @ 2017-04-17 13:03 Fuzengjie 阅读(2249) 评论(0) 推荐(0) 编辑
摘要: 功能 处理agent心跳请求,并将agent信息(ip、hostname、agent_version、plugin_version)等信息入库(portal库) 为agent提供执行run api的白名单 为agent 提供执行的plugin插件 为agent提供需要监控的进程和端口 缓存监控策略, 阅读全文
posted @ 2017-04-17 12:59 Fuzengjie 阅读(1420) 评论(0) 推荐(0) 编辑
摘要: 功能 judge 模块主要从transfer中接收数据,并从HBS中获取报警策略,然后进行阈值报警判断 从HBS获取报警策略 接收transfer 上报的数据,并存储最新几个点 判断阈值,产生报警事件 判断报警事件是否写入redis 老旧报警数据的清理 配置文件 处理逻辑 策略同步 1.judge启 阅读全文
posted @ 2017-04-17 12:58 Fuzengjie 阅读(1996) 评论(0) 推荐(0) 编辑
摘要: 功能 负责数据转发,接受agent上报的数据,然后使用一致性hash规则对数据进行分片,最后将分片后的数据分别转发至judge,graph 对接收到的数据进行合法性校验、规整 针对每个后端实例维护一个RPC连接池 准备内存Queue中转监控数据,可以保证后端judge和graph平稳接收数据 根据一 阅读全文
posted @ 2017-04-17 12:57 Fuzengjie 阅读(2851) 评论(0) 推荐(0) 编辑
摘要: 功能 采集数据,解析数据,上报数据至transfer 基本涵盖了系统层面监控指标,直接将数据转换为metricValue形式,上报至transfer 支持插件采集,代码插件放可受git管理,放置在plugin目录,从HBS中获取执行周期,版本等 支持数据直接上报,提供HTTPAPI,将收到的数据转换 阅读全文
posted @ 2017-04-17 09:32 Fuzengjie 阅读(8543) 评论(0) 推荐(0) 编辑