摘要:
dashboard 功能 为用户展示监控数据 配置文件 gunicorn.conf rrd/config.py Portal 功能 用于设置报警策略 维护机器分组 配置策略表达式 配置策略模版 设置机器维护周期 配置插件关联的分组 配置文件 frame/config.py 数据库表 关系: 进程监控 阅读全文
摘要:
功能 存储agent push的数据 为query 提供查询数据接口 参考RRDtool的理念,在数据每次存入的时候,会自动进行采样、归档。在默认的归档策略,一分钟push一次的频率下, 历史数据保存5年。同时为了不丢失信息量,数据归档的时候,会按照平均值采样、最大值采样、最小值采样存三份。 用户在 阅读全文
摘要:
功能 query组件,提供统一的绘图数据查询入口。query组件接收查询请求,根据一致性哈希算法去相应的graph实例查询不同metric的数据,然后汇总拿到的数据,最后统一返回给用户。 配置文件 默认端口 http:9966 提供一组查询接口API API接口 http://127.0.0.1:9 阅读全文
摘要:
功能 处理agent心跳请求,并将agent信息(ip、hostname、agent_version、plugin_version)等信息入库(portal库) 为agent提供执行run api的白名单 为agent 提供执行的plugin插件 为agent提供需要监控的进程和端口 缓存监控策略, 阅读全文
摘要:
功能 judge 模块主要从transfer中接收数据,并从HBS中获取报警策略,然后进行阈值报警判断 从HBS获取报警策略 接收transfer 上报的数据,并存储最新几个点 判断阈值,产生报警事件 判断报警事件是否写入redis 老旧报警数据的清理 配置文件 处理逻辑 策略同步 1.judge启 阅读全文
摘要:
功能 负责数据转发,接受agent上报的数据,然后使用一致性hash规则对数据进行分片,最后将分片后的数据分别转发至judge,graph 对接收到的数据进行合法性校验、规整 针对每个后端实例维护一个RPC连接池 准备内存Queue中转监控数据,可以保证后端judge和graph平稳接收数据 根据一 阅读全文
摘要:
功能 采集数据,解析数据,上报数据至transfer 基本涵盖了系统层面监控指标,直接将数据转换为metricValue形式,上报至transfer 支持插件采集,代码插件放可受git管理,放置在plugin目录,从HBS中获取执行周期,版本等 支持数据直接上报,提供HTTPAPI,将收到的数据转换 阅读全文