随笔分类 - Services
摘要:第1章 简介 ganglia是一款为HPC(高性能计算) 集群设计的可扩展性 的分布式监控系统,它可以监视和显示集群中节点的各种状态信息,他由运行在各个节点上的gmond守护进程来采集 CPU、内存、磁盘利用率、I/O负载、网络流量情况等方面的数据。然后汇总到gmetad守护进程下,使用rrdtoo
阅读全文
摘要:Prometheus监控(二) 数据类型 Counter(计数器类型) Counter类型的指标的工作方式和计数器一样,只增不减(除非系统发生了重置),Counter一般用于累计值。 Gauges(仪表盘类型) Gauges是可增可减的指标类,可以用于反应当前应用的状态。比如在监控主机时,可用内存大
阅读全文
摘要:Prometheus介绍 (1)Prometheus由来 普罗米修斯的灵感来自于谷歌的Borgmon。它最初是由马特·t·普劳德(Matt T. Proud)作为一个研究项目开发的,普劳德曾是谷歌(google)的一名雇员。在普劳德加入SoundCloud之后,他与另一位工程师朱利叶斯•沃尔兹(Ju
阅读全文
摘要:第一章 创建钉钉应用(用于发送报警信息给单独某个用户) 打开钉钉管理后台: https://oa.dingtalk.com 创建成功后需要记录三个值"AgentID","AppKey","AppSecret"。 第二章 创建钉钉机器人(用于发送报警信息到监控群) 2.1创建钉钉群 过程略过。 2.2
阅读全文
摘要:Linux下Nagios 3.2.3安装与配置 Nagios简介 Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或
阅读全文

浙公网安备 33010602011771号