摘要: Here are the legal global keywords: Keyword Function ---------------------------------------------------------------- set daemon Set a background poll interval in seconds. set init ... 阅读全文
posted @ 2018-08-17 23:22 Fuzengjie 阅读(431) 评论(0) 推荐(0) 编辑
摘要: 监控模式:(MONITRING MODE) Monit支持三种监控模式, active--Monitj监控一个服务,为了防止一系列问题,Monit会执行以及发送警报,停止,启动,重启,这是一个缺省的模式 passive--MOnit监控一个服务,不会尝试去修复这个问题,但还是会发送警报 manual 阅读全文
posted @ 2018-08-17 23:22 Fuzengjie 阅读(1110) 评论(1) 推荐(0) 编辑
摘要: 1.存在性检测 功能:检测文件或者服务不存在时进行相应的动作,默认是重启 语法: IF [DOES] NOT EXIST [[<X>] <Y> CYCLES] THEN action [ELSE IF SUCCEEDED [[<X>] <Y> CYCLES] THEN action] action的 阅读全文
posted @ 2018-08-17 23:20 Fuzengjie 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 1.介绍 monit监控和管理进程、程序、文件、目录和Unix系统的文件的工具。可以进行自动维护和修理,在错误的情况下执行有意义的因果关系的行动。比如,某个进程没有运行启动它;没有响应重启它;占用太多资源停止该进程等等。也可以用来监控文件、目录或系统文件的变化,如时间戳的改变,检验和的改变或大小的改 阅读全文
posted @ 2018-08-17 23:19 Fuzengjie 阅读(8733) 评论(0) 推荐(0) 编辑
摘要: 运行下列命令可以生成gmond默认配置文件:User@host:$ gmond -t配置文件由大括弧括起来的几个section组成。这些section可以粗略划分为两个逻辑分类。第一类中的section处理主机和集群的配置;第二类中的section处理指标数据收集和调度的特定问题。所有section名和属性不区分大小写,例如下列属性是等价的:name NAME Name NaMe有些section... 阅读全文
posted @ 2018-08-17 23:17 Fuzengjie 阅读(820) 评论(0) 推荐(0) 编辑
摘要: 1.有数据,不出图 排查方法: 1)确保 php-gd 插件已安装 2) 确保rrdtool 的命令路径是正确的 3)确保php.ini中passthru函数是否开启,参数safe_mode 是否为off ganglia-web使用passthru函数来生成图像2.打开ganglia监控的web界面,出现ganglia no matching ... 阅读全文
posted @ 2018-08-17 23:17 Fuzengjie 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 1.复制所需脚本到nagios的脚本目录,并设置权限 cp -fr ./ganglia-3.7.1/contrib/check_ganglia.py /usr/local/nagios/libexec/ chown nagios.nagios /usr/local/nagios/libexec/ch 阅读全文
posted @ 2018-08-17 23:17 Fuzengjie 阅读(405) 评论(0) 推荐(0) 编辑
摘要: gmetad 主要用来收集和汇聚gmond所收集的指标数据的守护进程,通过tcp端口8651监听其他gmetad连接,并向授权的主机提供xml格式的网络状态,gmetad通过tcp端口8652 对交互式请求作出应答。 其配置文件为gmetad.conf 具体参数: 1. data_source 属性 阅读全文
posted @ 2018-08-17 23:16 Fuzengjie 阅读(1349) 评论(0) 推荐(1) 编辑
摘要: 系统环境:1.CPU 指标:%user %nice %sys %iowait %irq %soft %steal %guest %idle2.MEM 指标:memtotal memused memfree swaptotal swapused swapfree memfree.percent memused.percent swapused.percent... 阅读全文
posted @ 2018-08-17 23:13 Fuzengjie 阅读(492) 评论(0) 推荐(0) 编辑
摘要: 第一:统一监控报警平台设计思路构建一个智能的运维监控平台,必须以运行监控和故障报警这两个方面为重点,将所有业务系统中所涉及的网络资源、硬件资源、软件资源、数据库资源等纳入统一的运维监控平台中,并通过消除管理软件的差别,数据采集手段的差别,对各种不同的数据来源实现统一管理、统一规范、统一处理、统一展现、统一用户登录、统一权限控制,最终实现运维规范化、自动化、智能化的大运维管理。智能的运维监控平台,设... 阅读全文
posted @ 2018-08-17 23:13 Fuzengjie 阅读(2139) 评论(0) 推荐(0) 编辑
摘要: 一.介绍 Ganglia是由UC Berkeley发起的一个开源监控项目,设计用于监控数以千几的节点。每台服务器都运行一个收集和发送监控数据名为gmond的守护进程。它将从操作系统和指定主机中收集。接收所有监控数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次架 阅读全文
posted @ 2018-08-17 23:13 Fuzengjie 阅读(2884) 评论(0) 推荐(0) 编辑
摘要: #接收套接字缓冲区大小的默认值(以字节为单位)。net.core.rmem_default = 262144#接收套接字缓冲区大小的最大值(以字节为单位)。net.core.rmem_max = 16777216#发送套接字缓冲区大小的默认值(以字节为单位)。net.core.wmem_default = 262144#发送套接字缓冲区大小的最大值(以字节为单位)。net.core.wmem_ma... 阅读全文
posted @ 2018-08-17 23:12 Fuzengjie 阅读(1377) 评论(0) 推荐(0) 编辑
摘要: 1.可用参数: ensure ensure => {present|absent}, 决定该计划任务的目标状态,present 如该cron不存在,则添加;absent 如该cron已存在,则删除之 command command => "命令", 欲执行的命令或脚本路径,也可不写,默认是title 阅读全文
posted @ 2018-08-17 23:11 Fuzengjie 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 1.下图是数据通信的一个过程:TCP三次握手. TCP数据传输. TCP的四次断开 SYN:(同步序列编号,Synchronize Sequence Numbers)该标志仅在三次握手建立的时候有效。表示一个新的TCP连接请求。 ACK:(确认编号,Acknowledgement Number)是对TCP请求的确认标志,同时提示对端系统已经成功连接所有数据。 FIN(结束标志,Finish)用来... 阅读全文
posted @ 2018-08-17 23:11 Fuzengjie 阅读(892) 评论(0) 推荐(0) 编辑
摘要: 1.实现的功能: 管理那些软件包被安装,那些软件包被卸载 管理软件包是否更新 要求系统配置yum源(RedHat系统)、zypper源(Suse系统)等等 2.可用参数: ensure 指定软件包的状态, present 或installed(检查文件是否存在,不存在则安装)、absent(无其他软 阅读全文
posted @ 2018-08-17 23:10 Fuzengjie 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 1.服务资源的特性 controllable 提供变量控制 enableable 可以启动 停止服务 refreshable 可以重启服务 2.可用参数: ensure 指定服务目标的状态 running stoped enable 指定服务是否开机自启动 true | false hasstatu 阅读全文
posted @ 2018-08-17 23:10 Fuzengjie 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 1.文件管理介绍: 可管理的项目: 支持文件和目录 设置文件及目录的所有者及权限 恢复文件(包括文件的内容、权限及所有者) 清理目录以及子目录 2. 可使用参数: 支持文件和目录 设置文件及目录的所有者及权限 恢复文件(包括文件的内容、权限及所有者) 清理目录以及子目录 支持文件和目录 设置文件及目 阅读全文
posted @ 2018-08-17 23:08 Fuzengjie 阅读(1831) 评论(1) 推荐(0) 编辑
摘要: 1. 用户和组资源的特性: 1.1 用户特性: allows_duplicates 支持含有相同UID的用户。 manages_aix_lam 用来管理AIX的LAM(Loadable Authentication Module)系统。 manages_expiry 管理一个用户使用的有效期。 ma 阅读全文
posted @ 2018-08-17 23:08 Fuzengjie 阅读(327) 评论(0) 推荐(0) 编辑
摘要: Puppet命名规范:约定说明: 小写字母:"a-z"大写字母:"A-Z"数字: "0-9"句号: "."下划线: "_"连字符: "-"冒号: ":"1.主机命名: 规范:/\A[a-z0-9._-]+\Z/推荐:角色-运营商-机房-IP.系统.域名 web-cnc-bj-174.129.158.192.centos.linuxtone.org2.模块命名: 规范:\A[a-z][a-z0-... 阅读全文
posted @ 2018-08-17 23:07 Fuzengjie 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 报错1:解决:该报错是由于Puppet agent 的时间和Puppet master的时间不一致导致,可以使用ntp同步一下时间即可解决 报错2: 启动mcollective的时候报错解决:gem install stomp cp -fr /usr/lib/ruby/gems/1.8/gems/stomp-1.3.2/lib/stomp.rb /usr/lib/ruby/s... 阅读全文
posted @ 2018-08-17 23:07 Fuzengjie 阅读(266) 评论(0) 推荐(0) 编辑