蓝鲸监控hbase集群状态

1.#思路:status可以看到dead 0说明集群健康;list列出重要表名也说明集群健康。

#在hbase服务器上加crontab

1 */2 * * * /bin/bash /tmp/hbase_status.sh > /tmp/status_hbase.txt
1 */10 * * * /bin/bash /tmp/hbase_table.sh > /tmp/table_hbase.txt

cat /tmp/hbase_status.sh
#!/bin/bash
/usr/bin/hbase shell <<EOF
status
EOF

cat /tmp/hbase_table.sh
#!/bin/bash
/usr/bin/hbase shell <<EOF
list
EOF

2.#在蓝鲸web页面添加自定义监控

#!/bin/bash
#在蓝鲸web页面添加自定义监控
status=`egrep -c 'dead 0' /tmp/status.txt`
table=`egrep -c '替换成重要表名' /tmp/hbase.txt`
hbase_status=1
if [ $table -ne 2 $b ] && [ $status -ne 1 ] ;then
hbase_status=0
fi
echo "hbase_health{hostname_name=\"10.51.86.13(hbase-ip)\"} ${hbase_status}"

posted @ 2020-10-30 20:45  littlevigra  阅读(288)  评论(0编辑  收藏  举报