代码改变世界

小知识:如何配置OSW添加私网监控

2020-06-30 10:40  AlfredZhao  阅读(377)  评论(0编辑  收藏

最近遇到一个Case,Oracle Support要求添加私网(心跳网络)监控。
OSW默认是没有私网监控的,如需增加只需配置private.net文件,对应采集信息会存放到archive/oswprvtnet目录下。
需要在RAC所有节点上配置,方法完全一样,这里以其中一个节点为例说明:

1.查看配置文件示例Exampleprivate.net

[grid@db02 oswbb]$ pwd
/opt/app/grid/oracle.ahf/data/repository/suptools/db02/oswbb/grid/oswbb
[grid@db02 oswbb]$ cat Exampleprivate.net 
######################################################################
# This file contains examples of how to monitor private networks. To
# monitor your private networks create an executable file in this same
# directory named private.net. Use the example for your host os below.
# Make sure not to remove the last line in this file. Your file
# private.net MUST contain the rm lock.file line.
######################################################################
#Solaris Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F <node1-priv>
traceroute -I -r -F <node1-priv>
traceroute -r -F <node2-priv>
traceroute -I -r -F <node2-priv>
######################################################################
#HP Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F <node1-priv> 
traceroute -r -F <node2-priv> 

######################################################################
#Linux Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F <node1-priv> 
traceroute -r -F <node2-priv>
######################################################################
#Tru64 Example
######################################################################
echo "zzz ***"`date`
traceroute -r -f <node1-priv>
traceroute -r -f <node2-priv>
######################################################################
#AIX Example
######################################################################
echo "zzz ***"`date`
traceroute -r <node1-priv>
traceroute -r <node2-priv>
######################################################################
# DO NOT DELETE THE FOLLOWING LINE!!!!!!!!!!!!!!!!!!!!!
######################################################################
rm locks/lock.file
[grid@db02 oswbb]$ 

2.拷贝示例文件到private.net

[grid@db02 oswbb]$ cp Exampleprivate.net private.net

3.修改private.net配置文件

保留Linux和最后提示不允许删除的部分,根据实际情况修改私网名称或者私网IP地址,我这里用到两组心跳网络:
[grid@db02 oswbb]$ cat private.net 
######################################################################
#Linux Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F db01-priv
traceroute -r -F db02-priv
traceroute -r -F db01-priv-2
traceroute -r -F db02-priv-2
######################################################################
# DO NOT DELETE THE FOLLOWING LINE!!!!!!!!!!!!!!!!!!!!!
######################################################################
rm locks/lock.file

检查oswprvtnet下面是否生成数据,如果没有可以尝试重启下osw:

[grid@db02 oswbb]$ tfactl stop oswbb
Stopped OSWatcher
[grid@db02 oswbb]$ tfactl start oswbb
Starting OSWatcher

4.确认OSW正常监控私网

观察到oswprvtnet目录下生成文件并定时更新写入信息:
[grid@db02 oswprvtnet]$ cat db02_prvtnet_20.06.30.0900.dat 
zzz ***Tue Jun 30 09:41:35 CST 2020
./private.net: line 5: traceroute: command not found
./private.net: line 6: traceroute: command not found
./private.net: line 7: traceroute: command not found
./private.net: line 8: traceroute: command not found
zzz ***Tue Jun 30 09:41:50 CST 2020
traceroute to db01-priv (10.10.1.107), 30 hops max, 60 byte packets
 1  db01-priv (10.10.1.107)  0.890 ms  0.869 ms  0.859 ms
traceroute to db02-priv (10.10.1.108), 30 hops max, 60 byte packets
 1  db02-priv (10.10.1.108)  0.036 ms  0.006 ms  0.005 ms
traceroute to db01-priv-2 (10.10.2.107), 30 hops max, 60 byte packets
 1  db01-priv-2 (10.10.2.107)  0.747 ms  0.799 ms  0.653 ms
traceroute to db02-priv-2 (10.10.2.108), 30 hops max, 60 byte packets
 1  db02-priv-2 (10.10.2.108)  0.037 ms  0.006 ms  0.005 ms
zzz ***Tue Jun 30 09:42:05 CST 2020
traceroute to db01-priv (10.10.1.107), 30 hops max, 60 byte packets
 1  db01-priv (10.10.1.107)  0.306 ms  0.163 ms  0.237 ms
traceroute to db02-priv (10.10.1.108), 30 hops max, 60 byte packets
 1  db02-priv (10.10.1.108)  0.027 ms  0.006 ms  0.005 ms
traceroute to db01-priv-2 (10.10.2.107), 30 hops max, 60 byte packets
 1  db01-priv-2 (10.10.2.107)  0.208 ms  0.164 ms  0.101 ms
traceroute to db02-priv-2 (10.10.2.108), 30 hops max, 60 byte packets
 1  db02-priv-2 (10.10.2.108)  0.017 ms  0.006 ms  0.008 ms

之前报错是因为系统缺失traceroute这个命令,一般OS都会有这个命令,如果没有可用yum安装即可:

[root@db02 ~]# yum install traceroute