ORACLE 10G RAC 节点自己主动重新启动故障处理
          
          版权声明:本文为博主原创文章,未经博主同意不得转载。
            
                              
          个人技术站点:http://www.ezbit.ren https://blog.csdn.net/joeadai/article/details/34883561
将数据库集群升级到10.2.0.5之后,双节点server不断重新启动。查询oracle oprocd进程日志。信息例如以下:
Jul 03 08:16:34.702 | INF | monitoring started with timeout(1000), margin(500), skewTimeout(125)
Jul 03 08:16:34.704 | INF | fatal mode startup, setting process to fatal mode能够看到看到oprocd进程的时间间隔设置为
timeout(1000), margin(500), skewTimeout(125)查看其他的日志信息,没有发现明显的错误信息,因此怀疑是oprocd的时间參数设置不当。
改动參数例如以下:
#crsctl set css diagwait 13 -force改动參数时,须要注意例如以下几个事项
当我们设置diagwait參数时,须要停止全部rac节点的集群活动。停止顺序例如以下(假设集群式活动的。改动diagwait有可能会损害ocr):
1,以root用户在全部节点执行
#crsctl stop crs 
#<CRS_HOME>/bin/oprocd stop2,确认全部节点的进程已经停止
#ps -ef |egrep "crsd.bin|ocssd.bin|evmd.bin|oprocd"3,改动參数。只在一个节点改动就能够了
#crsctl set css diagwait 13 -force#crsctl get css diagwait5,启动集群节点
#crsctl start crs
#crsctl check crs改动參数后。集群服务执行正常,没有再自己主动重新启动过。
 
                     
                    
                 
                    
                
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号