简要说明ORACLE11GR2 RAC的进程启动流程:

1.启动流程概览图:

 

二。RAC启动流程的梳理:

第一层:OHASD 启动:(OHASD派生)

1.CSSDAGENT负责启动CSSD的AGENT.以root用户权限启动,负责启动CSSD进程。

2.ORAROOTAGENT负责启动“root"用户下的OHASD的资源的AGENT.

以 root 用户权限启动,负责启动以下这些守护进程:CRSD进程、CTSSD进程、DISKMON进程、ACFS进程。这些进程也都是以ROOT用户权限启动。

3.ORAAGENT 负责启动所用GRID用户的OHASD的资源的AGENT.

以GRID用户权限启动,负责MDNSD进程、GIPCD进程、gpnpd进程、EVMD进程、ASM进程

4.CSSDMONITOR  - 监控 CSSD 以及节点健康(和 cssdagent 一起)。

以ROOT用户权限启动,负责CSSDMONITOR进程和启动。

第二层:

1.OHASD rootagent 启动:

CRSD -管理集群资源的主要后台进程。

CTSSD-CLUSTER TIME SYNCHRONIZATION SERVICES DAEMON

DISKMON

ACFS (ASM CLUSTER FILE SYSTEM)驱动。

2.OHASD ORAAGENT启动:

MDNSD-用来实现DNS查询

GIPCD-用来做节点间通信

GPNPD-GRID PLUG &PLAY PROFILE DAEMON

EVMD-EVENT MONITOR DAEMON

ASM-ASM资源

第三层:CRSD启动:

ORAROOTAGENT-负责启动所有ROOT用户下的CRSD资源的AGENT.

ORAAGENT-负责启动所有GRID用户下的CRSD资源的AGENT

第四层:CRSD rootagent启动

NETWORK RESOURCE-监控公共网络

SCAN VIP(S) -SINGLE CLIENT ACCESS NAME VIRTURAL IPS

NODE VIPS-每个节点1个

ACFS REGISTERY 挂载ASM CLUSTER FILE SYSTEM

GNS VIP(OPTIONAL)VIP FOR GNS

第四层: CRSD oraagent 启动:

ASM RESOURCE -ASM 资源

DISKGROUP -用来管理/监控ASM磁盘组

DB RESOURCE -用来管理/监控数据库和实例

SCAN LISTENER -SCAN监听,监听在SCAN VIP 上

Listener -节点监听,监听在NODE VIP上

SERVICES -用来管理/监听 SERVICES

ONS- ORACLE NOTIFICATION SERVICES

EONS-加强版 ORACLE NOTIFICATION SERVICE

GSD 为了向下兼容9I

GNS (OPTIONAL)-GRID NAMING SERVICE -处理域名解析

启动流程对应日志:

Clusterware 后台进程日志都放在”GRID_HOME”/log/”NODENAME”之下,结构如下:

/<GRID_HOME>/log/<NODENAME>/alert<NODENAME>.log
    对于clusterware的问题,先检查这个文件

/<GRID_HOME>/log/<NODENAME>/ohasd
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oraagent_<GRIDUSER>
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdagent_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdmonitor_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/orarootagent_root
    对应的 OHASD进程和其启动的子进程日志和PID

/<GRID_HOME>/log/<NODENAME>/crsd
/<GRID_HOME>/log/<NODENAME>/ctssd
/<GRID_HOME>/log/<NODENAME>/diskmon
    对应 OHASD rootagent 启动的CRSD、CTSSD和Diskmon

/<GRID_HOME>/log/<NODENAME>/mdnsd
/<GRID_HOME>/log/<NODENAME>/gipcd
/<GRID_HOME>/log/<NODENAME>/gpnpd
/<GRID_HOME>/log/<NODENAME>/evmd
    对应 OHASD oraagent 启动的MDNSD、GIPCD、GPNPD和EVMD

/<GRID_HOME>/log/<NODENAME>/agent/crsd/orarootagent_root
/<GRID_HOME>/log/<NODENAME>/agent/crsd/oraagent_<ORACLEUSER>
    对应 CRSD 启动的orarootagent和oraagent

/<GRID_HOME>/log/<NODENAME>/cssd
    对应 OHASD cssdagent 启动的CSSD

<GRID_HOME> 和 $ORACLE_BASE 目录下的 cfgtoollogs 目录存放了一些其它的重要日志
比如 rootcrs.pl 以及其它配置工具,比如 ASMCA 等等

ASM 日志存放在 $ORACLE_BASE/diag/asm/+asm/<ASM Instance Name>/trace

<GRID_HOME>/bin 目录下的 diagcollection.pl 可以自动收集重要的日志
以 root 用户执行它

Clusterware 资源状态检查:

使用root用户检查状态

su -
cd "$(su - grid -c 'echo $ORACLE_HOME')/bin"
./crsctl status resource -t

或者直接使用grid用户检查状态

su - grid
crsctl status resource -t

集群资源管理和维护命令简介:

srvctl 和 crsctl 可以用来管理集群资源 
尽量使用 srvctl 来管理资源,当srvctl无法操作时,使用crsctl管理资源 
使用俩命令的-h参数列出所有的可用操作选项

ocrconfig 可以用来管理维护OCR(Oracle Cluster Registry)或OLR(Oracle Local Registry) 
诸如导入导出升级、基于备份的恢复和备份策略等

olsnodes 可以用来管理维护集群的节点信息,如查看集群信息、节点状态等

cluvfy 集群相关状态的检查和维护命令,该命令可以用来对集群状态进行巡检 
主要有 comp 和 stage 两类用法 
查看相应的帮助:cluvfy comp -help、cluvfy stage -help 
可以实现诸如节点探测、共享存储可用性探测、集群安装前的系统或硬件检查等

 

posted on 2019-03-21 11:33  蓝猫电台  阅读(1171)  评论(0编辑  收藏  举报