说明:
本文档演示如何在Vmware EXS Server 3.5环境下,使用虚拟机技术安装RHEL 4.8 x86_64系统,然后搭建两个节点的oracle 10g RAC的过程。最后是关于rac的一些知识。
仅供学习测试参考使用。
一、RAC简单知识
RAC的定义:指借助于“某种集群件产品”搭建出来的一个“多实例,单数据库”的环境。
(一)RAC环境拓扑图:
图中硬件用Hn表示,软件用Sn表示,其中n不代表数量,而是代表种类。
1、硬件环境:
a、节点(主机)H1:
图中所示,两个节点或主机
b、网卡 H4:
每个主机至少有两块网卡,图中H4表示两块网卡:一个网卡用于对外提供服务,对应ip称为public ip,用实线表示;一个网卡用于集群内部通信,对应ip称为private ip,用虚线表示。
除public ip和private ip之外,每个节点还有第3个ip,称为VIP(virtual ip),真正对外提供服务的ip。当主机节点宕机,此节点的vip会转移到其他幸存的节点上,继续对外提供服务。
c、网络交换机H5和H6:
private ip的网卡连接到H5上,这个交换机只用于节点之间传递心跳数据和cache fusion数据,因此不要再连接其他设备。也就是说,这个网络是完全隔离的,oracle专用,至少G级交换机。
public ip的网卡连接到H6上,其他需要访问数据库的设备也连接到这个交换机上。dba日常维护也通过这个交换机。
d、共享存储H3:
整个RAC环境中,所有节点共享一个存储,即所有实例共享一个数据库。真实环境中,每个节点主机都需要安装HBA卡(图中H2),通过光纤线和光纤模块或光纤交换机与共享存储连接。
2、软件环境:
a、操作系统
每个节点的操作系统必须一致,包括小版本和补丁包必须一致。
b、集群件
集群件是安装在操作系统之上的一个特殊软件,负责管理整个集群环境中的硬件资源,并为上层的RAC集群提供基础服务。
集群件和OS之间的关系就像在单机环境下应用程序和OS的关系:在单机环境中,硬件资源是由OS内核管理的,应用程序不能直接访问硬件,必须通过OS内核提供的接口来间接访问硬件。OS除了要完成用户请求,还要通过进程调度等机制来控制多进程对资源的使用。
在集群环境下,硬件尤其存储设备是共享使用,不仅需要协调每台主机内多进程的共享使用,还要协调主机间的共享使用,仅靠传统的OS是无法控制的,因此就有了集群件。
可以把整个集群详细成一台虚拟的计算机,集群件就是这台计算机的操作系统,RAC是其上的一个应用。
从10g开始,oracle提供了oracle clusterware,并且提供了api接口,能够为其他软件提供HA功能。
c、集群文件系统
集群中所有实例共享一个数据库。data files、redo logs、control files、parameter files必须存放在共享存储上,以保证所有节点都能访问。这就需要对节点进行控制,普通的文件系统不具备这种集群功能,必须采用特殊的集群文件系统。
10g以前,oracle只提供了对raw device的支持,没有提供集群文件系统,因此需要选择第三方产品。从10g开始,oracle提供了两种集群文件系统:OCFS和ASM。OCFS目前已经开源,oracle大力推荐ASM。本测试环境中,同时演示了ocfs、asm、raw device的用法。
d、数据库软件
版本10.2.0.1,安装补丁升级到10.2.0.5
3、逻辑层
a、存储层
b、网络层
3个网络:public网卡接入的网络,对外提供服务;private网卡组成的网络,用于心跳和cache fusion;存储网络,提供共享存储。
c、集群件层
d、应用层
整个应用层由若干CRS resource组成,一个CRS resource通常是一个进程,或者由一组进程组成的一个完整服务。集群之所以能够提供高可用,是因为CRS对运行在上面的应用进行监视,并在发生异常时进行重启、切换等干预手段。这些被监控的对象就叫CRS resource。这些resource是在rac安装过程中自动或手动创建,并注册登记到CRS中,以metadata的形式记录在OCR磁盘上,包括resource的名称、如何启动、停止、如何检查监控等配置信息。
oracle把CRS resource分为两类:nodeapps和database-related resource
nodeapps:GSD(Global Services Daemon)、ONS(Oracle Notification Service)、VIP(Virtual Internet Protocol)、Listener (一个节点上只有一个)
database-related-resource:database、instance、service (和数据库相关,不受节点限制)
4、集群要解决的问题
a、并发控制:DLM
b、健忘症:OCR
c、脑裂:VOTINGDISK
d、IO隔离:软件方式
浙公网安备 33010602011771号