120 likes | 302 Views
面向 Web 的 Oracle 应用. 第 19 章 集群概述. 本章主要内容. 集群产品概述 Oracle 支持的 RAC 环境 RAC 产品安装、配置常见问题及解决方法 小结. 1 、 RAC 产品概述. 1 ) RAC 的优点. 多节点负载均衡 ; 提供高可用:故障容错和无缝切换功能,将硬件和软件错误造成的影响最小化; 通过并行执行技术提高事务响应时间 ---- 通常用于数据分析系统 ; 通过横向扩展提高每秒交易数和连接数 ;---- 通常对于联机事务系统 ; 节约硬件成本,可以用多个廉价 PC 服务器代替昂贵的小型机或大型机,同时节约相应维护成本 ;
E N D
面向Web的Oracle应用 第19章 集群概述
本章主要内容 • 集群产品概述 • Oracle支持的RAC环境 • RAC产品安装、配置常见问题及解决方法 • 小结
1)RAC的优点 • 多节点负载均衡; • 提供高可用:故障容错和无缝切换功能,将硬件和软件错误造成的影响最小化; • 通过并行执行技术提高事务响应时间----通常用于数据分析系统; • 通过横向扩展提高每秒交易数和连接数 ;----通常对于联机事务系统; • 节约硬件成本,可以用多个廉价PC服务器代替昂贵的小型机或大型机,同时节约相应维护成本; • 可扩展性好,可以方便添加删除节点。
2)RAC的缺点 • 相对单机,管理更复杂,要求更高; • 在系统规划设计较差时性能甚至不如单节点; • 可能会增加软件成本(如果使用高配置的pc服务器,Oracle一般按照CPU个数收费)
2、Oracle RAC/Clusterware的结构和组件 • RAC主要组件, 软硬件两部分 • 服务器 >= 2 • 操作系统,推荐使用Oracle认证的系统;版本不要太老,也不要太新 • CPU/内存,根据业务需要,内存至少1G • 本地磁盘空间,>=30G • 网卡 >=2 ,推荐4个以上千兆网卡 • 私有以太网络,推荐千兆交换机以上 • HBA卡 ,如果是SAN,推荐2个冗余HBA • 共享存储设备,推荐SAN设备 • 存储管理, ASM/Cluster LV/裸分区/CFS,不推荐用OCFS,卷管理软件、多路径软件等 • 第三方集群软件: 可选 • Oracle Clusterware 软件 • Oracle RDBMS 软件
Clusterware主要进程 • crsd: 负责管理集群的高可用操作。管理的crs资源包括数据库、实例、监听、虚拟IP,ons,gds或者其他,操作包括启动、关闭、监控及故障切换。改进程由root用户管理和启动。 • cssd,管理各节点的关系,用于节点间通信,节点在加入或离开集群时通知集群。该进程由oracle用户运行管理。 • oprocd – 集群进程管理 —Process monitor for the cluster. 用于保护共享数据IO fencing。 • evmd :事件检测进程,由oracle用户运行管理。
Clusterware使用的共享设备 • Oracle Cluster Registry(OCR):记录集群的配置信息; • Voting disk : 即投票盘,保存节点的成员信息,当配置多个投票盘的时候个数必须为奇数,每个节点必须同时能够连接半数以上的投票盘才能够存活;
2、Oracle支持的RAC环境 • 官方不支持的:Vmware, Sun LDOM ,Solaris Local Container/Zones • 官方支持的: IBM LPAR, IBM VIOS(Virtual IO Server), Solaris Global Containers RHEL GFS , ISCSI, • 私有网络(心跳线)的支持: 不支持使用交叉线,支持 Infiniband RDS (10gR2之后) • 异构环境:支持不同的硬件、但相同的软件(OS/Oracle)组成的集群,不支持32位与64位系统间的集群 • 目前支持的NFS的server包括: • EMC Celerra • Fujitsu Filer NR1000 Series • IBM N Series • NetApp FAS, F, G Series • Pillar Data Systems Axiom 500 • Sun StorageTek 5000 Series
3、安装RAC常见问题 • 安装CRS失败,或执行root.sh报错; • 解决方法:分析更细原因,一般由大约13种原因造成,具体见参照文档。 • 客户端有时候报错; • 解决方法:设置local_listener初始化参数 • 如果选择节点界面出不来。 • HACMP环境中需要检查oracle 用户必须在 hagsuser组里. • 如果是hacmp5.4,需要打Oracle补丁6718715; • 可以使用集群配置文件cluster CONFIGURATION FILE 内容模板
AIX上数据库启动报错 • 原因:没有设置网络参数udp_recvspace/udp_sendspace • Windows平台,ORA-600 [kccsbck_first] • 解决方法:关闭Media Sense(媒体感知) • 系统循环重启 • 可能是CRS导致,如果因为crs,首先设置 crsctl disable crs 来禁止oracle crs的自动启动。查看OS、crsd和cssd的对应日志
Thank You! 钱剑飞