1、,RoseHA软件培训,技术支持中心 王志刚 2007-3-9,RoseHA软件工作原理 RoseHA软件所需具备的安装环境; RoseHA软件的安装; RoseHA软件的配置; RoseHA软件的常见问题及解决方案;,RoseHA软件工作原理,RoseHA软件组成,RoseHA软件运行原理,RoseHA软件所需具备的安装环境,RoseHA软件所需具备的安装环境,Windows平台 Windows2000/2003; 两台服务器操作系统超级用户口令一致; 确保“Remote Procedure Call (RPC)”服务已启动; Linux平台 两台服务器操作系统超级用户口令一致; SCO O
2、penserver; 在5.0.6版本操作系统中需要安装“Compact.pkg”软件包,该软件包存在于5.0.7操作系统安装光盘中; 两台服务器操作系统超级用户口令一致; SCO Unixware; 尽量安装较高的补丁包; 补丁包可以在中下载; 两台服务器操作系统超级用户口令一致;,RoseHA软件的安装,RoseHA软件安装,Windows平台 安装RoseHA软件之前一定要调整好两台服务器的时间,在安装了RoseHA软件而尚未获得正式的License之前,不要修改系统时间;,RoseHA软件安装,Windows平台 输入本地服务器名称、远程服务器名称;,RoseHA软件安装,Linux平
3、台 挂载光盘; #mount /dev/cdrom /mnt/cdrom 安装软件; #/mnt/cdrom/install.sh,RoseHA软件安装,SCO 平台 挂载光盘; #mount /dev/cd0 /mnt (Openserver) #mount F cdfs o ro /dev/cdrom/cdrom1 /mnt(Unixware) 复制安装程序; #cp /mnt/*.* /rose 解压缩安装程序 #uncompress /rose/* #tar xvf roseha.tar 安装程序 #pkgadd d /rose,RoseHA软件的配置,RoseHA软件的配置,Wind
4、ows 平台1 图标介绍; 资源带入,RoseHA管理该资源; 资源带出,RoseHA不管理该资源; 所选资源的Failover; 所选资源的Takeover; 所有资源的Failover; 所有资源的Takeover;,RoseHA软件的配置,Windows 平台2 确认License; “开始”-“程序”-“NT Cluster”-“Cluster Administration Tool” “Tools”-“License”,RoseHA软件的配置,Windows 平台3 启动HA程序; “开始”-“程序”-“NT Cluster”-“Cluster Administration Tool
5、” “Tools”-“Start Cluster Operation”,RoseHA软件的配置,Windows 平台4 创建心跳; “开始”-“程序”-“NT Cluster”-“Cluster Administration Tool” “View”-“Private Net”,RoseHA软件的配置,Windows 平台5 创建心跳; 创建RS232串口心跳;,RoseHA软件的配置,Windows 平台6 创建心跳; 创建TCP/IP心跳;,RoseHA软件的配置,Windows 平台7 创建心跳;,RoseHA软件的配置,Windows 平台8 切换到资源配置模式; “开始”-“程序”-
6、“NT Cluster”-“Cluster Administration Tool” “View”-“Resource Objects”,RoseHA软件的配置,Windows 平台9 依次创建资源;,RoseHA软件的配置,Windows 平台10 创建Volume资源;,选择可用的共享物理磁盘,默认的 磁盘卷标,RoseHA软件的配置,Windows 平台11 创建虚拟IP资源;,虚拟IP地址,用于公网的实际IP地址,RoseHA软件的配置,Windows 平台12 创建虚拟主机名资源;,虚拟主机名称,RoseHA软件的配置,Windows 平台13 创建文件共享资源;,选择所需共享的文件
7、夹,RoseHA软件的配置,Windows 平台14 创建服务资源;,选择该服务所需依赖的其他资源,选择所需 的服务,RoseHA软件的配置,Windows 平台15 状态提示;,两台服务器的HA服务未启动;,本地服务器的HA服务启动,没有创建心跳链路;,两台服务器的HA服务启动,已创建心跳链路,没有创建资源;,两台服务器的HA服务启动,已创建心跳链路,已创建资源;NT1为Active服务器;,RoseHA软件的配置,Windows 平台16 状态提示;,两台服务器的HA服务启动,已创建心跳链路,已创建资源;NT1/NT2均为Active服务器;,两台服务器的HA服务启动,已创建心跳链路,已创
8、建资源;NT1为Active服务器,NT2存在问题;,RoseHA软件的配置,Windows 平台17 替换IP地址功能;,RoseHA软件的配置,Windows 平台18 HostID License的输入;,RoseHA软件的配置,Linux/SCO平台1 设定RoseHA管理口令(两台服务器均要设定); #/opt/roseha/bin/NewPass 根据提示输入用户名以及口令; 这个设置是设置RoseHA的安全管理,与操作系统的用户、口令无关; 修改口令可以使用#/opt/roseha/bin/SetPass来实现,注意命令的大小写;,RoseHA软件的配置,Linux/SCO平台2
9、 启动RoseHA软件; #/opt/roseha/bin/roseha start(Linux平台) #/opt/roseha/bin/S999roseha start(SCO平台) 启动RoseHA字符管理界面; #/opt/roseha/bin/hacon,RoseHA软件的配置,Linux/SCO平台3,选择Tools-Connect,根据提示输入刚刚设定的用户名和口令;,RoseHA软件的配置,Linux/SCO平台3,首先在Tools-License菜单中输入两台服务器的主机名,左侧的为本机,如果已经有正式License,可以输入完毕,试用版的HA软件不用输入其他信息; 两台服务器
10、分别设定;,RoseHA软件的配置,Linux/SCO平台4,在PrivateNet-Create RS232菜单中选择两台服务器所使用的串口; 两台服务器要分别创建心跳;,创建串口心跳,RoseHA软件的配置,Linux/SCO平台5 Linux平台COM端口设备名称; ttys1 com1 ttys2 com2 SCO Unixware平台COM端口设备名称; /dev/term/00 com1 /dev/term/01 com2 SCO Openserver平台COM端口设备名称; /dev/tty1a com1 /dev/tty2a com2,RoseHA软件的配置,Linux/SCO
11、平台6,在PrivateNet-Create Socket菜单中选择本地服务器所使用的私网IP地址,同时输入远程服务器的私网IP地址; 两台服务器要分别创建心跳;,创建私网心跳,RoseHA软件的配置,Linux/SCO平台7 同步网络配置信息; Tools-Network-Autoget;,RoseHA软件的配置,Linux/SCO平台7 创建服务; Services-Create;,RoseHA软件的配置,Linux/SCO平台8,选择网卡,服务类别,虚拟IP,卷设置,脚本设置,Failback功能设置,RoseHA软件的配置,Linux/SCO平台9 HostID的获得; #/opt/r
12、oseha/bin/hostid,RoseHA软件的配置,Linux/SCO平台10 替换IP地址功能; 在两台服务器中创建replaceip文件; #cd /opt/roseha/etc #touch replaceip 主要用于服务器跨防火墙、路由通讯;,RoseHA软件的配置,Linux/SCO平台11 网卡状态监控方式1; 在SCO Unixware平台; 测试或安装时需要网络中有除了两台HA服务器以外的第三个与这两台服务器在同一网段的主机或网络设备; 默认采用alllan方式监控; /opt/roseha/etc/alllan,RoseHA软件的配置,Linux/SCO平台12 网卡
13、状态监控方式2; 在linux平台; 默认通过操作系统对网卡状态的反馈进行监控; 如果结果反馈不准确,可以采用alllan方式监控; #touch /opt/roseha/etc/alllan 在SCO Openserver平台; 默认通过操作系统对网卡状态的反馈进行监控; 如果结果反馈不准确,可以采用alllan方式监控; #touch /opt/roseha/etc/alllan,RoseHA软件的配置,Linux/SCO平台13 配置文件config.ha; /opt/roseha/etc/ 如实记录所有HA的配置信息; 可以用于备份、恢复HA配置; HA系统运行状态文件state.ha
14、; /opt/roseha/etc/ HA系统初始判断、及时更新当前主机的运行状况; 0:Active; 1:Standby; 6:OutAct; 7:OutStd;,RoseHA软件的配置,Linux/SCO平台14 RoseHA的四个进程; Hamond:监控进程; Hasysd:系统进程; Hasvrd:服务进程; Hachkd:磁盘监控进程;,RoseHA软件的常见问题及解决方案,RoseHA软件的常见问题及解决方案,Windows 平台1 磁盘资源带入(Bring-In)后,当前服务器立刻重新启动; 检测磁盘资源的可用性、IO是否正常; 一台服务器重启时,另外一台服务器也会跟着重新启
15、动; 通常出现在Windows平台光纤架构的HA环境中,两台服务器与磁盘阵列处在一个FC-AL中,一台服务器重启触发Lip,导致另外一台服务器访问磁盘超时; 在管理界面中,在options菜单的“Cluster Operation Preferences”设置中,将“Check DiskvTimeout”的参数值适当延长;,RoseHA软件的常见问题及解决方案,Windows 平台2 Windows中,初始配置HA,系统提示“Can not get Remote registry”; Windows2003操作系统的安全策略中默认要求本地必须设置口令才能被网络中其它服务器访问,因此需要为操作系
16、统设定口令; 两台服务器的超级用户口令不一致; “Remote Procedure Call (RPC)”服务被禁用或没有启动; 安装过程中输入的远程服务器名称有误; “Remote Registry”服务被禁用或没有启动;,RoseHA软件的常见问题及解决方案,Windows 平台3 Windows中,在配置心跳时,无法找到远程服务器的心跳IP地址;使用本地注册表连接远程服务器注册表;“Remote Registry”服务被禁用或没有启动;,RoseHA软件的常见问题及解决方案,Linux平台1 Hasvrd无法启动; 手工执行发现系统提示无法找到“libstdc+-libc6.2-2.so
17、.3 “链接库; 创建如下连接: #cd /usr/lib # ln s libstdc+-libc6.1-2.so.3 libstdc+-libc6.2-2.so.3 挂接上磁盘阵列后(尚未运行其它应用程序),两台服务器频繁重启; 检查磁盘阵列的I/O是否正常;,RoseHA软件的常见问题及解决方案,Linux平台2 在服务中添加数据库等应用程序后,两台服务器频繁切换; 检查应用程序是否能够正常启动; 检查service配置文件中对于数据库的实例名称设定是否正确; 检查监控脚本是否有问题;,RoseHA软件的常见问题及解决方案,SCO平台 在SCO Openserver5.0.6中安装HA后,HA无法正常启动; 为操作系统安装“Compact.pkg”软件包;,Thanks!,