收藏 分享(赏)

AIX_5.3+hacmp5.3双机互备配置.pptx

上传人:hskm5268 文档编号:5813895 上传时间:2019-03-18 格式:PPTX 页数:30 大小:533.54KB
下载 相关 举报
AIX_5.3+hacmp5.3双机互备配置.pptx_第1页
第1页 / 共30页
AIX_5.3+hacmp5.3双机互备配置.pptx_第2页
第2页 / 共30页
AIX_5.3+hacmp5.3双机互备配置.pptx_第3页
第3页 / 共30页
AIX_5.3+hacmp5.3双机互备配置.pptx_第4页
第4页 / 共30页
AIX_5.3+hacmp5.3双机互备配置.pptx_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、AIX_5.3+hacmp5.3双机互备配置,概述,HACMP 是High Availability Cluster Multi-Processing 的缩写。HACMP 是IBM 公司在P 系列AIX 操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP 是利用网络来侦测主机及网卡的状况,搭配AIX 所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作; 若是主机故障还切换至备份机上继续应用系统的运行。HACMP提供两种节点故障的处理方式: 磁盘接管IP地址接管,2,工作原理,作为双机系统的两

2、台服务器同时运行HACMP 软件;两台服务器的备份方式有三种: 一台服务器运行应用,另外一台服务器做为备份 两台服务器除正常运行本机的应用外,同时又作为对方的备份主机; 两台服务器同时运行相同的应用,需要数据库的支持。两台主机系统在整个运行过程中,通过“心跳线“相互监测对方的运行情况(包括系统的软硬件运行、网络通讯和应用运行情况等);一旦发现对方主机的运行不正常(出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP 地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行; 应用和资源的接管过程由H

3、ACMP 软件自动完成,无需人工干预;当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机(备份机)上运行。,心跳设置,TCP/IP网络 优点:要求低,不需要任何额外硬件或软件,即可实现。 缺点:占用ip 地址,不能避免由于TCP/IP 的软件问题导致HACMP 崩 溃,系统不可用。串口网络 优点:真正实现高可用性,不占用IP 地址。 缺点:需要硬件支持,对于p5 机器,需要新增异步卡,而中低端的机器的 插槽有限。,磁盘心跳 优点:不占用插槽,磁盘总线上的心跳网络能够在TCP/IP 网络资源有限的情 况下提供额外的HACMP 节点间的通信手段,并且能够防止HACMP 节点

4、之间由于TCP/IP 软件出现问题而无法相互通信。 缺点:需要操作系统和存储支持,如使用增强型卷组,此外对于I/O 读写的应用,也需要慎用。 正如IBM 红皮书所说,条件许可的情况下,强烈推荐使用串口网络,其次是磁盘心跳。,安装前的准备工作,本PPT所提及的 node1 和 node2 分别表示安装 HACMP 的两台 p5 服务器,本例中采用 磁盘方式做心跳,共享资源为共享磁盘,运行的服务为一个简单的写入脚本。 1.配置两台机器的ip地址Smit tcpip设置一台机器的两个网卡ip地址为:192.168.1.150和192.168.8.101给eth0网卡添加一个服务网址即虚拟ipifco

5、nfig en0 192.168.9.101 netmask 255.255.255.0 alias(将该命令添加到/etc/系统重启后虚拟ip也生效)另一台机器也同样配置(192.168.1.99 192.168.8.102 192.168.9.102) 2.配置/etc/hosts文件(两台机器相同),3.添加心跳磁盘 设置两块网络共享磁盘或磁盘阵列进行添加Smit- devices- iscsi-iscsi targei device parameters in ODM- Add an iSCSI Target Device in ODM- Add a Statically Discov

6、ered iSCSI Target Device in ODM,4.添加共享磁盘 同样步骤添加第二块磁盘 添加后需要设置该磁盘为共享数据存储区prodvg mkvg -y pdavg hdisk4mklv -y ptlv pdavg 128crfs -v jfs -m /database -d ptlvmount /databasechvg an pdavg最后要在这台机器执行:varyoffvg prodvg 来停止这个共享卷组。 换到另一台机器,用#smitty importvg 来导入这个共享卷组,输入卷组的名字:pdavg ;选择硬盘:hdisk13(因为在erp 这台机器有多个硬盘,

7、看PVID 号得出hdisk13 是共享的数据盘)导入pdavg 后,我们在这台机器也要改变VG 的属性。chvg an pdavg 要把重启系统后自动激活卷组改为NO。varyoffvg pdavg,安装系统补丁,AIX5.3系统安装时只安装一些基本的软件包(fileset),而有些软件包是用户经常用到的但没有被安装。建议用户在安装完AIX5.3系统后再安装以下一些软件包。 bos.data bos.dosutil bos.perf bos.diag bos.dlc perfagent.tools bos.pmapi bos.mh pat bos.adt bos.sysmgt rsct.b

8、asic rsct.core pat bos.clvm.enh将AIX操作系统的第一张CD插入CD-ROM 驱动器,使用如下命令挂载mount v cdrfs o ro /dev/cd0 /mntsmitty install_all,在Input device / directory for software 选项中输入/mnt,按F4将上述软件包选上安装,将ACCEPT new license agreements?选择为yes安装安装需要的系统补丁 (530000需要530008不需要,可以根据安装hacmp的提示信息进行补丁安装),8,安装HACMP,将HACMP V5.4 光盘放入光驱

9、中进行HACMP 的软件安装 安装HACMP 安装盘中的文件,按F7 将下面的软件包选择:cluster .adt .escluster .es;cluster .es .cfs;cluster .es . cspoc;cluster .es .plugins;cluster .license;cluster . man .enus.es 选完后按回车返回至安装界面,然后将是否同意新许可改为YES,并回车开始安装软件。 安装后对hacmp进行升级,查看/etc/inittab文件,分别查看2个机器上的/etc/inittab文件的最后几行是否包含以下部分: clcomdES:2:once:st

10、artsrc -s clcomdES /dev/console 2&1 主要用于启动Cluster Communications Daemon (clcomd),这也是在配置HACMP时,运行自动发现过程所需要的。,10,编辑环境变量,两台机器都要做 /etc/environmentPATH=/usr/bin:/etc:/usr/sbin:/usr/ucb:/usr/bin/X11:/sbin:/usr/java14/jre/bin:/usr/java14/bin:/usr/sbin/rsct/bin TZ=BEIST-8 LANG=en_US LOCPATH=/usr/lib/nls/loc

11、 NLSPATH=/usr/lib/nls/msg/%L/%N:/usr/lib/nls/msg/%L/%N.cat LC_FASTMSG=true修改 PATH 环境变量:将 /usr/es/sbin/cluster 和 /usr/es/sbin/cluster/utilities 加入 PATH 环境变量中,这样可以在命令行中使用 HACMP 自带的工具。,11,建立集群,smitty hacmp-Extended Configuration-Extended Topology Configuration -Configure an HACMP Cluster-Add/Change/Sho

12、w an HACMP ClusterAdd/Change/Show an HACMP ClusterEntry Fields* Cluster Name test_cluster,12,添加节点,smitty hacmp-Extended Configuration-Extended Topology Configuration-Configure HACMP Nodes-Add a Node to the HACMP ClusterAdd a Node to the HACMP Cluster Entry FieldsNode Name node1Communication Path to

13、Node boot1 以相同方法添加第二个节点node2。如果有多个节点,以此类推。,13,创建并发卷组做磁盘心跳,14,smit hacmp-System Management (C-SPOC)- HACMP Concurrent Logical Volume Management- Concurrent Volume Groups-Create a Concurrent Volume Group-Esc+7选上两个节点(心跳磁盘需将共享磁盘所在的卷组设为 concurrent 模式),测试并行卷组通讯,15,收集 HACMP 相关信息,smitty hacmp-Extended Confi

14、guration-Discover HACMP-related Information from Configured Nodes,16,添加网络,HACMP 的网络分为 Discovered network 和 Pre-defined network 两种,如果之前有收集 HACMP 的相关信息,可选 Discovered network;否则,选择 Pre-defined network。此处可以根据此集群采用的心跳方式选择相应的网络,包括 ether network、diskhb network 和 rs232 network。本例中我们采用磁盘方式做心跳。 smitty hacmp-E

15、xtended Configuration-Extended Topology Configuration-Configure HACMP Networks-Add a Network to the HACMP Cluster -Add an IP-Based Network to the HACMP ClusterEntry Fields*Network Name net_ether_01* Network Type ether* Netmask 255.255.255.0 +* Enable IP Address Takeover via IP Aliases no +IP Address

16、 Offset for Heartbeating over IP Aliases ,17,添加通信接口,smitty hacmp-Extended Configuration-Extended Topology Configuration-Configure HACMP Communication -Interfaces/Devices-Add Communication Interfaces/Devices-Add Discovered Communication Interface and Devices-Communication Interfaces-net_ether_01 (192

17、.168.1.0/24 192.168.8.0/24)用Esc+7选上boot1 stdby1 boot2 stdby2,18,配置磁盘心跳网络,smit hacmp-Extended Configuration-Extended Topology Configuration-Configure HACMP Networks-Configure HACMP Communication Interfaces/Devices- Add Communication Interfaces/Devices- Add Discovered Communication Interface and Devic

18、es - Communication devices-Esc+7选两个节点hdisk10,19,编辑起停脚本,启动脚本/app/dbstart.shecho start/database/startdate/database/starthostname/data/start停止脚本/app/dbstop.shecho stop/database/stopdate/database/stophostname/database/stop,20,添加应用服务,smitty hacmp-Extended Configuration-Extended Resource Configuration-HAC

19、MP Extended Resources Configuration-Configure HACMP Applications-Configure HACMP Application Servers-Add an Application ServerEntry Fields*Server Name test_app* Start scrpt /app/dbstart.sh* Stop scrpt /app/dbstop.sh Application Monitor Name(s) + 此应用服务的启动和停止脚本就是之前在做准备工作时创建的那两个脚本。,21,添加服务 IP,smitty ha

20、cmp-Extended Configuration-Extended Resource Configuration-HACMP Extended Resources Configuration-Configure HACMP Service IP Labels/Addresses-Add a Service IP Label/Address-Configurable on Multiple NodesAdd a Service IP Label/Address configurable on Multiple Nodes (extended)Entry FieldsIP Label/Addr

21、ess p1_svc1Network Name net_ether_01Alternate Hardware Address to accompany IP Label/Address 同样添加第二个节点的服务ipp2_svc1,22,添加资源组,smitty hacmp-Extended Configuration-Extended Resource Configuration-HACMP Extended Resource Group Configuration-Add a Resource GroupAdd a Resource Group (extended)Entry FieldsR

22、esource Group Name test_regParticipating Nodes (Default Node Priority) node1 node2+Startup Policy Online On Home Node O+Fallover Policy Fallover To Next Prio+Fallback Policy Fallback To Higher Pr+,23,更改资源组属性,将服务 IP、应用服务、共享卷组和文件系统都加入到此资源组中 smitty hacmp-Extended Configuration-Extended Resource Configu

23、ration-HACMP Extended Resource Group Configuration-Change/Show Resources and Attributes for a Resource Group,24,同步,验证配置并与集群中的其它节点进行同步:必须保证同步的结果是正确,如果有错误出现,请按照错误提示进行相应调试 smitty hacmp-Extended Configuration-Extended Verification and Synchronization,25,启动hacmp,在启动之前必须执行以下的命令 # snmpv3_ssw -1(两台机器) Smit

24、clstart(将两个节点node1 和node2 都选上)(将第3 项information daemon 改为true) 启动HA后,可在命令行下用tail f /tmp/hacmp.out命令查看HA软件在启动过程中输出的信息,对于排查错误很有帮助。如成功启动完成,用lssrc g cluster查看是否有如下输出: Subsystem Group PID Status clsmuxpdES cluster 516170 activeclstrmgrES cluster 741400 active用lsvg o及ps ef | grep 应用程序名命令查看是否VG、应用都已经启动,26,

25、关闭hacmp,HA软件的关闭使用smitty工具菜单的快捷路径 smitty clstop ,出现如下菜单,默认为now,即立即关闭,在第二项Stop Cluster Service on these nodes选择希望停HA的节点,回车确认。,hacmp启动/关闭的三种模式,Graceful该节点释放资源但其他节点不会接管资源; Gracefulw/takeover该节点释放资源并且其他节点会接管资源; Forcedclustermanage被强行停止(clstmgr进程被杀死),但节点不释放资源,其他节点也不会接管资源。这样,用户就可用根据需要来手工使某个节点离开cluster。要注意的

26、是,节点主动离开cluster与节点down后不得不离开cluster不是一回事。节点down掉后,该节点上的HACMP进程会自动停止,HACMP会自动使资源被接管。而节点被手工设置离开cluster时,是采用上面三种方式的人为使然,则视方式不同而有不同的特定行为。,双机切换测试,ifconfig a 查看server ip 拔掉p1的en0网线serviceip在node1的stdby网卡上 插回p1的en0网线,拔掉p1的en1网线serviceip在p1的boot网卡上 同时拔掉p1的两根网线,四分钟后server ip切换到p2的stdby网卡上可以telnent server ip 用hostname 查看 同时插回p2的两根网线,先smit clstop再用smit clstart启动p1的hacmp,应用会回切到p6508c上的 在host1 上执行halt q , host1 机宕机,切换到host2 机,29,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报