1、HP UNIX 系统管理及 CLUSTER一 重要概念在 hpux 下执行以下命令,就会出现以下结果#ioscan -fClass I H/W Path Driver S/W State H/W Type Description=bc 0 root CLAIMED BUS_NEXUS bc 1 8 ccio CLAIMED BUS_NEXUS I/O Adaptertarget 0 8/4.4 tgt CLAIMED DEVICE disk 5 8/4.4.0 sdisk CLAIMED DEVICE SEAGATE ST39173WCtarget 1 8/4.5 tgt CLAIMED DE
2、VICE disk 6 8/4.5.0 sdisk CLAIMED DEVICE SEAGATE ST39173WCtarget 2 8/4.6 tgt CLAIMED DEVICE ctl 0 8/4.6.0 sctl CLAIMED DEVICE Initiatorba 0 8/8 GSCtoPCI CLAIMED BUS_NEXUS GSCtoPCI Bridgelan 0 8/8/1/0 btlan4 CLAIMED INTERFACE PCI Ethernet (10110009)target 3 8/12.6 tgt CLAIMED DEVICE ctl 1 8/12.6.0 sc
3、tl CLAIMED DEVICE Initiatorba 1 8/16 bus_adapter CLAIMED BUS_NEXUS Core I/O Adapterclass: SCSI 设备类型, 如 disk,printer,tapeInstance: 设备编号,属于同一 class 的设备编号是唯一的.设备的命名规则,如有个硬盘为/dev/dsk/c0t4d0c0: c指 disk,tape,cdrom 等外设, 0指 instance 号t4: t 指 SCSI target 地址,即设备跳线的位置. 如用 ioscan 看 diskdisk 6 8/4.5.0 sdisk CLAI
4、MED DEVICE SEAGATE ST39173WC则 SCSI target addr 为:5d0: 设备编号,即 SCSI LUN 号, 为 H/W PATH 的最后一位,即0每一个硬盘和 cdrom 都有两个设备文件block file in /dev/dsk character file in /dev/rdsk配置磁盘设备磁盘分区可用于: 文件系统 file system虚拟内存 swap space裸数据 raw data (直接被应用程序访问的数据,如数据库)启动区 boot areaUID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专
5、业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 基于 TR069 协议实现 IPTV 盒端管理 图 liuguo_hello LVM 磁盘管理Physical Volumes(PV):一个硬盘可看作一个 pv, 在创建了相应的数据结构后,可被加入 vg如:/dev/dsk/c0t5d0, /dev/rdsk/c0t5d0Volume Groups(VG)一个 vg 由一个或几个 PV 组成, 它通常命名为/dev/vg00,/dev/vg01, vg00 是 boot vg,应包含启动硬盘及操作系统,其他的 vg 可做应用
6、 .如: /dev/vg01 , /dev/vg01/groupLogical Volumes(LV)一个 Vg 的磁盘空间可分配给一个或几个 lv, 一个 lv 相当与一个逻辑分区,能够包含 file system,swap area,raw partition,一个 LV 包含一个 file system 或 raw partition如: /dev/vg01/lvol1 , /dev/vg01/rlvol1Major and Minor Number所有的 lv,vg 设备文件都有主次设备号所有 lvm 设备文件的主设备号为 64次设备号(如 0x010002)的头两位为 vg 号, 即
7、 vg01;后两位为 lv,既 lvol2lvm 的最小分配单位是”extent ”, pv 由”Physical Extent(PE)”组成,lv 由”Logical Extent(LE)”组成, 缺省的 extent 大小为 4MBHP 文件系统有 HFS,JFS,NFS,CDFS 等类型HFS(High Performance File System)是 HP 标准的 Unix 文件系统,操作系统必须用 HFS 类型,所以/stand是 HFS 类型JFS(Journaled File System)也称 VxFS(Veritas File System),是 HP 缺省的文件系统,能提
8、供更快的系统恢复及在线备份.NFS(Network File System)以 clent/server 方式为 HFS,JFS 系统提供透明的网络访问通道.NFS server 为所有可登陆的主机提供一虚拟目录,NFS client 通过 mount 来访问这个目录,如同本地目录一样.CDFS(CD-ROM File System)只读二 磁盘管理的常见命令1. 观察磁盘信息#ioscan funC disk 2. PV 操作#pvcreate f /dev/rdsk/c0t3d0 /在硬盘 c0t3d0 上创建 pv#pvdisplay v /dev/dsk/c0t3d0 /显示硬盘 c0
9、t3d0 的 pv 信息3 VG 操作#mkdir /dev/vg01 /创建 vg01 目录#mknod /dev/vg01/group c 64 0x010000 /生成空的 vg01#vgcreate vg01 /dev/dsk/c0t3d0 /dev/dsk/c0t4d0 /将两硬盘加入 vg01#vgdisplay v vg01 /显示 vg01 信息#vgchange a n(y) vg01 /激活或去激活 vg014 LV 操作#lvcreate -L 16 -n pyhtest vg01 /在 vg01 上创建 16MB 的文件系统 pyhtest#lvdisplay v /d
10、ev/vg01/pyhtest /显示 LV 上 pyhtest 的信息#lvextend L 32 /dev/vg01/pyhtest /dev/dk/c0t4d0 /扩展 lv5 文件系统操作# newfs F hfs /dev/vg01/rpyhtest2 /创建新的文件系统,类型为 hfs# newfs F vxfs o largefiles /dev/vg01/rpyhtest /创建新的文件系统,类型为 vxfs, 文件系统中文件最大可达到 128GB,如无-o largefiles,则文件最大为 2GB#mkdir /pyhtest /创建文件系统影射的目录#mount /dev
11、/vg01/pyhtest /pyhtest /使文件系统正常工作#mount v /显示所有已 mount 的文件系统#bdf /显示所有已 mount 的文件系统#fstyp /dev/vg01/rpyhtest /显示文件系统 pyhtest 的类型#umount /dev/vg01/pyhtest /卸载文件系统 pyhtest#umount a /卸载所有的文件系统# fuser u /dev/vg01/pyhtest /显示正在使用 pyhtest 的用户#fsck F vxfs /dev/vg01/rpyhtest /检查并修复文件系统 ,文件系统必须在 umount 状态# d
12、u sk /pyhtest/* /显示 pyhtest 的使用情况#extendfs F vxfs /dev/vg01/rpyhtest (扩展文件系统,前提是/dev/vg01/pyhtest 已用 lvextended 扩展过,pyhtest 是在 umount 状态)三 IP 管理常用命令1. /etc/rc.config.d/netconf 中有本机 ip 及路由信息2. #ifconfig lan0:0 168.1.1.1 netmask up /配置 IP 地址3. #route add default 168.1.1.2 1 /配置缺省路由4. #route add net 16
13、8.1.1 168.1.1.2 1 /配置指定路由5. # netstat -* /显示网络信息6.#linkloop MAC 地址(如 0x0060b007c179) /测试链路层是否 ok7 #lanadmin /网卡的管理工具8 #arp a /显示 arp 表9 #nslookup hostname / 显示对应的 IP 地址10 /etc/inetd.conf 此文件定义系统内部的服务进程11 /var/adm/inetd.sec 此文件定义各种服务的受限表四 HP cluster 的硬件配置及使用指南(一)开机关机步骤HP cluster 基本的硬件配置是:两台 hp9000 小型
14、机,一台磁盘柜,磁盘柜可以是硬盘镜像,也可以是 AutoRaid,小型机的基本网络配置是每台机器三块网卡。在配置时,第一,二两 UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 通信世界周刊:2011 年中国通信产业十大关键词 liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-144# 大 中 小 发表于 2007-8-21 15:18 只看该作者 个人资料 个人空间 发短消息 加为好友 块网
15、卡配置 IP 地址,但第三块网卡不配 IP 地址。另外,网络连接需用两台 HUB,第一块网卡 lan0 之直连,第二块网卡 lan1 接在第一个 HUB 上,第三块网卡接在第二个 HUB 上,两台 HUB 直连。例:hp9000/1 三块网卡 lan0: 168.1.7.102 (自左至右 lan2,lan1,lan0) lan1: 195.160.131.133 lan2:nonehp9000/2 三块网卡 lan0: 168.1.7.101 (自左至右 lan0,lan1,lan2)lan1: 195.160.130.133 lan2:none漂浮 IP : 195.160.129.133
16、 (二)双机配置文件和操作维护1. 启动 Cluster 以 root 用户登录 键入 cmruncl 等待 10 秒,Cluster 就绪2关闭 Cluster 以 root 用户登录 键入 cmhaltcl f 等待 10 秒, Cluster 关闭3查看 Cluster 运行状态以 root 用户登录 键入 cmviewcl v Cluster 健康与否主要看 NODE 的状态,若为 up,则运行正常。若为 down 则节点未处于 Cluster 中。应用程序运行情况主要看当前的 zxin10pkg 运行状态(STATE),若为 running,则程序运行正常。若为 halting ,则
17、程序处于非运行状态。4 应用程序 zxin10pkg 的切换. 现行的 Cluster 配置中,hp2 为主机,hp1 为备机。UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 基于 PIC18F452 的测频仪设计图 liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-145# 大 中 小 发表于 2007-8-21 15:20 只看该作者 个人资料 个人空间 发短消息 加为好友 Hp1 hp
18、2 : hp1 的主机上,键入: cmmodpkg e n hp2 n hp1v zxin10pkg Hp2 hp1 : hp2 的主机上,键入: su zxin10 -c superstop 5. 不影响程序正常运行的情况下,进行系统维护。( 以 hp1 为例)(1). 查看 Cluster 运行状态,确定 zxin10pkg 运行的主机。1). 若 zxin10pkg 运行在 hp1 上,则应首先将 zxin10pkg 切换至 hp2 上。步骤如下:cmmodpkg e n hp2 v zxin10pkg 等待 20 秒 在 hp1 的终端上,键入 cmhaltnode hp1 键入 sh
19、utdown hy 0 等待 20 秒,关闭系统电源。2). 若 zxin10pkg 运行在 hp2 上,步骤如下:在 hp1 的终端上,键入 cmhaltnode hp1 键入 shutdown hy 0 等待 20 秒,关闭系统电源。6. 不影响程序正常运行的情况下,进行版本更新。(1). 查看 Cluster 运行状态,确定 zxin10pkg 运行的主机。在另外一台主机上执行如下步骤:将版本源文件拷入 /home/zxin10/src 目录下。 在/home/zxin10 目录下,键入 make Install 打包:tar cvf zxin10.tar * 把包拷入另一台主机( 假定
20、为 hp2): rcp zxin10.tar hp2:/home/zxin10 (2). 在 zxin10pkg 运行的主机上,首先将 zxin10pkg 切换到另一台主机上,然后在本机上执行如下步骤: tar xvf zxin10.tar 这样在两台主机上完成了版本的更新。五HP 服务器使用说明(一)开机关机步骤1. 关机。 以 root 用户登录 (user:root passwd: root) 关闭 Cluster ,键入 cmhaltcl f 键入shutdown hy 0 等待 20 秒 关闭系统电源2开机。 打开系统电源 等待 7 分钟左右,系统就绪UID177127 帖子 654
21、 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 专家称假宽带说法不符事实:我国网速中等偏快图 liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-146# 大 中 小 发表于 2007-8-21 15:20 只看该作者 个人资料 个人空间 发短消息 加为好友 (二)磁带机的安装关闭系统电源 将主机的 SCSI 口( 硬件地址为 0/0/1/0)与磁带机相联 打开电源,启动系统 以root 用户登录 键入:insf -e (两
22、台机器作相同的操作)(三)系统备份与恢复策略1. 系统备份: 将磁带放入磁带机中 以 root 用户登录 键入: /opt/ignite/bin/make_recovery -A v 等待 1 个小时左右,系统备份完毕。 取出磁带,贴上标签,妥善保管。另一台机器,步骤相同。2. 系统恢复:万一系统崩溃,则执行如下的恢复步骤:将原先备份的磁带插入 重新启动系统,待系统出现“ to continue , press any key .” 时,按任意键。 键入 sea 系统搜索完启动路径后,找到 Device Type 列为 Sequential access media 的那一行对应的 Path
23、# 列。 键入 bo P# (为对应的启动路径) 系统提示,键入 N ,系统将完成整个系统的恢复工作。(四)路由配置。编辑/etc/rc.config.d/netconf 文件,将与 ROUTE 相关的行改为如下格式:(去掉号)ROUTE_DESTINATION0=defaultROUTE_MASK0=“ROUTE_GATEWAY0=路由器的网关地址ROUTE_COUNT0=1ROUTE_ARGS0=“编辑/etc/rc.config.d/netconf 文件,将与 ROUTE 相关的行改为如下格式:(去掉号)ROUTE_DESTINATION0=defaultROUTE_MASK0=“ROU
24、TE_GATEWAY0=路由器的网关地址ROUTE_COUNT0=1ROUTE_ARGS0=“UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 电信广电业务收入相差 20 倍 三网融合进程难定 liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-147# 大 中 小 发表于 2007-8-21 15:21 只看该作者 个人资料 个人空间 发短消息 加为好友 六日常维护命令1.1 检查硬盘的使用情
25、况检查硬盘的使用情况使用 hp-ux 命令:bdfHP 服务器采用卷组和逻辑卷对磁盘空间实行管理。一个卷组可以包含若干个物理硬盘,每个物理硬盘只能属于一个卷组,逻辑卷是系统从卷组中分配给用户使用的逻辑空间。对于用户创建的每个逻辑卷,系统生成两个设备文件,一个是字符型设备,另一个是块设备。对于数据库设备一般使用字符型设备,而对于一般的文件系统则采用块设备。HP Unix 系统安装完成后,会生成几个缺省的文件系统,这些文件系统可以用命令 bdf 查看,典型情况如下所示:bdf 执行时会如下显示:Filesystem kbytes used avail %used Mounted on/dev/vg
26、00/lvol3 143360 54783 83060 40% /dev/vg00/lvol1 83733 35875 39484 48% /stand/dev/vg00/lvol8 999424 529678 441045 55% /var/dev/vg00/lvol7 1130496 540665 552998 49% /usr/dev/vg00/lvol4 65536 1364 60223 2% /tmp/dev/vg00/lvol6 532480 328635 191153 63% /opt/dev/vg00/lvol5 3145728 646623 2342971 22% /home
27、/dev/vgsybase/sybdev44194304 53930 3881646 1% /data其中,各域的具体含义如下:Filesystem :文件系统名称。Kbytes:文件系统的大小。used :已经使用的空间。avail:还剩余的空间。%used :已经使用了的空间占所有空间的百分比。Mounted on:文件系统的 mount 点。如果某一个文件系统的%used 已达 80%以上,那么必须要干预一下,首先看一下是否是系统产生了什么特大的文件。可以采用以下的命令查找大于 10M 的文件。find / -size +20480 print 一般来讲,这样的文件也可能是日志文件,因此
28、可在 root 的根目录下执行命令 find . name *.log print,找出这些日志,然后逐个查看这些日志。如果确是文件系统快满了,那么看一看是否能把文件系统扩一扩。UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 电信业市场开放是趋势 顶层设计重在创新监管 liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-148# 大 中 小 发表于 2007-8-21 15:21 只看该作者
29、个人资料 个人空间 发短消息 加为好友 1.1 检查 cpu 的占用率检查 cpu 的占用率使用 hp-ux 命令:sar t n 其中,t 指时间间隔,n 指输出次数。例如执行命令 sar 1 10 时会如下显示 :HP-UX cyscp11 B.11.00 U 9000/800 08/24/00HP-UX cyscp11 B.11.00 U 9000/800 08/24/0009:30:41 %usr %sys %wio %idle09:30:42 0 0 0 10009:30:43 0 3 0 9709:30:44 0 0 0 10009:30:45 3 6 3 8809:30:46 1
30、 0 1 9809:30:47 0 0 0 10009:30:48 1 2 0 9709:30:49 0 0 8 9209:30:50 4 4 0 9209:30:51 0 1 0 99Average 1 2 1 96主要看%idle 的值,如果%idle 的值小于 20,则说明系统已经很忙了,看一看是否有什么进程在死循环做什么事情,或者数据库正在做什么特别大的任务等。如果 cpu 占用率一直居高不下,那么系统就很危险了,如果是短时的,一般没什么问题。1.2 检查数据库的占用情况检查数据库的占用情况使用客户端比较方便,具体的操作方式如下:Start-rograms-Sybase-Sybase
31、Central 就进入 sybase 控制界面。在左框中应该有zx192_160_3_133 的 server 名,如果没有这样的 server 名,请使用 dsedit 加入 server 名。如下图所示:UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 通信世界周刊:电信业三大领域转型思考 liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-149# 大 中 小 发表于 2007-8-21
32、15:22 只看该作者 个人资料 个人空间 发短消息 加为好友 图一然后单击 zx192_160_3_133,就会出现一个登录界面。这时可用 sa 用户登录。下面按以下顺序执行:zx192_160_3_133-databases,鼠标点到各数据库上,右击鼠标,点中 Properties,就会出现以下界面(例如点击 zxinsys_01):UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP 汉王科技遭立案稽查 有观点称涉嫌内幕交易 liu
33、guo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-1410# 大 中 小 发表于 2007-8-21 15:22 只看该作者 个人资料 个人空间 发短消息 加为好友 图二然后点中 Usage,就会出现以下界面:图三UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-1411# 大 中 小 发表于 2007-8-
34、21 15:23 只看该作者 个人资料 个人空间 发短消息 加为好友 Total allocated 是数据库的总空间,Total free 是数据库的剩余空间。如果数据库的剩余空间小于 20M,就要考虑给数据库扩空间了。注意,扩空间时必须在系统比较闲时,比如凌晨 4,5 点时。扩空间使用的 sql 命令为:Alter database database_name on database_device=size 例如 zxinsys_01 库为 500M,想把它扩到 700M,只需执行命令alter database zxinsys_01 on zxinconfig=700go1.1 检查数据
35、库日志的占用情况检查数据库的占用情况使用客户端比较方便,具体的操作方式如下:Start-rograms-Sybase-Sybase Central 就进入 sybase 控制界面。在左框中应该有zx192_160_3_133 的 server 名,如果没有这样的 server 名,请使用 dsedit 加入 server 名。如图一所示。然后单击 zx192_160_3_133,就会出现一个登录界面。这时可用 sa 用户登录。下面按以下顺序执行:zx192_160_3_133-databases,鼠标点到各数据库上,右击鼠标,点中 Properties,就会出现图二所示的界面(例如点击 zxi
36、nsys_01):然后点中 Transaction Log,就会出现以下界面:UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料TOP liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-1412# 大 中 小 发表于 2007-8-21 15:24 只看该作者 个人资料 个人空间 发短消息 加为好友 图四然后点击 Properties,就会有下面的界面:图五在这里,Total space 表示的是日志
37、空间的大小,Used 是已用掉的日志空间的大小。当 used 的大小已接近 Total space 的大小时,必须要进行干预,否则后果不堪设想。干预的方式是把日志干掉,也就是 truncate log,例如要把 zxinsys_01 的日志干掉,就输入以下命令:dump tran zxinsys_01 with no_log注:sybase 的客户端工具必须熟练掌握,否则出现问题将会束手无策。UID177127 帖子 654 精华 0 经验 1734 分贝 0 家园币 22758 专业值 884 在线时间 107 小时 注册时间 2007-8-14 最后登录 2011-12-21 查看详细资料
38、TOP liuguo_hello 军衔等级:中尉专业等级:高级技术员文章:654注册:2007-8-1413# 大 中 小 发表于 2007-8-21 15:24 只看该作者 个人资料 个人空间 发短消息 加为好友 1.1 检查任务执行情况在主机上用 zxin10 用户登录,到/home/zxin10/task 目录下,打开 result 文件(vi result),检查昨天的任务执行情况。如果 result 文件中有不成功的记录,就必须要查看一下 sql 脚本文件是否对头,和查看一下数据库是否正常。1.2 检查 cluster 运行情况在主机上用 root 用户登录,执行命令 cmviewcl -v 可以观察到 cluster 的状况。如果显示的情况如“SCP1 上 cluster 配置表”或“SMP 上 cluster 配置表”那样,就说明是没有问题的,否则,则说明 cluster 系统有问题。具体的说明请参考 MC/ServiceGuard 手册。