1、1.1 设备巡检服务为了确保广州市工商局存储设备长期、稳定的工作,最大限度和降低系统的运行故障及延长系统设备的使用寿命,为项目组管理人员提供辅助决策的有效数据,维护项目组的服务工程师对广州市工商局存储设备提供定期的巡查及保养服务。项目 IT 设备维护工程师在日常工作中,除了处理日常维护工作以外,由被动服务变主动服务,主动到进行日常巡检巡查服务,通过日常巡检巡查服务排除故障隐患,降低故障率。并通过以往广州市工商局维护数据分析,详细总结广州市工商局存储设备的具体故障情况,并及时对故障多发和高发设备进行预防性巡查。每月的日常巡查主要包括以下内容: 系统运行环境检查、机房温度,系统组件运行情况检查。
2、系统错误日志分析、文件系统空间使用情况检查。 应用系统的优化、数据的整理、常见故障的排除。 检查系统软件补丁情况。 系统软件补丁升级,数据备份与恢复。 服务器、存储设备的除尘处理。设备清洁保养:通过清洁保养服务,最大限度降低设备的故障率,延长设备的使用寿命,同时为广州市工商局数据中心的工作人员提供一个整洁、干净的工作环境。硬件设备运行情况巡检:了解和记录广州市工商局存储设备的最新使用情况(包括新增设备情况、已有设备的维修情况、耗材的使用情况、关键设备的运行情况等) ,检测设备的运行情况,排除故障发生隐患,最大限度的降低存储设备硬件的故障发生率,对一些经常出现故障的设备和关键设备要进行重点的检查
3、。同时对一些已老化或需淘汰的设备进行记录并向项目组进行反映、提出备机建议。系统及软件运行情况巡查:系统的优化、数据的整理、常见故障的排除;服务器病毒的查、杀、防毒软件的定期升级;提供系统软件的升级。系统数据的备份与恢复。时间是每季度一次,范围是服务器和存储设备等此次合同中涉及到的所有的硬件、系统和应用软件,工作内容是进行所有设备和软件的健康检查,目的是详细的查看与解决其存在的故障隐患。首先由我公司的项目经理填写巡检申请表 向广州市工商局提出巡检申请,在批准后 1 到 2 天内,开始巡检,在巡检过程中,按照巡检报告中涉及的项目进行详细的检查,如果在巡检的过程中,遇到需要更换硬件设备的情况,电话通
4、知配件仓库,进行配件更换。如果遇到无法解决的故障问题(如系统或软件的 bug 问题等) ,我司会通知用户的同时,提升服务等级,寻求厂家的技术支持,并最终找到解决方案。在解决故障后,我司工程师会填写现场维护单 、 备件更换记录表 、 BaseLine 信息表 ,在巡检结束后,我司工程师会填写巡检报告 ,并且每季度向广州市工商局提供一次巡检总结报告 。其流程如下:图。 。 。 。 服务器的健康检查 存储设备的健康检查1) 存储系统巡检描述随着设备的使用寿命,以及生产业务信息的增加和不断变化的计算机系统将会危及任何技术环境的稳定性,进而影响用户的业务。我司定期的健康检查可以通过确定性能降低、可用性故
5、障点和安全隐患来保护用户的业务,因此用户可以防患系统故障,提高用户的工作效率。训练有素的工程师将对用户运行操作系统的当前服务器系统状态进行“大图片”快照,在不中断操作的情况下,快速、经济高效地评估用户的主机系统和存储备份系统的环境和应用。采用专业化的基础工具来采集和衡量系统数据,并进行上百次测试,将用户的系统操作与最佳的管理案例进行对比,从而确定最佳的应用方案和最佳运行环境。2) 存储系统巡检主要内容介绍 建立 BASELINE 信息档案搜集主机系统和存储备份系统,在正常运行的情况下的所有软硬件信息,并建立归档 全面而准确的系统评估执行系统健康检查的小组经过了全方位的培训,包括影响系统性能的因
6、素、用于衡量性能的工具、以及可最大限度提高 IT 投资回报的解决方案等。 数据采集基于系统的工具可以在独立或 Cluster 系统上广泛采集数据。金税技术专家可在现场检索数据,也可以在中心处进行远程采集。无论采用哪种方式,都只需要最少的系统资源,而且不必隔离正在进行检测的系统和网络。 数据分析通过上百次自动测试,将所采集的有关系统磁盘性能、I/O 通信、Cluster、文件使用、配置和安全的数据与逾百种最佳管理规则和案例标准进行对比。 标准化系统健康检查报告金税将把用户的系统健康检查结果整理成一篇清晰的文档,并与用户一起进行彻底的评审。总结报告将列出有关系统总体状态,包括配置设置与系统操作的评
7、估,以及有关系统、磁盘性能、I/O 通信、软件版本、可用性和安全性的信息。此外,还提供改进方案和纠正措施的详细建议。 跟进咨询根据保修的服务项目,金税专家将在提交系统健康检查报告之后,为用户提供电话或现场咨询服务,使用户有机会对系统进行全面的技术评审,并对系统健康检查结果进行讨论。我司的系统健康检查可以对广州市工商局主机系统和备份存储系统上的潜在的问题进行一个广泛的深入检查。主机系统发生问题之前,它可以对系统上有关安全性,可管理性以及系统性能进行检查分析,并指出系统潜在的问题以及推荐解决方法。金税的系统健康检查是以一份报表形式呈现于客户面前,金税的技术专家将协助客户分析这份报告并提出应对的措施
8、。 日常管理机制的建立建立良好的维护和管理机制,通常日常的管理工作可以记录系统的低级故障,避免性能问题出现。 升级方案及支持当广州市工商局所用的操作系统有更新的版本出现;或者广州市工商局使用的应用软件需要更新的操作系统支持;或者有更新的硬件部件可以应用到广州市工商局主机系统上时,我司将会及时向广州市工商局做出通知并根据客户的实际情况作出升级的方案,以确保主机系统总是运行在良好的状态。 补丁通知及推荐我司的服务包括向广州市工商局通知适用于他们系统上的补丁并建议怎样对他们的系统下补丁。这样,将使主机系统不断得到性能上的改善。 现场管理指南我们对客户的现场提供专业的指导建议,使客户系统运行更加稳定。
9、印制服务热线电话表,发放到最终用户;装订专业服务指南手册,并亲自送到客户手中;配合客户完成合同外的工作。3) 存储设备的健康检查 备份系统和数据1. HP-UX 操作系统:卷组 vg00这部分内容主要包括一些 HP-UX 用到的文件系统,如/, /opt, /var,/tmp, /usr,/home, /stand 通常这些文件系统位于 vg00 中。备份的方法:1). make_recovery此命令备份整个根盘逻辑卷组,恢复时只需从备份的磁带引导,不需交互即可恢复整个根盘逻辑卷组信息。# make_recovery -A -C2). fbackup# fbackup -0vi / -f /
10、dev/rmt/0m -I /tmp/fbackupfiles/index/full.date +%y%m%d.%H:%M 2 /tmp/fbackupfiles/log/ full.date +%y%m%d.%H:%M2. 系统配置文件对于系统一些关键性的文件或信息需要单独进行备份,这样有利于对系统进行恢复。这些文件或信息包括:1). 系统 Swap 信息swapinfo -t2). 系统文件系统信息bdf3). 系统的 I / O 信息# ioscan -fnCdisk4). /etc/fstab5). 系统逻辑卷配置文件/etc/lvmconf/vg00.conf 、vg01.conf、
11、vg02.conf,这些逻辑卷配置文件可以用命令:vgcfgbackup / vgcfgrestore 生成和恢复3. 应用数据及其他逻辑卷:如 vg01、vg02 等备份的方法:1). tar# tar cvf /dev/rmt/0m /sample将目录/sample 备份至磁带上2). fbackup# fbackup -i /sample -e /sample/except -f /dev/rmt/0m此命令用于备份除了/sample/except 外的/sample 文件系统到磁带机/dev/rmt/0m 上4. 数据库的备份Informix,oracle,sybase 等数据库都有
12、自己的备份工具 ontape,on-Achive,on-Bar,数据库数据的备份可依赖这些工具,或是将数据库用于存放数据的文件系统,逻辑卷用tar,fbackup,dd 等命令作备份。恢复系统和数据1. 用 fbackup / tar 对系统进行备份时1). Install Core-OS2). 恢复 vg00 / vg01 / vg02 的备份内容# frecover -o -r -f /dev/rmt/0m2. 用 make_recovery 对系统进行备份时1). 用磁带 boot system, 恢复 vg00 详见 make_recovery 的恢复方法2). 恢复其它逻辑卷# fr
13、ecover -o -r -f /dev/rmt/0m 系统备份与恢复常用命令fbackup & frecover1. 系统备份命令: fbackup1). fbackup 的常用方式一:A. 进入单用户# shutdown -y 0# /etc/mount -aB. 系统全备份# fbackup -f /dev/rmt/0m -0v i / -I /tmp/sysbk.index-f : 设备文件名 ( such as DDS tape driver)-i : 要包含的目录-e: 不包含的目录-I: 备份内容检索目录-v: 备份内容详细列表-0 :零级备份# fbackup -f /dev/
14、rmt/0m -i / -e /home备份除了目录 /home 的所有目录C. 说明该命令方式对系统当前”mounted”的文件系统进行备份备份级别说明:备份级别有 09 个级别,如果当前系统采用零级备份,当下一次采用 5 级备份时,系统仅将会对有变化的文件进行备份2). fbackup 的常用方式二:# mkdir -p /tmp/fbackupfiles/index# mkdir -p /tmp/fbackupfiles/log# touch /tmp/fbackupfiles/index/full.date +%y%m%d.%H:%MA. 进入单用户# shutdown -y 0# /
15、etc/mount -aB. 对系统进行全备份# fbackup -0vi / -f /dev/rmt/0m -I /tmp/fbackupfiles/index/full.date +%y%m%d.%H:%M 2 /tmp/fbackupfiles/log/ full.date +%y%m%d.%H:%MC. 说明通过该方式可以知道系统备份需要的时间3). fbackup 的常用方式三:A. 进入单用户# shutdown -y 0# /etc/mount -aB. 对系统进行全备份# fbackup -0uv / -f /dev/rmt/0m -g /tmp/fbackupfiles/my
16、graph -I /tmp/fbackupfiles/index/full.date +%y%m%d.%H:%M 2 /tmp/fbackupfiles/log/ full.date +%y%m%d.%H:%MC. 说明文件 mygraph:包含需要备份的目录,格式如下:i /users/datai /home/appe /oracle/sql参数 u:当备份系统成功时,系统将更新 /var/adm/fbackupfiles/dates.4). fbackup 的常用方式四:备份远程系统A. 登录在本地系统时# remsh backup_sysname “ fbackup -f DDS_sys
17、name: /dev/rmt/0m -0v -i / “B. 登录在远程系统时# fbackup -f DDS_sysname: /dev/rmt/0m -0v -i /5). fbackup 的常用方式五:压缩方式备份( 不建议使用、影响系统性能)A. 压缩方式备份# fbackup -0vi /dir -f - | compress | dd of=/dev/rmt/0m obs=10k“” : 指向标准输出B. 查看备份内容# dd if=/dev/rmt/0m ibs=10k | uncompress | frecover -I - -f -2. 系统恢复命令: frecover1).
18、 恢复磁带机上所有内容:A. 进入单用户:# shutdown -y 0# /etc/mount -aB. 恢复数据# frecover -rf /dev/rmt/0m恢复磁带上的所有数据-f: 设备文件名-r: 恢复磁带上的所有数据-I: 将磁带上文件索引存到指定的文件中# frecover -I /tmp/index.txt -f /dev/rmt/0m2). 恢复某一目录:# frecover -xi /directory# frecover -x -i /dir1 -i /dir2# frecover -xoi /dir-o: 覆盖/dir 下已有的、相同名称的文件# frecover
19、 -xvXi /dir-X: 相对与当前目录恢复数据,而不是按绝对路径恢复数据# cd /tmp/local; frecover -xvFi /dir-F: 仅恢复文件,而不恢复到文件的路径例如:# cd /tmp/local# frecover -xvF -i /home/filename恢复结果 /tmp/local/filename 不是 /home/filename3). 从远程磁带机上恢复数据到本地:# frecover -xi /dir -f remote_name : /dev/rmt/0m4). 从本地磁带机上恢复数据到远地系统:# remsh remote_name “fre
20、cover -xi /dir -f local_name: /dev/rmt/0m”tar 命令1. 对系统全备份# tar cvf /dev/rmt/0m /2. 备份某目录# tar cvf /dev/rmt/0m /tmp3. 改变文件的备份路径# tar cvf /dev/rmt/0m -C /tmp .Note : 路径 /tmp 在磁带上的备份路径变为 ./# cd /tmp# tar cvf /dev/rmt/0m ./*4. 恢复数据# tar xvf /dev/rmt/0m (磁带上所有数据)# tar xvf /dev/rmt/0m /tmp ( 恢复目录 /tmp )5.
21、 查看磁带上的数据# tar tvf /dev/rmt/0m4.1.7.3 SAM1. 备份数据# sam- Select “ Backup and Recovery “- Select “ Interactive Backup and Recovery “- Select “ Backup Device “- Select “ Backup Files Interactively “ ( From Action menus )- Select Backup Scope- Select Local File Systems Only ( no NFS )- Select”OK”注意:如果Exi
22、t code=2 ,则备份可能是存在问题的。2). 查看磁带上有哪些文件# frecover -rNsv -f /dev/rmt/0mmake_recovery1. 安装 Ignite-UX application1). 从 HP-UX Application CD-ROM 上安装# swinstall- Select “Mark” A. 1.53 HP-UX Installation Utility( Ignite-ux for 10.20)- Select “Analysis”- Select “Install”2). 从 WebSite 下载并安装http:/ backup starte
23、d on host1: Wed oct 16 15: 10: 09 EAT 1998( Scheduled Backup ) fbackup -0 -u -v -g /etc/sam/br/graphDCAa04366 -I/var/sam/log/br_indext.full-c /etc/sam/br/fbackup_config -d /var/adm/fbackupfiles/dates -f/dev/rmt/c1td0d0BEST 2&1Full backup completed on host1: Wed Oct 16 16:44:01 EAT 1998Exit code=0Sel
24、ect: “Network & System administration”Download: “ignite-ux_10.20.tar”(10.20 为 OS 版本)3). 从硬盘上安装:# cd /tmp# tar xvf /dev/rmt/0m ./ignite-ux_10.20.tar# swinstall -s /tmp/ignite-ux_10.20.tar4). 从磁带上安装:# dd if=/tmp/ignite-ux_10.20.tar of=/dev/rmt/0m bk=2# swinstall -s /dev/rmt/0m2. make_recovery#/opt/ign
25、ite/bin/make_recovery -AprvC -d destination -b boot_destination-A : 指定要备份整个 Root disk / Volume Group-p : 预览备份过程,并不创建 Bootable DDS Tapea 确认 /var/opt/ignite/recovery/mkrec.append 文件b 创建 /var/opt/ignite/recovery/arch.include 文件-r : 使用 -p 选项后,可以用该选项创建 Bootable DDS Tape该选项可以识别 /var/opt/ignite/recovery/ar
26、ch.include 文件-v : 用于显示备份过程的提示信息-d : 指定 DDS 的设备文件名( default: /dev/rmt/0mn )-b :指定系统备份过程中,用到的临时文件( default:/var/tmp/uxinstlf.recovery )该文件大小为 32M,对系统进行 make_recovery 时,要注意/var 文件系统的大小,当/var 文件系统大小不足时,可用如下命令对系统进行备份:# make_recovery -A -C -b /tmp/uxinstlf.recovery-C : 创建反映系统当前状态的文件: /var/opt/ignite/recov
27、ery/makrec.last如果该文件存在,那么可以用 check_recovery 命令3. 注意用 make_recovery 备份的磁带是 bootable 磁带,用它可以安装 OS。4. 备份系统 Root Disk1). 创建最小 OS 的 bootable DDS tape(default 设备文件: /dev/rmt/0mn )# make_recovery2). 创建最小 OS 的 bootable DDS tape (设备文件: /dev/rmt/c0t1d1BESTn )# make_recovery -d /dev/rmt/c0t1d1BESTn3). 先预览,再创建
28、bootable DDS tape# make_recovery -p# vi /var/opt/ignite/recovery/arch.include# make_recovery r4). 复制整个Root Disk# make_recovery -A5). 复制整个Root Disk,且生成反映系统当前状态的文件( /var/opt/ignite/recovery/makrec.last )# make_recovery -C -A5. 恢复磁带上的所有数据1). 非交互式恢复系统A. 在磁带机中,插入系统恢复带B. Boot 系统C. 中断Boot 流程,进入 Boot_admin
29、提示下D. Boot_admin bo 8/16.0.08/16.0.0: 磁带机的 hardware pathE. 选取 “ non-interactive “F. 等待系统恢复完毕2). 交互式恢复系统A. 在磁带机中,插入系统恢复带B. Boot 系统C. 中断Boot 流程,进入 Boot_admin 提示下D. Boot_admin bo 8/16.0.08/16.0.0: 磁带机的 hardware pathE. 不选取 “ non-interactive “,选取“ interactive “F. 选择 Install HP-UX Advanced Installation 配置
30、或改变如下选项:disks, file systems,hostname, IP ddress ,timezone, root password ,DNS server, and gatewayG. 选取 install continue ,直到系统恢复完毕。11) 定时清洗磁带机12) 用 sar vmstat iostat 命令来查看资源使用情况。13)系统维护常用命令和常用工具 系统管理工具 SAM1. 启动 SAM 软件安装工具 swinstall1. 运行 swinstall 启动安装进程 磁带机的健康检查1) 外形主要介绍 DDS 3 磁带机1- Tape drive door2-
31、 磁带状态灯3- 清洗 / 提示 灯4- 弹出按钮2. 磁带机使用注意事项1). 磁带使用的寿命次数:100 次左右2). 磁带机清洗带的使用频率:3). 强制性退出磁带:当按动“退出”按钮35 秒后,磁带仍未退出,那么按住“退出”按钮至少5 秒钟,可以强制性退出磁带。3. 磁带机设备文件命名简介一些设备命名例子和意义:/dev/rmt/c1t3d0BEST BEST = “highest density possible“/dev/rmt/c1t3d0sQIC150nb QIC-150 format, no rewind on close, Berkeley/dev/rmt/c1t3d0D8
32、MM8500C (Names can be quite descriptive)/dev/rmt/0m (For compatibility with the past)The components of “/dev/rmt/c1t0d0BESTnb“ mean:dev = device filermt = raw magnetic tapec1 = the device is connected to interface card instance 1t0 = the target device address is set to 0d0 = the tape transport resides at unit address 0,BEST = the tape will be written using the best available density/format(meaning “pack as much onto this tape as is possible“)n = the tape will not be rewound on closeb = the device will have Berkeley-style behavior