1、1xxx 运维服务项目工作任务书XXXX 有限公司2015 年 7 月 16 日星期三21 现状描述和需求xxx 随着业务的不断拓展,生产系统越来越复杂。目前 xxx 已经建成若干套系统,支付系统、办公系统、存储服务器、线下支付系统、清算系统、审批系统、加密机、堡垒机、对账平台、防病毒系统、统计分析平台、电信合约机、外网行为审计系统等。xxx 系统实时性要求很高,xxx 系统运营团队目前有 3 人,分别负责网络,服务器,数据库等一个或多个方面,随着业务量的增长和日益复杂的生产系统及基础环境,人员数量与系统运营岗强度之间的矛盾日益突出。为解决系统运营人员数量不足的情况,拟启动 IT 运维外包项目
2、,从一家技术实力雄厚的科技公司引入 5 名专业工程师,分别承担信用 xxx 运维流程体系建设、网络、主机及数据库等方面的技术支持,对 xxx 系统运维人员提供咨询和帮助,同时为 xxx 现有生产系统提供技术支持。2 服务内容描述2.1 咨询服务内容描述服务目标:xxx 运维体系整体规划咨询并协助实施落地;合规、内控管理体系满足业务持续性及信息安全监管要求。服务范围:xxx 运维管理体系优化。服务内容:依据监管部门有关规定,梳理、修订、完善 xxx 运维体系。服务周期和计划:服务周期 3 个月,XXXX 年 XX 月 XX 日XXXX 年 XX 月 XX 日3交付物:序号 交付物名称 拟完成日期
3、1 xxx 机房管理操作规程2xxx 重要信息系统突发事件应急管理操作规程3 xxxIT 服务管理操作规程4xxx 计算机终端安全管理操作规程5 xxx 系统软件版本管理操作规程6 xxx 信息安全管理操作规程7 xxx 信息系统事件管理操作规程8xxx 计算机及相关设备管理操作规程9 xxx 软件版本管理操作规程10 xxx 数据安全管理操作规程2.2 运维服务内容描述服务目标:保障 xxx 业务系统高可用及持续运行;系统和网络日常运维工作,提升运维工作质量和响应效率;建立 IT 资产管理制度;建立 xxx 培训制度,持续提高 xxx 运维技术。服务范围:与 xxx 人员一起对 xxx 所属
4、的服务器、网络设备、存储设备、操作系统、数据库、中间件、应用程序等 IT 资产进行维护及持续改进,保障其所支撑的业务系统持续、稳定运行,保障 xxx 对内、外服务的正常开展。服务内容:xxx 运维体系整体规划咨询并交付相关文档、制定信息系统维护计划、信息4系统日常运维监控、信息系统健康检查、日常备份与数据清理、日常及紧急变更、计划内演练、容量分析与优化、运行报告编写。服务周期和计划:服务周期 1 年,XXXX 年 XX 月 XX 日XXXX 年 XX 月 XX 日各阶段交付物序号 交付物名称 交付频次或日期1 运行日志 每工作日2 运维周报 每周3 运维月报 每月4 运维年报 每年5 容量分析
5、报告 每季度6 风险分析报告 每季度7 培训教材及培训记录表 每半年3 服务岗位与人员要求数据中心运维人员岗位设置原则通常有以下两种方式:按业务区域(如网络分区、应用系统类型)设置运维岗位;按技术方向(如安全、路由交换、数据库、中间件)设置运维岗位,两种岗位设置方式各有利弊,需要根据数据xxx实际情况进行选择。通过对xxx运维现状调研结果的分析,建议xxx按如下方式配备运维人员:运维岗位:1、网络岗(高级)1人负责网络生产环境运维、网络安全策略实施、应用系统上线支持、应急事件处理、网络优化方案制定及实施等日常工作。检查网络设备运行情况,及时发现相关的报警信息,收集网络设备数据,分析性能问题提出
6、优化建议;配置、5调整网络设备配置参数,实现应用程序的特定要求和最佳性能;2、网络岗(高级)1人负责xxx日常网络运行维护,协助制定网络建设、优化建议和管理章程,及时处理网络设备使用中的各类问题,保障生产、开发、测试网络的正常工作,协助生产环境相关运维工作,构成AB角。 3、系统岗1人(高级)负责检查系统和数据库运行情况,及时发现相关的报警信息,收集系统、数据库运行数据分析性能提出优化建议;配置、调整系统和数据库参数,保障应用程序高效运转;根据实际需要安装系统和数据库官方发布补丁程序。设计并优化数据库物理建设方案;制定数据库备份和恢复策略及工作流程与规范,针对数据库应用系统运行中出现的问题,提
7、出解决方案;对空间数据库进行分析、设计并合理开发,实现有效管理;监督数据库的备份和恢复策略的执行,数据迁移策略制定和执行;为应用开发、系统知识等提供技术咨询服务。4、系统岗1人(高级)负责xxxIBM,DELL小型机,服务器系统硬件和系统平台正常运行;及时分析系统硬件,软件问题;监控xxx核心数据库、统一数据库运行情况,及时处理系统和数据库问题,给出建设性意见和建议;负责xxx集中存储硬件和配置,适时调整存储划分,根据业务和开发、测试需要合理分配存储资源,及时发现存储设备存在问题,给出合理化建议;监控xxx核心数据库性能,发现数据库引擎可能存在的隐患,及时处理数据库问题。构成系统AB角。5、数
8、据库岗1人(中级)负责xxxWindows平台及SQL-SERVER2000监控,问题处理;配合xxx管理人员调整数据库监控、优化、自动作业执行、数据抽取;配合相关人员调整Oracle数据库参数,监控核心数据库、统一数据库运行;根据需要调整参数配置,优化数据库运行效率;执行数据备份和恢复策略;按照安全要求提供相关数据给业务部门并跟踪和记录数据使用情况。运维项目经理1人,由以上运维人员兼任,职责如下:负责 xxxIT 运维相关流程的规划、设计、推行、实施和持续改进;负责 xxx 运维服务流程和服务标准执行情况跟踪;负责运维工作任务内部分派下发,对实6施结果负责;负责定期提交运维情况汇总报告。人员
9、要求:网络高级工程师1、针对网络开展架构设计、结构审核工作。2、按照业务发展提出网络结构变更,地址规划优化等建议,并提交建议报告。3、协助完成对重大变更、重大故障等解决方案的设计和审核。4、对网络设计方案和工程实施方案进行技术指导和审核。1.熟悉主流网络厂商产品和网络技术,具有CCNP(或同等)认证或相当能力水平。2.熟悉通信线路,通信接入设备的运维管理。3.熟悉行业业务流程和系统应用需求。4.具有技术规范撰写能力和制度编纂工作经验。5.具有技术方案设计经验,主持或参与过大型网络项目的设计建设工作。6.学历资质要求本科以上。7.10 年以上在金融行业网络系统集成相关工作经验。8.从事网络运维工
10、作工作年限 5 年以上。网络高级级工程师1、负责完成网络系统某一区域或基础服务系统运维工作,完成对全网的监控保障任务;2. 根据工作总体目标,能动地设计工作方法和规程:制订1 熟悉主流网络和网络技术,CCNP 以上认证(或 Juniper、HW、H3C 同等认证)或相当能力水平。2.熟悉行业业务流程和系统应用需求。3.具有具有撰写技术方案文档经验。4.具有技术方案设计经验,参与过网络项目的设计建设工作。7完成系统运行任务所需要的管理规定和不同使用者执行正确操作任务所需要的指令,在工作中根据实际情况不断改进或更新这些规定和指令;3. 及时规划和申请完成工作目标所需资源,根据工作任务,制订网络规划
11、和方案设计;4. 负责配置管理、变更管理和故障管理;5. 做好各种文挡的归档工作,保证技术知识的总结积累;5.学历资质要求本科以上。6. 5 年以上在金融行业网络集成相关工作经验。8.精通线路故障处理,具有线路维护经验。9.从事网络运维工作工作年限 8 年以上。10.综合布线设计经验。系统岗 3 人(高级)1、 负责 xxx主机系统的安全运行2、 配合 xxx建立健全运维制度并按照制度完成相1,负责 xxx 关键业务主机日常软硬件维护工作;2,按照 xxx 相关要求调整主机配置;3,负责 xxx 系统变更操作,填写相关文档;4,负责监控 xxx 系统运行状态,提出优化合理性建议5,建立机器档案
12、,记录每次变更调整内容,确定进程访问关系和所使用的端口。8关运维工作3、 及时处理xxx 系统、数据库或存储出现的故障4、 熟练使用系统的监控工具跟踪系统运维状态5、 配合其他部门完成xxx 信息系统上线工作6,硬件状态监控,配合硬件维护团队更换故障部件7、 熟悉 windows server,Linux 系统,能熟练配置 Windows Server,Linux 相关服务。8、使用跟踪工具跟踪系统和数据库运行状态及性能状态。9、熟悉,Dell、HP、Lenovo 等主流服务器硬件特性。10、具备错误排查能力,常见问题快速、及时处理。11、具备 3 年以上 WindowsServer 或 Li
13、nux运维经验;3 年或以上 Oracle 管理,运维经验。12、监控xxx系统核心数据库,整体数据库状态13、跟踪自动作业执行结果。14、执行备份和恢复策略15、配合业务部门 数据要求,经授权后提供业务数据16、了解 sql-server,oracle 数据库工作机制,能够发现数据库异常信息,做相关处理94 服务管理4.1 总体工作要求4.1.1 人员进场要求(一) 乙方派出工程师应与乙方签订正式劳动合同并满足甲方资质中明确的其他技能要求。(二) 乙方工程师在甲方办公场地工作之前,乙方应针对甲方工作环境、工作要求、规章制度等方面的要求组织内部培训。(三) 乙方工程师在甲方办公场地工作,乙方应
14、按甲方相关流程办理人员入场手续,并签订保密承诺函。4.1.2 人员行为与服务要求(一) 乙方人员应按甲方管理规定每日签到。(二) 乙方工程师在甲方办公场地工作,须遵守甲方对工作场所的相关管理规定和规章制定。一旦有违反甲方管理规定的,乙方有义务配合甲方进行人员的调整。(三) 乙方应保证派驻甲方工作的人员稳定性,乙方派出工程师的人员变动将作为对乙方服务情况的考评内容,并根据乙方服务人员的总数及变动次数,确定合理的人员变动上限,若超出上线,则需要支付一定的违约金。(四) 自初始名单确定后,后期涉及人员名单变化的,均列入人员变动范畴。4.1.3 工作内容总体要求(一) 乙方工程师必须服从甲方的统一协调
15、,在甲方要求的时间内保质保量完成各项工作。甲方有权裁决乙方的职责范围,乙方必须执行。10(二) 乙方工程师将参与的主要工作内容如下文所列,但不仅限于下述内容,甲方有权根据项目、安全系统、安全管控等实际工作需求,进行工作内容的调整,乙方必须配合。4.2 咨询服务工作的组织实施咨询服务工作拟按下述步骤开展步骤 1:项目启动步骤 2:调研访谈步骤 3:运维体系明晰里程碑:第一阶段交付xxx 运维体系报告步骤 4:xxx 运维体系相关文档编写步骤 5:xxx 运维体系相关文档交流步骤 6:xxx 运维体系相关文档修改里程碑:第二阶段交付xxx 运维体系相关文档步骤 7:xxx 运维体系优化及持续改进4
16、.2.1 制定信息系统维护计划乙方须协助甲方编写信息系统的日常运维保障维护计划,包括值班监控安排、日常备份计划、数据清理计划、定期巡检计划、重要维护日系统停起计划、自行组织的演练安排等,工作开展情况,对运维保障计划做必要的修订与更新。乙方须协助甲方编写、修订相关维护计划和文档。包括:(一) 提出维护内容,制定维护计划;(二) 编写常见问题处理手册;(三) 编写应急预案;(四) 编写变更模板、变更审核控制点。114.2.2 信息系统日常运维监控乙方须协助甲方确定系统监控内容,提出监控指标,实施日常监控,根据监控和运行情况,完善监控内容;编写运行维护手册和监控操作手册;按维护计划实施日常值班监控,
17、做好监控内容的记录;对于值班期间发生的故障或告警等进行跟踪处理;定期完成运行报告,提出监控的优化建议。乙方协助甲方开展系统、网络、数据库、中间件和应用系统等的监控工作,包括:(一) 告警接收与处理;(二) 监控指标维护;(三) 定期分析报警内容;(四) 对监控指标提出优化、完善建议。4.2.3 信息系统健康检查乙方须协助甲方开展所运维系统的健康检查、日常巡检、深度巡检,包括网络、应用、系统、数据库、中间件、相关设备等,部署健康检查脚本,调整健康检查阈值,收集整理和分析处理健康检查结果;负责特殊时点的应用运行状况健康检查,方案实施和问题处理。收集整理和分析处理健康检查结果,编写健康检查报告,提出
18、整改建议。乙方协助甲方开展系统、网络、数据库、中间件的健康检查工作,包括:(一) 编写健康检查脚本;(二) 确认分析健康检查结果;(三) 编写健康检查分析报告;(四) 完善健康检查指标。4.2.4 日常备份与数据清理根据甲方现场的实际条件,乙方须协助甲方制定应用系统备份策略、数据12备份策略、应用系统备份策略;根据备份和归档策略实施系统备份;根据数据清理策略编写数据清理脚本,实施数据清理,检查执行结果。4.2.5 计划内演练乙方须协助甲方编写应急处置方案、演练方案、制定演练计划;按计划实施演练;编写应急演练总结报告,对演练中出现的问题进行处理,就演练发现的问题进行分析,提出整改建议;不定期更新
19、、修订相关文档、方案。4.2.6 容量分析与优化乙方须协助甲方定期进行系统容量性能分析,收集应用系统交易数据、业务数据、运行数据,根据业务发展和系统资源实用情况,分析系统资源使用趋势,提交系统容量性能分析报告,提出优化改进建议。乙方协助甲方开展性能容量分析工作,做好系统容量和资源管理。包括:(一) 编写操作系统、数据库、容量数据收集脚本;(二) 性能容量分析,完成报告并提出优化扩容建议;(三) 提交系统资源分析报告。4.2.7 风险分析与优化乙方须协助甲方定期进行系统风险分析,对信息系统在设计、配置、管理方面的风险定期进行分析、研究,提交风险分析报告,提出优化改进建议。4.2.8 版本升级乙方
20、协助甲方,结合系统运行情况和厂商建议,评估现有版本(固件版本、设备驱动、操作系统版本、数据库软件版本等) ;制定版本升级计划和方案;组织进行新版本的测试和验证;选择个别非关键系统进行版本试点,对版本升级后运行情况进行重点监控;按方案实施版本升级;编写版本升级总结报告。134.2.9 运行报告乙方须协助甲方,按照运行管理的要求,定期完成运行周报、运行月报、年度运行报告等。5.1 运维服务工作内容5.1.1 服务目标运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。
21、同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等) 、业务应用软件等;用户自行开发的应用软件。服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标: 运行状态、故障情况 配置信息 可用性情况及健康状况性能指标145.1.2 IT 资产统计服务服务内容包括: 硬件设备型号、数量、版本等信息统计记录 软件产品型号、版本和补丁等信息统计记录 网络结构、网络路由
22、、网络 IP 地址统计记录 综合布线系统结构图的绘制 其它附属设备的统计记录5.1.3 网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。 设备基础性能检测:cpu、内存使用情况监测; 设备日志查看; 设备 snmp 状态; 测试 ping,tracert 等工具的连通性; 网络安全策略应用是否正常; Internet 带宽流量的实时监测; 网络拓扑链路状态监测; 异常网络数据包流量; Dos、ddos 等网络攻击情况监测; Internet 线路的误码率、丢包率监测;155.1.4 主机、存储系统运维服务提供的主机、存储系统的运维服务包括:主机
23、、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。进行监控管理的内容包括: CPU 性能管理; 内存使用情况管理; 硬盘利用情况管理; 系统进程管理; 主机性能管理; 实时监控主机电源、风扇的使用情况及主机机箱内部温度; 监控主机硬盘运行状态; 监控主机网卡、阵列卡等硬件状态; 监控主机 HA 运行状况; 主机系统文件系统管理; 监控存储交换机设备状态、端口状态、传输速度; 监控备份服务进程、备份情况(起止时间、是否成功、出错告警) ; 监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题; 对存储的性能(如高速缓存、光纤通道等)进行监控。5.1
24、.5 数据库系统运维服务提供的数据库运行维护服务是包括主动数据库性能管理,数据16库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。进行监控管理的内容包括: 数据库基本信息:文件系统、碎片、死锁、CPU 占用率较大或时间较长的 SQL 语句。 表空间使用信息监测; 数据库文件 I/0 读写情况; Session 连接数量监控; 数据库监听运行状态监测; 查看每日数据备份、数据同步是否正常; 报警日志监测; 对表和索引进行 Analyze,检查表空
25、间碎片; 检测数据库后台进程; 数据库对象的空间扩展情况监测;5.1.6 终端、外设运维服务负责对终端 PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。176.1 服务流程管理事件处理乙方须协助机房对来自系统监控的事件进行响应并处理。对接到的电话、短信通知或事件处理单,及时做出响应,完成事件的处理;在事件处理完毕后,及时整理、完成事件分析报告;定期回顾历史事件,分析潜在风险,提出优化建议。乙方协助甲方对事件和问题进行响应并处理。具体工作如下:(一) 负责编写应急场景收集脚本并部署;(二) 负责事件和问
26、题的诊断及处理;(三) 负责制定应急预案;(四) 负责应急处理;(五) 负责事件和问题分析,负责提交报告、完善应急预案或提交知识。问题处理乙方须协助甲方对事件处理中未找到原因的事件进行分析处理流程,结合系统日志、事件现象等数据,对问题做分析处理,力求找出问题原因,形成解决方案。变更与上线乙方协助甲方对涉及系统变更的需求(外部需求、扩容需求、上线需求等)进行分析,完成需求分析报告;与基础设施资源管理部室落实变更所需资源,确认涉及到的资源到位;编写变更、系统上线方案、回退方案及其他上线资料;核实或确定上线版本;填写变更申请单,提出变更申请;参加变更、上线实施工作。18知识管理乙方协助甲方对已处理的事件、问题等进行总结,形成知识点,提交甲方人员审核后,归入中心知识库。风险管理乙方应遵守关于系统安全性管理、设备口令管理、数据安全性管理、人员进出机房管理等相关管理规定。协助甲方定期开展系统安全性检查,以满足风险管理相关规定与要求。服务响应乙方协助甲方对客户的服务请求做出响应、满足或支持客户服务请求,提供技术支持。