1、XXXXXXX 政府门户网站维护项目运维方案XXX公司2017年 5月XXX运维方案第 i 页目 录第一章 运维方案 41.1 运维总体原则 41.1.1 整体性原则 41.1.2 有效性原则 41.1.3 可靠性原则 41.1.4 反馈性原则 41.1.5 防范预警原则 41.2 运维服务目标 41.3 项目运维服务方案 51.3.1 运维服务总则 51.3.1.1 安全性 .51.3.1.2 稳定性 .51.3.2 运维服务计划 51.3.2.1 启动阶段和运维体系的导入 61.3.2.2 正常服务阶段 .61.3.2.3 收尾阶段 .61.3.3 运维服务体系 71.3.3.1 IT 服
2、务体系的建立 .71.3.3.2 IT 运维体系的建立 .101.3.3.3 系统运维制度建设 121.3.3.4 运维管理机制建设 131.3.3.5 项目沟通机制建设 151.3.3.6 运维保障机制建设 171.3.4 运维团队组织 191.3.4.1 组建团队 .191.3.4.2 工作岗位设置 .211.3.4.3 组织机构 .231.3.4.4 人员安排 .241.3.4.5 团队建设 .261.3.5 运维协作环境 281.3.6 运维服务内容 281.3.6.1 网站内容保障服务 281.3.6.2 日常巡检服务 .291.3.6.3 网站安全服务 .321.3.6.4 技术支
3、持 .161.3.6.5 其它 .181.3.7 运维服务交接 261.3.7.1 制定工作交接计划 261.3.7.2 启动交接 .271.3.7.3 文档、流程、系统交接 271.3.7.4 运维对象调查及其内容再识别 27XXX运维方案第 ii 页1.3.7.5 交接工作总结会 .271.4 运维保障服务方案 271.4.1 系统安全性保障服务 271.4.1.1 网络安全 .271.4.1.2 信息安全 .281.4.1.3 设备安全 .281.4.1.4 数据安全 .301.4.1.5 操作系统安全 .321.4.1.6 数据库访问安全 .321.4.2 系统稳定性保障服务 321.
4、4.2.1 XXX 网站 7X24 小时网站监控服务 .321.4.2.2 访问响应时间监控服务 331.4.3 系统故障处理保障服务 381.4.4 系统突发事件处理保障服务 391.4.4.1 处理方式 .401.4.4.2 应对黑客攻击 .401.4.4.3 突发事件紧急处理 411.4.5 内容发布响应保障服务 491.4.6 网站运维文档保障服务 491.4.7 响应时间保障服务 601.4.7.1 工作原则 .601.4.7.2 应急处置工作要求 601.4.7.3 应急组织机构与职责 601.4.7.4 应急事件分级 .611.4.7.5 应急响应 .631.4.7.6 保障措施
5、 .681.4.7.7 信息发布 .691.4.7.8 后期处置 .691.4.7.9 宣传、培训和演练 701.4.7.10 附录 .711.4.7.11 XXX 专业的客服中心 .731.4.8 日常工作管理保障服务 731.4.8.1 工作总则 .731.4.8.2 服务时间 .741.4.8.3 汇报管理 .741.4.8.4 问题管理 .741.4.8.5 知识库管理 .751.4.8.6 服务记录管理 .75第二章 售后服务保障方案 .762.1 售后服务组织机构 762.2 售后服务规范 772.3 售后服务方式及内容 792.3.1 呼叫中心(内含本项目运维组) 792.3.2
6、 邮件服务 79XXX运维方案第 iii 页2.3.3 服务网站 802.3.4 远程培训 802.3.5 投诉受理服务 802.4 售后服务流程及跟踪 812.4.1 售后服务流程 812.4.2 售后服务跟踪 842.5 售后服务保障措施 842.5.1 售后服务具体措施 842.5.2 售后服务应急措施 852.5.2.1 售后服务档案机制 862.5.2.2 售后服务监督机制 872.5.2.3 售后服务提交文档 872.6 售后服务承诺 88XXX运维方案第 4 页第一章 运维方案1.1 运维总体原则1.1.1 整体性原则我们将综合考虑 XXX 目前所有门户网站相关应用系统的现状,提
7、出整体的运行维护策略,有效保障系统运行中各环节的不间断运行,并综合使用不同层次的技术手段,为应用系统和系统依托的基础环境提供全方位的监控管理和服务。1.1.2 有效性原则将充分利用各种现代技术手段,选择一款功能丰富、技术先进的系统运维监控软件,结合科学合理的运行管理机制,对系统的稳定可靠运行提供有效的保障。1.1.3 可靠性原则对维护工作中后续应用系统模块的开发设计中,应采用成熟可靠的技术和产品,同时配合完善的项目控制规范和质量保证体系,保证互联网站的升级维护中的严格的质量控制,保证系统开发和运行的安全可靠。1.1.4 反馈性原则实现运维中发现、需要解决的问题要及时反馈给信息系统的开发商进行完
8、善,利于优化机构、岗位设置,利于业务流程的改进。1.1.5 防范预警原则运维系统中应包含各种预案,争取实现在故障、问题出现时有章可循,在紧急状态有应急措施,提高运维效率,将故障代价减小到最小。1.2 运维服务目标按照网站管理处要求,完成与 XXX 网站运维相关的日常工作。XXX运维方案第 5 页1.3 项目运维服务方案1.3.1 运维服务总则1.3.1.1 安全性(1)XXX 门户网站及内容管理平台应用的安全性确保网站能够正常访问;确保网站群动态应用正常,并能够提供正常的服务。(2)XXX 门户网站及内容管理平台数据的安全性确保数据库中的信息跟网站发布的信息一致;确保数据库数据正确,不被非法破
9、坏,并且及时做数据库和网站数据的备份,当意外发生时,网站能够及时、完全恢复;未经许可,不得将网站数据泄漏给其它个人或组织;由专人负责,保证数据的安全。1.3.1.2 稳定性(1)不间断服务提供 7*24 不间断服务,专人值守,监控网站;意外情况下,及时通知信息中心相关负责人,并做好各项应急准备。定期向信息中心相关负责人汇报网站运营情况。(2)访问响应时间监控网站群访问速度,如访问相应时间过长,及时查找原因,并向信息中心相关负责人汇报;监控网站群动态应用,对影响应用性能方面因素及时预警,并提出相应解决方案,及时汇报给信息中心相关负责人。1.3.2 运维服务计划为了对此次维护服务项目提供良好的管理
10、监控,并对项目中各管理组织之间的持续运作建立恰当联系,我们把整个项目执行分为三个阶段:1、启动阶段项目前期的准备工作,包括服务管理制度流程的建立、人员的到位,运维体系中各种因素的交接。我方将在签订合同后的 5 个工作日内,提供详细的项目实施工作计划(包括:项目组成员、运维服务的内容、进度安排、应急预案等) 。XXX运维方案第 6 页2、正常服务阶段正常的执行资产管理和运营维护。3、收尾阶段项目的总结移交并达到有序的结束。1.3.2.1 启动阶段和运维体系的导入在此阶段中,主要执行前期的准备工作,为尽快向客户提供高质量的服务打好基础。该阶段主要工作如下:1、成立维护服务项目组,确定客户与 XXX
11、 公司的职责分配2、相关人员提前到位,提供维护服务的准备工作3、召开项目启动会议,明确工作范围,制定启动阶段计划4、项目管理、运营维护等规章制度流程的确定5、服务工具的安装、运维体系管理文件的草拟6、与客户方人员一起讨论有关的工作计划和需求7、系统维护服务实施方案的出台和审核8、原来的服务商对 XXX 公司的知识、档案转移,XXX 公司进行签收,确保服务的无缝链接9、对客户的系统信息进行摸底大调查,建立和更新配置管理数据库10、对现有系统进行分析,得出改进报告,提交用户1.3.2.2 正常服务阶段项目启动后,新的运维服务体系可以实现完成所有设备维护后,即进入正常的服务阶段。在正常服务阶段,所有
12、的工作将按照制定的计划进行,并提供服务级别的承诺。具体的工作如下:1、服务管理体系和流程的改进2、正常的维护管理3、风险评估1.3.2.3 收尾阶段此阶段开始于合同结束前 1 个月(如合同继续延期续签,则本阶段工作主XXX运维方案第 7 页要以总结为主) 。这个阶段的主要工作是和客户充分沟通,移交服务期的工作,争取继续合作的可能。并从此项目的服务实施过程中积极总结经验,以促进提高在未来的项目中的工作绩效。 1、收集服务期中各部分的服务文档资料。2、汇总、装订,提交用户并存档。3、项目评估、总结。4、向甲方或甲方指定的其他组织进行档案和知识转移,人员培训,确保系统的稳定运行。1.3.3 运维服务
13、体系1.3.3.1 IT 服务体系的建立XXX 公司作为国内积极参与政府信息化建设的大型企业之一,长期以来积累了丰富的技术支持和运维服务经验,始终视服务为企业生存与发展的生命线,优秀的服务理念成为我们在激烈市场竞争中所体现的鲜明特色。1.3.3.1.1 IT 服务体系整体结构只有高效、稳定、个性化的本地化服务模式才能满足用户随时随地的服务需求;也只有迅速的维护响应才能真正保证用户的利益不受损害。因此我们在自身服务体系的基础上,针对 XXX 政府门户网站内容管理平台运维项目,特定IT 服务体系,由响应体系、维护体系和质量监督体系构成,见下图所示:XXX运维方案第 8 页质量监督体系质量监督体系响
14、应体系维护体系客户需求图 1:IT 服务体系架构1、客户需求在服务协议规定范围内的任何服务请求,包括咨询、问题申报、投诉等。2、响应体系第一时间受理客户的需求,以最快的速度解决问题,保障客户系统尽快恢复正常。3、维护体系对客户系统进行主动式服务,发现并解决系统隐患,优化系统性能,并提出合理的改进和升级建议。4、质量监督体系为保障服务的质量制定相关的服务协议,通过满意度调查等方式评估服务的提供是否正常。IT 服务体系最终都可以通过本次项目建设的 ITIL 运维体系落实,响应体系对应 ITIL 运维体系的“事件管理” ,维护体系对应 ITIL 运维体系的“问题管理” ,质量监督体系则通过“运维管理
15、”来实现。XXX运维方案第 9 页1.3.3.1.2 响应体系响应体系包含服务台和突发事件管理,主要任务是受理客户的服务需求,尽快恢复客户系统的正常运行。客户有问题可以通过热线电话、Email 与服务台联系,服务台负责接听技术服务电话、受理客户问题,进行记录,分类并转给相应的工程师处理。二线工程师负责处理服务台分配的事件或问题,当二线工程师需要技术支持时,可以从公司总部获第三方获得到技术支持和实验室环境支持。故障级别 服务请求时间 响应方式、时间一级故障 724 服务台接到服务请求后,即刻响应,服务人员工作时间内马上到达现场,非工作时间 1小时内到达,进行现场服务。 二级故障 724 服务台接
16、到服务请求后,对于电话未解决故障,15 分钟内再次回应,提供电话技术支持,工作时间内服务人员 1 小时到达现场。三级故障 724 服务台接到服务请求后,30 分钟内再次回应,提供电话技术支持,工作时间内服务人员 2小时到达现场,或与用户协商1.3.3.1.3 质量监督体系为保障向客户提供的服务准时高效,质量监督体系是必须的。运维团队和客户将按照合同的要求,共同制定服务协议书中的各项服务水平要求,以监督保障所提供的服务质量。质量监督体系的主要工具是满意度调查,衡量的标准即双方认可的服务水平要求。满意度调查制度及时了解客户对我们事件处理情况的重要手段。也是我们不断改进、完善服务的渠道。服务满意度调
17、查制度同响应体系事件的调查制度一样,技术服务中心将协同客户一起定期对提供的服务进行全面的满意度调查,以此来提高服务的质量。满意度调查结果与服务工程师的当期绩效考核挂钩,作为工程师个人业绩评价的参考数据之一。XXX运维方案第 10 页1.3.3.2 IT 运维体系的建立ITIL 提供了一个概念化、模块化的优秀框架,与其说是解决方案,不如说它更象理论。它提出了建立 IT 服务管理体系时要考虑哪些流程,提到了应该做哪些,好处在哪儿,但并不详细介绍怎样去做,因此它本身不具备实际操作可能性。我们在长期的运维项目中积累的丰富的经验,根据 XXX 门户网站的实际情况,对 ITIL 进行适当选取、适应和扩展:
18、(1)导入 ITIL 是一个长期过程,运维运维初期,以“系统日常运行和支持”为主,重点解决服务支持(Service Support)流程,对发生的问题进行维护和处理。在运维后期,运维的服务支持流程步入正轨后,再关注运维服务的长期计划和改进,考虑服务提供(Service Delivery)。(2)针对 XXX 门户网站,运维的主要任务是解决发生的问题,对 IT 基础架构进行基本的配置管理,因此主要实现“服务台”、“事件管理”、“问题管理”和“配置管理”,至于变更管理在实际运维中,暂时没有系统工具支持,放在后期在规范流程,并用信息系统化实现。(3)由于初期运维工作内容多,系统繁杂,人员少,为提高运
19、维人员解决问题的能力和效率,运维体系扩展加设“知识库”,以提高运维技术的积累、传承、利用。经过对 ITIL 体系进行适当选取、适应和扩展,从适合 XXX 门户网站,适合运维团队完成任务目标为主,我们制定了个性化的运维体系,如下图所示:XXX运维方案第 11 页运维团队服务台时 间 管 理问 题 管 理知 识 库 配 置 管 理运维体系国家质检总局门户网站运 维 工 具总 局 用 户热线求助报警监控自动报警使 用监 控反 馈图 2:IT 运维体系架构个性化的 XXX 门户网站运维体系设置“服务台”统一接受各种故障受理,包括最终用户直接电话或邮件传来的求助信息和运维监控软件过来的自动报警信息,然后
20、服务台问题分析并归类,力求初步解决用户或系统的故障;不能在线解决的需求问题,启动“事件管理”和“问题管理”流程,运维人员按照既定的流程,在“知识库”和“配置管理”的支持下,解决故障,并把积累的经验知识归入知识库。问题解决后,运维体系反馈于 IT 系统,促使其更好更稳定运行,并促进其优化和完善。其中, “知识库”和“配置管理”可以依托运维监控工具实现信息化作业,而“服务台” 、 “事件管理”和“问题管理”则仍然依照对应的制度人工操作,暂时没有信息化系统辅助运行,可以考虑在后期建设运维平台时优先实现。所有的事件都应该基于影响度、紧急度和优先级进行分类分级,并提供相应的解决方案和临时方案。表 1:系
21、统运维故障级别定义故障级别 服务请求时间 响应方式、时间XXX运维方案第 12 页一级故障 724 服务台接到服务请求后,即刻响应,服务人员工作时间内马上到达现场,非工作时间 1小时内到达,进行现场服务。 二级故障 724 服务台接到服务请求后,对于电话未解决故障,15 分钟内再次回应,提供电话技术支持,工作时间内服务人员 1 小时到达现场。三级故障 724 服务台接到服务请求后,30 分钟内再次回应,提供电话技术支持,工作时间内服务人员 2小时到达现场,或与用户协商注: 故障级别描述:一级故障是指系统发生严重故障,业务发生中断,或虽然业务未中断但已经无法保证及时、正确的情况,对用户业务的运行
22、有严重影响。二级故障是指对于系统发生的非严重故障,业务并未中断,业务仍然及时、正确的情况,但性能有所下降。三级故障是指系统发生轻微的故障,系统有警告信息等,对系统没有较大影响的故障。1.3.3.3 系统运维制度建设在信息化运维中,制度建设是一道必要的保障。信息化不能一蹴而就,在信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。对于 IT 运维团队来说,可从以下几个方面来进行 IT 运维制度化:(一)转变运维观念,树立规范化意识。树立只有建立制度化的 IT 运维意识,才能在日常繁杂琐碎的工作中有效
23、的区分任务的优先级,将有限的资源投入到最能满足“客户”需要的工作中。 为保证运维工作,把运维工作和制度化紧紧地捆绑到一起。运维工作很琐碎,关键在于规范而不是创新。只有各级运维技术人员一丝不苟、老老实实按规范做,才能够把事情做好。 (二)建立事件处理流程,强化规范执行力度。首先需要建立故障和事件处理流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。建立每种事件的规范化处理指南,减少运维操作的随意性,在很大程度上降低故障发生的概率。 XXX运维方案第 13 页同时,建立 IT 运维制度非常重要,但是有了制度还要有人去执行,要强化执行制度比建立制度更
24、重要的观念和意识。1.3.3.4 运维管理机制建设“三分建设,七分管理” ,XXX 公司采用多重管理制度,并加强沟通机制,力求完善建设 ITSM 中的服务监督体系。1.3.3.4.1 升级管理机制升级管理是突发事件管理的重要组成部分。 “事件跟踪”将记录从受理用户问题到派单过程中相关人员所做的处理和建议,保证信息的正确传递,记录内容将做为我们向用户提供服务及分析和衡量服务水准的依据。我们将通过服务系统监控事件的全过程,直至服务结束。当出现的问题在承诺时间内无法有效解决时, “事件跟踪”会自动启用逐级上报升级管理流程,该流程旨在能真正起到督促问题快速有效解决的作用。我们将和用户一起共同制定出适合
25、 XXX 业务需求的升级流程并指定相应的人员来监督流程的实施。1.3.3.4.2 报告系统我们将按 XXX 信息中心要求定期提供标准报告。(1)突发事件管理报告确保用户的电话被接受、解决并记录,服务范畴之外的问题也会转至第三方。突发事件管理着眼于解决问题的快速,解决问题的高质量,确保用户的满意度并达到承诺的服务级别。突发事件的出现和解决方法将体现在定期的服务报告中。(2)问题管理报告我们将对重复发生的,主要的突发事件进行问题管理,诊断问题的真正原因。问题管理着眼于获得系统的高可靠,避免问题的再度发生,赢得用户高满意度,达到承诺的服务级别。经常出现及主要的问题,及相应的解决方法将体现在定期的服务
26、报告中。报告内容包含重点问题分析、潜在服务隐患、优化建议等信息。1.3.3.4.3 月、季度总结机制XXX运维方案第 14 页我们每月、每季与 XXX 信息中心召开总结会,共同讨论前一月或季度的服务执行情况。会议时间建议在该月、季度结束后、下一周或每月 10 日之前,具体时间可以与 XXX 信息中心协商确定。会前双方应沟通和确定议程并在会前提供必要的报表和报告。会议主要回顾从上次会议结束到本次会议前一天,我们所提供的服务的绩效,同时讨论和达成为改善服务必须采取的改进措施和行动步骤。1.3.3.4.4 客户满意度调查系统以目前的客户满意度调查表格为蓝本,与客户共同协商适用于客户的调查选项、格式和
27、方法。下表仅供参考,以和用户协商后的调查表为准。表:运行维护满意度调查表开始时间 结束时间好 较好 一般 差对主机设备使用评价原因: 好 较好 一般 差对网络设备使用评价原因: 好 较好 一般 差对运维服务人员评价原因: 好 较好 一般 差对整体工作评价原因: 评价人(签字): 日期: 年 月 日1.3.3.4.5 事件信息发布通知对于机房的服务事件,例如:设备维护、线路维护、网络故障或主机故障等,运维管理中心通知客户方,内容包括:1、事件内容2、事件类型(一般、紧急)3、发生的时间段4、影响范围(部分、全部)5、客户应采取措施(如需要的话) 。1.3.3.4.6 投诉管理XXX运维方案第 1
28、5 页(1)XXX 用户可以书面或口头形式对运维商提供服务的服务质量进行投诉。投诉的受理和处理部门由双方事先约定; (2)XXX 用户可以书面或口头形式对运维商的各部门/各级员工进行投诉;(3)运维商设立投诉专线受理甲方投诉;(4)运维商在受理 XXX 用户投诉后的 8 个工作小时内向投诉方提供第一份书面形式的投诉处理情况报告。1.3.3.5 项目沟通机制建设1.3.3.5.1 内部团队沟通在每个角色组或在特定系统工作的所有角色中每天或定期举行简短的会议,提供关键的或时间紧迫的系统和业务问题方面的更新和所需行动的更新。客户可以根据需要浏览的相关信息和分阶段的操作统计数据,如正常运行时间、客户访
29、问次数、行为趋势、开放问题等等。在为从发布到生产所作的最后准备工作中与开发和部署组队一起举行的由开发组主持的会议。这一签收表示所有的开发组都已准备就绪。实施阶段可以承担产品或系统的运行支持工作了,要分发和阅读(例如 e-mail 的格式编写)定期状态报告,提交给 IT 管理层,以及针对操作的关键绩效指标方面的业务内容(例如,依照服务级别协议的量度、服务台日志统计、项目目标实现进展等等) 。1.3.3.5.2 外部客户沟通同其他任何项目一样,有效沟通是事关本项目最终能否成功的非常关键的一个环节。鉴于项目本身的建设内容和牵涉到关系的复杂程度,沟通管理自然显得尤为重要,为此,必须从项目的干系人以及他
30、们之间的工作关系和社会关系出发,详细分析项目所需的各种沟通环节,对其中最主要的沟通环节制定计划进行专门的管理,避免项目因为信息沟通不足而陷入困境或造成不必要的损失。沟通分为三个层面即:执行层面,主要是各干系单位的工作人员就一些具体工作中涉及的配合问题进行沟通和交流;管理层面,主要是各干系单位的在XXX运维方案第 16 页本项目及其子项目的项目经理及监理单位,沟通的内容主要是有关项目执行中的重要事项、活动和决定;决策层面,主要包括业主领导、开发商领导、运维商领导等,沟通的内容主要是对项目进展过程中间碰到的重大问题的协调、重大事项的决定、重大事件的见证等。为了实现充分沟通的目的,将主要设立如下沟通
31、手段。(1)会议或交谈按需要组织会议进行沟通,或直接找相关的人进行讨论,注意记录沟通和讨论结果。每次正式会议都要形成会议纪要,由项目组文秘做会议纪要,并分发到有关人员手中。(2)工作联系单 联系单将处理项目执行过程中重要事项的决定、变更或者项目问题报告的多点沟通的一种正式的形式,一般在其他辅助手段沟通无效的情况下采用。联系单上须明确所联系事项的内容概要、紧急程度及其解决请求。在出具的联系单中,一般情况下主送业主或监理单位,抄送其他相关单位,并要求有关单位及时回复或者解决。在接到需我们解决或回复的联系单后,我们也会在第一时间给出答复或者采取行动。项目实施期间所有收发的工作联系单都代表着项目执行过
32、程中的重要活动的书面依据,都将作为项目执行过程中的档案进行整理存档,在项目终验时移交给业主。(3)电话或电话会议 通过电话的方式进行信息沟通。对比较重要的事情,需要包括实施地点以外的人员,则需要利用电话会议的方式进行讨论,沟通。实践证明,电话是点到点沟通的最普遍和最常用的形式。需要声明的是,对于项目中一些重大问题,仅仅通过电话沟通仍然是不够的,在电话确认以后,仍然需要以备忘录、联系单的形式落实到纸面,作为对这些问题的最后确认。(4)书面报告、备忘录和传真 书面报告、备忘录和传真事点对点沟通的相对比较正式的手段,主要考虑用于对项目过程中的一些重要事件或方案的描述、质询等。XXX运维方案第 17
33、页(5)电子邮件 作为现代办公的一种常用手段,电子邮件系统也将成为项目组内部以及项目组合外部沟通的一种非常重要而且高效的沟通手段,应该视为同书面报告和传真具有同等的严肃性。1.3.3.6 运维保障机制建设选择了一个合适的运维商,只是运维项目开始的关键一步,如何确实保障项目走向成功呢?我们认为需要针对 XXX 门户网站运维项目成立专门机构,专人专职,专款专用。1.3.3.6.1 机构保障建议双方联合成立运维领导小组,增强沟通协调,加强运维组织建设,建立稳定的运维团队。在 XXX 政府门户网站内容管理平台运维项目启动阶段,我们就高度重视,并组织人员组建了筹备机构,由丰富经验的资深咨询人员及熟悉政府
34、网站运维的工作人员共同组成工作小组,广泛研究国内外信息化系统运维经验,深入调研分析, “尽我所能” ,无私奉献我们在大型项目建设及运维经验。我们在承担此项目后,将成立独立的部门,采用专职部门、专人专职、专款专用等措施来保障该部门不同于公司其他的项目组织。1.3.3.6.2 人员保障(一)运维优秀人员本次项目,我们将按照 XXX 要求专门组建运维团队,使运维团队具备娴熟的技术和广泛的专业知识,系统运维人员具备高超的技能和丰富的经验。(二)核心人员备选我们聚集了国内优秀的 IT 人员、管理人员,对于进驻 XXX 运维部核心人员,建立备份替补机制,备份替补人员随时可以进入 XXX 开始工作。(三)凝
35、聚人才的企业文化我们一贯的企业文化,凝聚了大批优秀人才,使整体团队能保持工作激情,传承知识,从而创造一个高效、团结、和谐的工作环境。XXX运维方案第 18 页我们所有工作人员在企业文化的洗礼下,具有良好的职业素质和道德品质,面对具有历史使命的工作任务,不会讲任何条件,作为战略合作伙伴,坚决服从 XXX 信息中心领导,服务好 XXX 政府门户网站内容管理云服务平台!(四)规范管理规避人员流动风险通过建立规范的软件开发管理、项目管理、IT 服务管理、运维管理等管理体系,和科学的咨询方法等诸多知识体系,保障运维工作的开展,弱化个人能力对整个运维项目的影响,把人员流失造成的风险降低到最低。根据我们以往
36、的经验可以证明,我们有能力使人员流失的风险在可控范围内。(五)人员调动须经同意本次项目的所有人员调离,都要和 XXX 信息中心协商,经 XXX 信息中心同意后方可进行。1.3.3.6.3 培训和技术保障加强对运维人员的培训,提高技术保障能力,成功有效地实施和运营服务管理流程。除此之外,培训还有以下几个方面的作用:1、促使所有相关人员清楚和理解 ITIL 计划和有关术语;2、为相关人员提供讨论的平台;3、为发现和减少可能的问题和不正确的实施方法提供了平台和知识;4、帮助发现缺乏的技能并采取相应改进措施;5、提供大量的培训流程所需的资源。1.3.3.6.4 积极参与 XXX 信息化建设我们运维团队
37、在完成运维任务的同时,将积极参与 XXX 的信息化项目建设,促进系统统筹规划,集中管理,利于运维交接,便于维护。(一)参与统一规划管理根据 ITIL 体系外围工作要求,IT 运维还要结合“IT 规划管理”和“IT 基础架构”的工作,因此我们将积极参与 XXX 信息中心的信息化建设规划,通过统筹规划,设立信息化战略目标,制定信息化建设规范,解决系统结构不一、开发混乱、成本居高、维护困难、信息孤岛林立、难以集中管理的局面。ITILXXX运维方案第 19 页体系反馈于 IT 系统,促进互联网站更好的完善和发展,同时也使运维更加轻松容易。(二)参与其他系统建设另外,IT 运维还要结合“业务管理”和“应
38、用管理”的工作,我们将把业务目标作为运维部门的战略目标,协调技术和业务发展之间的关系,积极参与业务部门的需求分析、业务系统的开发建设、系统的测试上线等工作。1.3.4 运维团队组织1.3.4.1 组建团队1.3.4.1.1 组建原则(1)项目运维团队将提供 7*24 小时应急响应服务能力,在遇到突发情况时及时响应解决问题。(2)项目实施人员具有良好的职业道德,不损害用户利益。(3)驻场工程师配置具备完全的稳定性,不出现一个岗位角色频繁更换人员的问题,以便保证工程师对系统的了解和认知,保证运维工作的质量。(4)美工配置具有良好的网页及平面设计能力、丰富的网站制作经验,精通美工软件 Photosh
39、op、Illustrator 等,熟悉 html、css、dreamweaver 等。(5)在项目实施过程中不随意变换所拟派的项目经理。基于以上组建团队原则,本次项目的团队将由 XXX 公司的政府网站运维技术人员组建,科学地分析运维任务,拟定角色职责,设立工作岗位,组成运维机构;再根据人员的技术组成,指定其角色和岗位,这样三定(定人员、定角色、定岗位)后,形成的运维团队专人专职、人尽其才、角色交叉、技能备份,能高效、可控地执行运维工作。1.3.4.1.2 人员角色 IT 服务管理是以流程为中心的,针对每个流程,定义了一系列的角色,每个角色被赋予特定的职责和任务,实现责权利的统一。一个角色可能需
40、要多个运维人员来承担,同样一个运维人员有时也可能承担多个角色。(1)任务需求XXX运维方案第 20 页1)网站应用系统日常维护维护人员对所管理的网站应用系统进行每日巡检,包括对磁盘空间、系统日志、系统资源占用、访问性能等的检查。2)网站系统日常监控对网站系统每天的运行进行监控,及时发现系统的故障,确保系统的可靠稳定运行,并在日常监控的基础上进行安全事件积累、分析。3)网站内容监控维护人员每日完成对 XXX 网站栏目、内容的巡检,对每日网站信息摆渡工作进行监控,为网站信息发布提供技术咨询和技术支持,解答和解决网站发布系统使用过程中出现的问题。4)网站内容维护完成 XXX 网站主站页面、英文版及相
41、关栏目内容的维护;公众互动板块各栏目的维护;XXX 网站内容管理系统用户管理等工作。5)网站栏目调整指导各单位完成网站栏目、图片和样式的管理,提供阶段性栏目或栏目内容调整、程序修改、信息发布等服务。6)数据统计在对网站系统和内容进行监控的基础上,对网站访问量等基础数据进行统计,提供每日统计报表,并根据实际工作需要,进行网站数据统计工作。7)网站应用系统完善针对使用过程中提出的网站应用系统改进和完善需求,及时响应小范围应用软件调整的需求,不断完善网站应用系统。8)网站系统安全测试积极配合信息中心开展网站系统安全性测试工作,并协助对测试中发现的应用系统问题进行改进。9)网站信息系统调整积极配合 X
42、XX 信息中心开展网站信息系统建设调整工作,包括实现网站信息的分库存储、备份网站系统完善方案和测试系统建设、网站部分历史数据的梳理、补充及信息中心根据网站工作需要提出的其他调整任务。XXX运维方案第 21 页10)完成 XXX 信息中心交办的与网站系统相关的其他工作。(2)所需角色及职责1)运维经理职责:根据客户方的需求,协调资源完成客户方交办的各项工作2)技术支持工程师职责:对网络设备资源信息、服务器资源及网络带宽资源利用综合管理,进行网络拓扑监管、涌塞监测、端口管理、路由管理、性能监视、流量分析、状态监视、CPU,内存,DMA,I/O,DISK,进程等资源。负责操作系统、数据库系统、应用中
43、间件系统、邮件系统等基础系统软件进行维护和监管,包括监控数据库系统、Web、文件、进程、Mail、应用中间件、FTP、DNS、HTTP 等。3)流媒体工程师职责:根据客户方的需求,编辑、录制视频并进行发布。4)网站开发工程师职责:对用户发现的系统中的 bug 和小的系统调整进行程序修改和完善;对现行互联网站中新增版块的需求,应协助进行需求分析,起草需求分析报告,然后根据需求组成开发小组,完成模块的开发、上线工作;适当参与 XXX 内部新建互联网站的开发工作,了解系统的整体架构和设计开发的全过程。协助信息中心进行新开发的互联网站的用户测试工作;对新增版块,完成模块的测试,协助上线工作。5) 美工
44、设计职责:业务系统的页面美术设计改善,新增模块的美术设计。6)中文编辑职责:负责网站主站页面及相关栏目内容的维护。7)英文编辑职责:负责英文网站页面及相关栏目内容的翻译、维护的工作。1.3.4.2 工作岗位设置(一)管理岗运维管理岗配置运维经理,主要职责为:XXX运维方案第 22 页1)负责整个运维服务项目的具体组织和管理。2)制作详细的运维方案,在运维过程中及时动态地调整方案,提高工作效率,保证服务质量。3)给各个管理小组分配任务,随时监控每个小组的运维管理情况,控制服务质量。4)作为与用户间的接口,负责向用户汇报运维情况、变更需求等情况,并及时将有关要求反馈给管理小组。5)接受用户投诉和协
45、调用户需求的变化,及时反馈制订应急计划,报告项目领导小组和用户负责人。6)召集季度总结会和工作协调会。(二)技术岗1)技术支持工程师主要职责:a)负责网站软、硬件平台日常运维。b)负责网络设备、服务器、存储设备、安全设施等硬件平台的运行和监控。c)负责服务器操作系统、数据库系统、应用中间件系统等基础系统软件的安装、配置、和应用系统接口、运维及关闭。d)负责维护数据报表系统的运行,管理数据库表,清除垃圾数据,按时数据更新,产生临时报表。2)中文编辑主要职责:e)负责网站主站页面及相关栏目内容的维护。f)负责中文版网站主站栏目日常信息编辑、更新发布。g)负责网站专题专栏选题、栏目策划,信息编辑发布
46、工作。3)流媒体工程师主要职责:负责编辑、录制视频并完成在线发布工作。4)网站开发运维工程师主要职责:XXX运维方案第 23 页a)负责软件开发等应用软件相关的运维工作。b)负责对 XXX 现有应用系统进行二次开发工作。5)美工主要职责:(1)负责网站页面设计及专题、专栏页面设计工作。(2)负责网站 LOGO 图片设计制作、页面动画制作等工作。6)英文编辑主要职责:负责英文网站页面及相关栏目内容的翻译、日常信息维护的工作。1.3.4.3 组织机构在运维组织设计中,将重点考虑人员、角色、岗位三个因素。而本次运维项目,XXX 公司将综合职能型组织、矩阵型组织和项目型组织,建立组合型组织架构,既有职
47、能部门完成日常运维工作,又可以为完成各项临时小规模项目开发而设立矩阵型组织或项目型组织。XXX 信息中心和我们共同组建成立“运维联合领导小组” ,由双方相关领导组成,主要进行高层协调,制定战略、划清目标,保障运维工作顺利完成。我们将按照组织机构的工作岗位及角色职责,统筹人力资源,抽调精兵强将,组建专门部门“XXX 门户网站运维部” ,下设工作台、硬件集成支持组、软件集成支持组、软件开发支持组和内容维护组。 “中国 XXX 门户网站运维部”实际派驻不少于 4 人在 XXX 现场,属于“一线”支持人员。疑难问题会商解决、小规模软件开发等将协调公司总部的其他人员参加,如项目中心、研发中心的技术骨干、
48、软件开发工程师等,属于“二线”支持人员。个别问题还会涉及到第三方支持,包括原厂商、合作伙伴、其他专家顾问等,属于“三线”支持人员。“二线”和“三线”支持人员不派驻现场,仅是在运维流程需要的时候才参与其中,流程结束,人员也将退出。(一)故障分级支持针对 XXX 政府门户网站内容管理平台运维服务项目,我们将组建现场一线、XXX运维方案第 24 页公司总部二线、外援三线不同技能和专业水平的服务团队,按照基于 ITIL 的服务流程提供服务。1、一线服务台是面向客户的统一服务接口,负责受理客户提出的服务需求(包括故障申告) ;负责对服务范围内的服务需求(包括故障申告)进行处理和任务分派,并跟踪和反馈处理
49、情况;派驻现场一线的技术支持人员接受故障任务分派后,进行不同岗位的处理和协作。2、二线由公司总部技术专家、技术骨干、软件工程师组成,负责解决现场派驻服务不能解决的问题。 3、三线由第三方供应商、高级技术专家、顾问等组成,负责协助现场服务组处理故障,必要时赴现场处理故障;主动发现、分析和解决问题;负责提供远程监控及按需现场服务中的其他相关服务。(二)技术结构全面运维人员的技术掌握全面,涵盖软硬件整个层面。硬件方面掌握主流多种网络设备、服务器设备、安全设施、存储器设备等;系统软件方面熟悉Windows、Unix、Linux 三大主流操作系统,Oracle、SQL Server、DB2 等大型数据库,WebSphere、WebLogic、Tomcat、IIS 等多种应用中间件;软件开发方面深入掌握 J2EE 和 Net 两大体系,精通 B/S 开发,精通多种语言。(三)关键角色备份运维项目中主要涉及到的技术角色有“硬件集成” 、 “软件集成” 、 “数据管理” 、 “内容维护