收藏 分享(赏)

ITIL服务管理流程手册.doc

上传人:tangtianxu2 文档编号:2851631 上传时间:2018-09-28 格式:DOC 页数:79 大小:2.58MB
下载 相关 举报
ITIL服务管理流程手册.doc_第1页
第1页 / 共79页
ITIL服务管理流程手册.doc_第2页
第2页 / 共79页
ITIL服务管理流程手册.doc_第3页
第3页 / 共79页
ITIL服务管理流程手册.doc_第4页
第4页 / 共79页
ITIL服务管理流程手册.doc_第5页
第5页 / 共79页
点击查看更多>>
资源描述

1、 业务支撑网网管系统规范-服务管理流程分册1中 国 移 动 业 务 支 撑 网 网 管 系 统 规 范服 务 管 理 流 程 分 册中 国 移 动 通 信 集 团 公 司2004 年 4 月业务支撑网网管系统规范-服务管理流程分册2目 录1 综述.32 运维管理流程详述.42.1 事件管理 .42.1.1 事件管理描述 .42.1.2 事件管理目的 .42.1.3 事件管理范围 .52.1.4 相关定义 .62.1.5 流程职责 /角色 112.1.6 主要内容 .122.1.7 流程衡量标准 .132.1.8 流程图举例 .162.1.9 事件信息项 .182.2 问题管理 .192.2.1

2、 问题管理描述 .192.2.2 问题管理目的 .212.2.3 问题管理范围 .212.2.4 相关定义 .212.2.5 职责 /角色 252.2.6 主要内容 .252.2.7 流程衡量标准 .262.2.8 流程图举例 .282.2.9 问题信息项 .312.3 变更管理 .322.3.1 描述 .322.3.2 目的 .332.3.3 范围 .332.3.4 相关定义 .332.3.5 职责 /角色 382.3.6 主要内容 .392.3.7 流程衡量标准 .412.3.8 流程图举例 .442.3.9 变更请求信息项 .46业务支撑网网管系统规范-服务管理流程分册32.4 配置管理

3、 .472.4.1 描述 .472.4.2 目的 .482.4.3 范围 .482.4.4 相关定义 .492.4.5 职责 /角色 522.4.6 主要内容 .532.4.7 流程衡量标准 .542.4.8 流程图举例 .552.4.9 常见配置元素属性表 .573 运维管理流程关系和运维支持体系.673.1 运维流程相互关系 .673.2 整体运维支持体系 .694 附录.714.1 ITIL 国际规范简介 714.1.1 ITIL 国际规范简介 .714.1.2 分阶段实施方法 .734.2 名词解释 .761 综述本文作为中国移动业务支撑网网管规范附件之一,将详细描述本期中国移动业务支

4、撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例进行详细说明。运维管理流程包括:事件管理、问题管理、变更管理、配置管理,本附件将分别对其进行定义和描述,包括:管理目的、管理范围、主要内容、职责/角色规划、流程示例等。在本附件最后,还简单介绍 ITIL 的相关内容和实施方法。业务支撑网网管系统规范-服务管理流程分册42 运维管理流程详述根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍。2.1 事件管理2.1.1 事件

5、管理描述事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化。事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况。事件也包括一个用户的请求,如,重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率。所有的事件应该基于相关配置元素的关键等级和影响度进行优先级分

6、类。事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件、与用户和问题管理流程交流、最终解决事件。2.1.2 事件管理目的事件管理流程的主要功能是尽快解决环境中出现的事件,保持 IT 环境的稳定性,其目的包括: 在成本允许的范围内尽快恢复服务 快速响应系统监控产生的故障或用户的电话请求业务支撑网网管系统规范-服务管理流程分册5 在线获得帮助 沟通问题解决的状态 进行事件控制 记录事件 就事件的优先级、紧急性和严重性进行分类 分析、诊断,必要时进行升级 监视,并结束事件 支持业务运行 对业务应用提供二级支持 解答有关如何使用的问题 记录关于新服务的需求 记录关于改变的请求 提供一个

7、与业务部门的日常接口 提供关于服务状态的信息更新 新服务的报告 关于即将到来的新服务或事件的通知 进行事后回顾 提供 IT 管理信息 人力利用情况 服务可用性 产品质量 支持效率 供应商服务情况2.1.3 事件管理范围 在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相关的如下事件: 申告 故障业务支撑网网管系统规范-服务管理流程分册6 咨询 业务处理 维护作业工科事件的产生有两类: 由监控管理平台自动发现并产生的告警事件 由用户/IT 维护人员报告的事件但不包括: 外部用户汇报的事件 在开发和测试环境中的设备或系统产生的事件 “事件管理”流程不一定必须找到问题发生的根本原因,

8、其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,提高服务的可用性。2.1.4 相关定义 重分配规则事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素。一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件。 事件性质根据移动的业务要求和管理要求,按照事件性质定义如下六类事件:性质 描述申告 针对 BOSS 系统的 IT 用户投诉故障 指因 BOSS 系统错误或非正常因素由监控管理平台发现的告警事件咨询 指对系统操作、业务流程等方面的求助和询问业务处理 指需要运维人员进行后台数据处理的要求维护作业 指运维人员的日常维护作业或临时进行的维护作业其他 其他

9、性质的事件。 事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型。帮助台的事件来源可业务支撑网网管系统规范-服务管理流程分册7以包括以下:来源 描述用户 来自 IT 用户的事件可以有以下几种记录方式: 电话/邮件/传真-来自用户/IT 维护人员报告的事件 自助开单-用户/支持人员发现问题,直接在服务台系统客户端开单 客服平台-来自客服平台的事件 其他- 其他方式进入帮助台的事件监控管理平台监控管理平台发现的告警事件,通过与服务管理平台接口发送告警信息到服务管理系统中 事件优先级优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所示:事件的

10、优先级分两个层面来定义和确认: 帮助台帮助台在接到来自监控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。如果为紧急事件,立即升级到一线。对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别。帮助台人员可参考下表确定事件优先级:编号 优先级1 紧急2 高3 中4 低业务支撑网网管系统规范-服务管理流程分册8本次事件所对应 CI 的关键级别事件优先级1 2 31 紧急 高 中2 紧急 中 低故障3 高 低 低申告 高 中 低事件性质咨询/业务处理/维护作

11、业中 低 低 一线一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制。确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表:优先级 紧急 高 中 低解决时限(小时)4 8 24 48 事件的升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员:时间优先级即时响应 +15 分钟 处理时

12、限 30% 处理时限 40% 处理时限紧急 A B D E F - -高 A B C D E中 A B C - D低 A B C - -升级组群:A 帮助台 B 一线支持人员业务支撑网网管系统规范-服务管理流程分册9C 二线支持人员D 事件经理E 管理层F 集团公司各省可以根据业务的实际情况调整升级标准。 事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类。各省市根据自己的情况决定是否要定义到第三层。下表为事件分类表举例:类别 子类 条目网络通讯系统服务器基础架构存储系统

13、操作系统数据库中间件双机热备软件系统软件系统监控软件采集计费结算业务客服业务支撑网网管系统规范-服务管理流程分册10业务管理账务管理账务处理一级 BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他 事件状态代码事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下:事件状态代码 描述新建 新开事件记录分配 事件在帮助台一线处理 一线支持人员已接手处理事件 二线处理 二线支持人员已接手处理事件供应商处理 由供应商处理已解决 事件已找到解决方案关闭 确认解决方案,事件得以关闭 事件结束代码事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下:事件结束代码 描述暂时

14、解决 用变通办法暂时解决帮助台 由帮助台人员成功解决已解决一线解决 由一线人员成功解决业务支撑网网管系统规范-服务管理流程分册11二线解决 由二线人员成功解决第三方解决 由第三方成功解决其他 包括消失,误操作,可忽略等 处理是否超时事件超时代码 描述未超时 事件最后时限范围内结束超时 事件未能在最后时限范围内结束2.1.5 流程职责/角色事件管理流程主要分为以下几个职责/角色,分别简述如下: 事件经理 作为事件流程的负责人,负责制定流程的规则、策略、步骤 调度资源,协调解决跨小组、部门的事件 指导日常操作,确保流程的执行符合预定的要求和规则 建立流程的衡量指标和报表 与用户、服务商和管理层交流

15、流程的使用情况 确认和实施对流程的变更/改进计划 帮助台人员 在指定的响应时间内响应所有帮助台热线电话、邮件、传真等事件报告 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等 为事件进行适当的分类、为事件分配优先级等属性 尝试使用工具、初步诊断、分析相关信息等方式解决问题 如果帮助台不能解决这个事件,应当将事件分配给最合适的一线支持小组/人员来处理 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展 与用户确认事件解决方案,关闭事件 一线支持人员业务支撑网网管系统规范-服务管理流程分册12一线支持人员负责提供对帮助台无法解决的事件

16、进行快速有效的分析并提出解决方案以尽快恢复服务,并在必要时提供现场支持。 验证事件的描述和信息,进一步收集相关信息 决定需要采取何种措施恢复服务并实施有效的行动 必要时提供现场支持 根据优先级提供有效的解决方案 已解决的事件转回帮助台,由帮助台关闭事件 实施事件解决方案 更新事件解决信息,已解决的事件转回帮助台,由帮助台关闭事件 如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理 二线支持人员二线支持人员是相关问题领域的专家。负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。各省可以考虑按照所维护的应用、系统进行分组,如,网络组、主机组等。 进

17、行事件的深入调查研究 根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动 必要时引入供应商的支持 在系统中更新事件根源和最终解决方案 更新事件记录,确保事件状态代码真实反映事件状态。 及时提供有效解决方案 与其他小组合作,确定解决方案 已解决的事件转回帮助台,由帮助台关闭事件 如果二线不能在解决时限内解决这个事件,应当将事件进行升级2.1.6 主要内容事件管理流程始于事件的探测和报告,结束于事件的解决。该流程包含下述主要内容: 事件接收和记录这个环节是事件管理流程的起点。所有用户或系统报告的IT 事件必须由此步骤开始。业务支撑网网管系统规范-服务管理流程分册13此步骤的目的是在事

18、件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。 分类和在线支持事件可以是一个服务请求、信息请求或服务故障,对于每个事件,需要确立优先级、影响度、和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。该环节的关键是需要知识库支持和正确的事件分派。 调查和诊断若在线支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时将使用多名技术员以寻求解决措施。 解决和恢复技术人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮

19、助台通知用户解决的结果,并得到用户的确认。 紧急事件和事件升级对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理,并同时上报给集团公司,由事件经理决定紧急处理的方式,确保其得到最快速的解决。当事件处理超过预期时限,将自动升级或由运维人员升级,以引起相关人员和管理人员的重视和参与。 结束事件当用户确认事件解决后,此时可结束该事件,并在必要时更新知识库。若用户对此解决方案不满意,则对该事件继续进行处理,不能关闭。2.1.7 流程衡量标准事件管理流程的主要衡量指标如下: 事件记录数量,可按照部门、事件分类等分别统计 事件关闭的数量,可以按照优先级,或者按照分类分别统计 事件成功

20、关闭的数量 规定时间内解决的事件数量/百分比业务支撑网网管系统规范-服务管理流程分册14 帮助台解决率 事件解决的平均时间,可以按照事件分类统计 超时的事件数量,可以按人员、组别统计统计报表 事件记录的数量,可按照事件分类、事件性质、事件优先级等分别按月、周、日汇总统计该时间段内创建的事件记录数量故障 申告 咨询 业务处理 维护作业 其他紧急高 中 高 中 低 中 低 中 低 中 低 紧急高 中 低网络设备服务器存储系统计费结算客服 处于各状态的事件数量,可按事件来源、事件分类、事件状态实时汇总事件记录数量新建 分配 一线处理 二线处理 供应商处理 已解决 关闭网络设备服务器存储系统计费业务支

21、撑网网管系统规范-服务管理流程分册15结算客服 事件关闭的数量,可按事件来源、事件分类、事件结束代码等分别按月、周、日汇总统计该时间段内创建的事件记录的关闭数量成功解决 可忽略事件 后续操作解决 部分解决部门1监控系统1成功解决 可忽略事件 后续操作解决 部分解决网络设备服务器存储系统 按时、超时解决的事件数量/百分比,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决数量帮助台 一线 二线 第三方按时 超时 按时 超时 按时 超时 按时 超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比部门1监控系统1业务支撑网网管系统

22、规范-服务管理流程分册16帮助台 一线 二线 第三方按时 超时 按时 超时 按时 超时 按时 超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比网络设备服务器存储系统 各角色事件解决率,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决率帮助台 一线 二线 第三方部门1监控系统1帮助台 一线 二线 第三方网络设备服务器存储系统2.1.8 流程图举例如下是事件管理的逻辑示意图:业务支撑网网管系统规范-服务管理流程分册17事件管理逻辑流程帮助台一线支持省公司I T 用户集团公司二线支持事件经理1 0 0 . 2?优先级最高 1

23、 0 0 . 6?解决了吗 1 0 0 . 9解决了?吗 YNYNNYY第三方1 0 0 . 1 2?解决了吗 1 0 0 . 1 3需 要第三方?支 持 NNY1 0 0 . 1 4?超出时限 YN用户报告事件系统产生事件1 0 0 . 1 创建事件记录并分类1 0 0 . 5尝试解决1 0 0 . 7事件转发至 一线1 0 0 . 1 6确认并关闭事件通 知 事件 经 理通知 事件经 理1 0 0 . 1 0事件转发至二线1 0 0 . 8 .检 查 事件 信 息并 解 决1 0 0 . 1 1调 查 诊断 并 解决 事 件1 0 0 . 1 5 .技术支持Y上报集团1 0 0 . 4?优

24、先级最高 Y e s1 0 0 . 3确认优先级NY流程说明序号 步骤名称 责任人 输入 说明 输出100.1 创建事件记录并分类 帮助台事件特征描述接受从 IT 用户或监控管理平台报告的事件,在帮助台系统中产生新服务记录,填入相关信息。并对事件进行分类,根据设定标准进行分类和分优先级,设置相关属性。事件记录100.2 优先级最高? 帮助台事件记录根据事件相关的配置元素 CI 的关键级别。确定事件的优先级是否最高,如是立即升级到一线支持人员,否则尝试解决。优先级确定结果100.3 确认优先级别 一线事件记录 一线支持人员根据事件相关配置元素和其他相关信息确定该事件是否确属优先级最高已确定优先级

25、的事件记录100.4 优先级最高? 一线已确定优先级的事件记录如果优先级确实最高,则立即升级到事件经理,并通报集团公司,并立即开始处理,如不是,则返回帮助台N/A通知事件经理 事件经理 事件记录 最高优先级事件必须立即通知事件经理,由事件经理决定是否由原处理人按照原流程执行,还是需要 紧急解决方案业务支撑网网管系统规范-服务管理流程分册18采取必要手段干预(例如:启动危机处理流程、会议等)。上报集团 集团 事件记录 紧急事件必须上报集团公司(并在事件处理过程中的每个状态变化点将最新事件记录上传到集团公司) 紧急事件100.5 尝试解决 帮助台 事件记录 通过查询知识库,尝试电话支持 解决方案1

26、00.6 解决了吗? 帮助台 N/A 如果解决了,则进入 100.16,确认并关闭事件;如果不能解决,进入 100.7,转发至一线。 N/A100.7 事件转发至一线 帮助台 事件记录 选择适当的一线人员,将事件转发 转发的事件100.8 检查事件并解决 一线 事件记录 检查事件信息,寻求解决方案 解决方案100.9 解决了吗? 一线N/A 如果解决,则将解决方案记入事件记录,并发还帮助台,进入 100.16;如果不能解决,则需在事件记录中说明原因,转发二线N/A100.10 事件转发至二线 一线 事件记录 选择适当的二线人员,将事件转发 转发的事件100.11 调查诊断并解决 二线 事件记录

27、 进行进一步调查分析,找出解决方案 解决方案100.12 解决了吗? 二线N/A 如果”是”,则将解决方案记入事件记录,发还帮助台,进入 100.16;如果”否”,则转入 100.13。需要供应商支持?N/A100.13 需要第三方支持? 二线N/A 判断是否需要引入第三方(第三方包括厂商和其他部门的支持人员):“是”,转入 100.15;“否”,转入 100.14N/A100.14 超出时限? 二线 N/A 如果超出处理时限,必须及时通知事件经理 N/A通知事件经理 事件经理 N/A 事件经理应当特别关注超时的事件,并帮助协调资源,监督事件尽快解决 N/A100.15 技术支持 供应商支持请

28、求供应商得到通知后,应参与事件的解决,并提出解决方案,由二线人员监控供应商的响应速度和处理速度。解决方案100.16 确认并关闭事件 帮助台已解决的事件帮助台应与用户确认是否接受解决方案,如果用户认可,则可关闭事件,如果用户不能接受,则发还处理人员,继续处理。关闭的事件记录2.1.9 事件信息项本规范规定事件管理流程必须包含如下事件信息项:信息项 说明 填写方式事件流水号 工单号码 系统生成报告人信息 本次事件报告人的联络信息,包括: 姓名 省/分公司根据报告人的搜索代码,自动获取CMDB 中报告人信息业务支撑网网管系统规范-服务管理流程分册19 部门 电子邮件 办公电话 手机/BP生成时间

29、在帮助台生成事件记录的时间 系统生成地点 事件发生的地点 -发生时间 事件发生的实际时间 -事件性质 从事件所属性质的角度来确定其处理流程,如申告、故障、求助、业务处理、维护作业等。-事件来源 指事件工单产生的途径,有人工产生、系统自动产生两类。 由监控管理平台自动产生的,可自动填写事件优先级 事件优先级决定了事件的解决时限和处理次序,通过综合衡量配置元素的关键级别和其他相关信息得出。-事件分类 从事件从属的系统或技术架构的类型来进行分类,如数据库,服务器等。-事件标题 事件的标题 由监控管理平台自动产生的,可自动填写事件描述 对于整个事件内容的详细描述 由监控管理平台自动产生的,可自动填写事

30、件解决确认人 在帮助台得到用户确认的有关人员 -事件状态 在事件整个生命周期中的不同状态 系统生成分配对象 被分配的技术支持组和人员 -事件日志 反映事件处理过程中的事件处理信息,包括人员,时间等信息-是否超时 事件处理时间是否超出解决时限 系统生成解决时间 事件得到解决的时间 -解决方案描述 事件解决方案的描述 -事件结束代码 根据事件结束的不同方式赋予不同的结束代码 -2.2 问题管理2.2.1 问题管理描述问题是一个或几个已暂时处理但根本原因尚不明确的事件, 许多事件往往是由同一个问题引起的。问题的来源主要有以下几种:业务支撑网网管系统规范-服务管理流程分册20 已经关闭的事件,经过回顾

31、分析后,可能形成一个问题; 重大事件,虽然经过紧急处理恢复服务,但未找到根本原因,也形成一个问题; 对于趋势性事件的分析,形成问题。问题管理流程的根本目的是消除或减少事件的发生, 将 BOSS 系统内部缺陷导致的业务事件或问题的负面影响降到最低限度,此流程分析发生在生产环境的事件(常常是已关闭的事件记录),确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求(RFC) 、变通方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。问题通常具有以下特征中的一个或全部: 一组具有一定关系的已结束的事件 一个重大或紧急事件

32、(事件处理结束后定义为问题,由问题管理找出根本解决方案)问题管理与事件管理之间的差异问题管理与事件管理并不相同,它的主要目的是查明事件的潜在原因,并制定随后的解决方案和预防方法。在大多情况下,此目的与事件管理目的之间有一定冲突,因为事件管理的目的是尽快地恢复客户服务,通常是通过实施替代方案,而非确定一个永久性的解决方案(例如为了尽可能地预防未来可能出现的事件,寻求改善信息技术基础架构的结构)。就问题管理而言,对潜在原因的调查可能需要一定的时间,找到解决方案的速度是次要的考虑因素,但是预防了问题的再次发生。问题管理流程可以按照不同领域的问题(如网络问题,或应用问题等)由相关组的技术支持专家来执行

33、,原则上这些专家可以是事件管理的二线支持专家,他们在负责接受来自一线支持人员(帮助台员工)的支持请求的同时,也负责对以往事件进行分析,找出事件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使此类事件不再发生;同时,也要从发生的事件中找出事件的发展趋势或潜在可能发生的问题,从而预先采取措施,保证 IT 服务的正常化。问题的根本原因找出后即成为已知错误, 对已知错误实施解决方案, 从而解决问题。所以问题管理流程的输出有: 变更请求 变通方法业务支撑网网管系统规范-服务管理流程分册21 根本解决方案 预防性措施 已知错误2.2.2 问题管理目的问题管理流程在 IT 部门设立的主要目的是分析

34、已被列为问题的事件(一组或一个)的根本原因,然后找出解决方案。包括: 分析并确定事件的根本原因,以防止再次发生 主动提供预防性措施 提高 IT 服务的可靠性 降低 IT 支持成本 提高 IT 部门的整体形象和名誉2.2.3 问题管理范围 问题管理范围是对所有 IT 生产环境中未根本解决的问题和已知错误进行管理,并采取主动性预防措施来降低事件数量,重大或紧急事件在处理完后也被定义为问题以分析其产生的根本原因。一般对 IT 服务影响最大或最占用支持人员资源的事件优先进行分析。 问题管理范围不包括处于开发或测试环境的系统和应用。2.2.4 相关定义 优先级需要确定解决方案的紧急程度,本规范定义如下问

35、题优先级:编号 优先级代码解释1 紧急 关键级别为 1 的业务中断或将中断,影响一个以上关键地区或半数以上地区2 高 关键级别为 1 的业务中断或将中断,影响一个以上地区业务支撑网网管系统规范-服务管理流程分册22但未达到紧急标准3 中 关键级别为 1 的子业务或半数以上子业务中断或将中断4 低 未达到以上标准 问题状态代码问题在整个生命周期中的不同状态。本规范定义如下问题状态: 问题分类 (classification)从问题从属的系统或技术架构的类型来进行分类。本规范定义如下问题分类:类别 子类 条目网络通讯系统服务器基础架构存储系统操作系统系统软件数据库编号 代码 描述1 已登记 问题登

36、录到系统中2 处理中 问题正在处理过程中3 拒绝 问题分派被拒绝4 已知错误 问题根本原因已找出5 已有解决方案 解决方案已找到6 RFC 已提交 RFC7 结束 问题已结束8 回顾 问题已做回顾业务支撑网网管系统规范-服务管理流程分册23中间件双机热备软件系统监控软件采集计费结算客服业务管理业务账务管理业务支撑网网管系统规范-服务管理流程分册24账务处理一级 BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他 问题性质根据问题的不同来源进行分类。本规范定义如下问题性质:编号 代码 备注1 升级事件 从事件管理中升级的事件2 系统构架问题 技术专家提出的问题3 主动防范性 分析事件

37、记录找出的问题 问题结束代码问题结束代码: 根据事件结束的不同方式赋予不同的结束代码。本规范定义如下问题结束代码:业务支撑网网管系统规范-服务管理流程分册25编号 代码 说明1 根本解决 找出问题的根本原因,并得到解决方案,成功解决2 变通方法 未找出根本原因,但有临时解决方案作为变通方法3 没有解决 问题无法解决4 消失 问题无法再现2.2.5 职责/角色问题管理流程主要分为如下几个职责角色,分别简述如下:问题经理 整体上对流程负责,确保流程的有效执行 定期评估流程,制定流程改进计划 确定或定义问题,并确保有效协调资源 监视问题的诊断,分析和处理过程 提出实施解决方案的变更请求 定期制定IT

38、 问题报表,提供正确决策信息问题分析专家 接受问题经理分派过来的问题 分析和诊断问题,确定根本原因 确定和测试解决方案 协助事件支持人员进行重大或紧急事件的处理2.2.6 主要内容问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因、找出解决方案以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下:业务支撑网网管系统规范-服务管理流程分册261. 分析事件 定期分析事件,找出潜在问题2. 生成问题记录 在系统中生成问题记录并把所有相关事件与此记录关联起来 重大或紧急事件处理完后定义为问题 技术支持专家在日常运维中发现的问题

39、 主动性防范3. 分派 根据问题内容将问题记录分派给适当的技术小组。4. 根本原因分析 被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。5. 更新已知错误 问题记录必须被更新以反映它是已知错误状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来(如果需要添加到知识库中)。6. 提出变更请求 对问题的解决方案进行评估,通过提出变更请求(RFC)以对该方案进行测试和实施。如果 RFC 没有被批准,问题记录保持为已知错误,它们可以被事件支持人员在事件再次发生时参考借鉴。7. 关闭 一旦找出问题根本原因,并实施

40、了解决方案,确认已解决了问题,问题记录可以关闭。8. 事后回顾 问题必须进行回顾以找出改进机会或总结预防性措施。包括改进事件监测、找出技能差距和文档资料改进等。2.2.7 流程衡量标准问题管理流程的主要衡量指标如下: 每一阶段内的已知错误数量 在每一阶段内未结的问题记录 每一阶段内未了结的由问题引发的RFC数量 在IT环境中存在的临时性变通办法数量统计报表业务支撑网网管系统规范-服务管理流程分册27问题的数量,可按问题分类、问题性质、优先级、影响度等分别按月、周、日汇总统计该时间段内创建的问题记录数量优先级 影响程度紧急 高 中 低 高 中 低 无网络设备服务器存储系统优先级 影响程度紧急 高

41、 中 低 高 中 低 无升级事件系统构架问题主动防范性处于各状态的问题数量,可按问题分类、问题性质、问题状态分类实时汇总已登记 处理中 拒绝 已知错误已有解决方案RFC 结束 回顾网络设备服务器存储系统已登记 处理中 拒绝 已知错误已有解决方案RFC 结束 回顾升级事件系统构架问题主动防范性 问题关闭的数量,可按问题分类、问题事件、问题结束代码等分别按月、周、日业务支撑网网管系统规范-服务管理流程分册28汇总统计该时间段内创建的问题记录的关闭数量根本解决 变通方法 没有解决 消失网络设备服务器存储系统根本解决 变通方法 没有解决 消失升级事件系统构架问题主动防范性2.2.8 流程图举例如下是问

42、题管理的逻辑示意图举例:业务支撑网网管系统规范-服务管理流程分册29问 题 管 理 逻 辑 流 程事件管理人员变更管理人员省公司管理层问题经理问题分析专家集团公司3 0 0 . 1分 析事 件3 0 0 . 7推荐 解决方案 /变通 方法3 0 0 . 9提交变更请求/ 监视变更实施3 0 0 . 6分析根本原因在必要时升级到管理层接受吗? YN需要变更 吗?NY3 0 0 . 2创 建问 题记 录3 0 0 . 3问 题优 先级 和分 类3 0 0 . 4分 派给 工作 组/监 视3 0 0 . 5拒 绝问 题3 0 0 . 1 0关闭 问题记录3 0 0 . 1 1回 顾3 0 0 . 8

43、安 排实 施解 决方 案上报集团公司Y评估/ 实施变更优先级最高吗?N事件记录升级到管理层关于该逻辑流程的简单描述如下:序号 步骤名称责任人输入 说明 输出300.1 分析事件问题经理事件记录定期分析回顾事件,主动发现潜在问题。分析事件的频度和严重度,和其他的相关因素进行关联,如CI 位置、宕机时间、特定用户、硬件平台、软件版本和一天中发生的时间等。具体的做法可以是一周开一次由主要事件支持人员参加的例会,讨论上周发生的 IT 事件。分析结果300.2 创建问 问题 分析结 把找出的问题记录到系统中去,并进行详细说明 问题记业务支撑网网管系统规范-服务管理流程分册30题记录 经理 果 录300.

44、3 问题优先级及分类问题经理问题记录根据问题的实际情况,给其分派一个优先级代码和影响度代码(必要时进行升级,如优先级最高时 ),并根据拟定的分类原则给问题赋予适当的类别代码并根据问题具体情况设定一个解决时限。已分类问题优先级最高吗?问题经理已分类问题如果问题优先级为最高,由问题经理立即把该问题上报到集团公司,并把该问题升级到管理层N/A300.4 分派给工作组/监视问题经理问题记录初步判断问题的可能原因,把问题分派给相应工作组或个人,并监视问题的解决过程,如有必要(如超过解决时限)启动升级流程已分派问题在必要时升级问题经理N/A 问题经理在监视问题解决的过程中,根据具体情况可把该问题升级到管理

45、层,如问题超出解决时限时N/A判断是否接受?问题分析专家N/A 问题分析专家对问题进行初步分析,以决定接受与否。如拒绝转向 300。6 继续,如接受转向 300。7继续。N/A300.5 拒绝问题问题分析专家已分派问题问题分析专家根据判断发现问题应该由其他组分析解决,就把问题发回问题经理,注明拒绝理由并推荐组名。转向 300。4 继续。已拒绝问题300.6 分析根本原因问题分析专家已接受问题如果问题确应由本人或本小组解决,接受分派的问题,然后调查诊断问题,如有必要成立问题分析小组,举行问题根本原因分析研讨会议并确定问题的潜在原因。必要时更新问题状态。问题根本原因300.7 推荐解决方案/变通方法问题分析专家问题记录、问题根本原因找出问题的根本原因后,根据实际情况制定变通方法或根本性解决方案,并确保这些方法或方案将降低或消除事件的发生率或影响度,更新问题记录。问题解决方案问题变通方法300.8 安排实施解决方案问题经理问题解决方案问题变通方法根据问题专家提供的解决方案或变通方法, 计划并实施解决方案以解决问题解决方案实施计划判断是否需要问题经理N/A 判断实施上述解决方案是否需要进行变更,如不需要变更转向 300。10 继续,如需要变更转向 300。9N/A

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报