1、1,信息系统基础设施与安全,尚邦治2011.09.26,三级综合医院评审标准实施细则(2011年版)(卫办医管发2011148号),6.5.4.2 加强信息系统运行维护。 C1.有信息网络运行、设备管理和维护、技术文档管理记录;2.有信息系统变更、发布、配置管理制度及相关记录3.有信息系统软件更新、增补记录;4.有信息值班、交接班制度,有完整的日常运维记录和值班记录,及时处置安全隐患。,三级综合医院评审标准实施细则(2011年版)(卫办医管发2011148号),B1.有信息系统运行事件(如系统瘫痪)相关的应急预案并组织演练,各部门各科室有相应的应急措施,保障全院运营,尤其是医疗工作在系统恢复之
2、前不受影响;2.有根据演练总结开展持续改进的方案和措施。A有完善的监控制度与监控记录,及时处理预警事件,定期进行信息系统运行维护评价和改进方案,并组织落实。,医院信息平台总体架构,信息系统运行维护信息系统安全等级保护信息系统机房建设信息系统灾备,1.1 信息系统运行维护概述,1.1.1信息系统运维概念 信息系统生命周期中,信息系统建设时间约占生命周期的20%,信息系统运行时间约占生命周期的80%。医院信息系统要求长期稳定运行。要保障医院信息系统要求长期稳定运行,必须做好运行维护工作。信息系统运行维护工作的目的是通过日常的简单工作,达到:减少信息系统发生故障的次数;发生故障时快速排除故障;延长信
3、息系统使用时间。,1.1 信息系统运行维护概述,海恩法则海恩法则是德国飞机涡轮机的发明者德国人帕布斯海恩提出一个在航空界关于飞行安全的法则,海恩法则指出: 每一起严重事故的背后,必然有29次轻微事故和300起未遂先兆以及1000起事故隐患。海恩法则强调两点:一是事故的发生是量的积累的结果;二是再好的技术,再完美的规章,在实际操作层面,也无法取代人自身的素质和责任心。,1.1 信息系统运行维护概述,墨菲定律墨菲定律源自一个名叫“墨菲”的美国上尉。墨菲定律:只要存在发生事故的原因,事故就一定会发生,而且不管其可能性多么小,但总会发生,并造成最大可能的损失。这就告诉我们,对任何事故隐患都不能有丝毫大
4、意,不能抱有侥幸心理,或对事故苗头和隐患遮遮掩掩,而要想一切办法,采取一切措施加以消除,把事故案件消灭在萌芽状态。 根据“墨菲定律”:一、任何事都没有表面看起来那么简单;二、所有的事都会比你预计的时间长;三、会出错的事总会出错;四,如果你担心某种情况发生,那么它就更有可能发生。,1.1 信息系统运行维护概述,1.1.1信息系统运维概念运维内容可归纳为如下3个方面:1、信息化基础设施运维:以硬件资产和软件资产可用为目的,包括支撑系统正常运行的网络系统、主机系统、安全系统、存储系统和机房专用设施和数据库等的运维服务;,1.1 信息系统运行维护概述,1.1.1信息系统运维概念运维内容可归纳为如下3个
5、方面:2、应用系统运维:以系统整体可用和为业务提供可靠服务为目的,包括业务和应用的技术运维,以及信息内容服务运维等;3、信息资源维护类:以深化信息资源共享利用为目的,包括信息资源获取、处理、存储、传输和共享使用等。,1.1 信息系统运行维护概述,1.1.2信息系统运维框架,1.1 信息系统运行维护概述,1.1.3 信息系统运维管理体系,1.信息系统运行维护概述,1.3 信息系统运维管理体系1.3.1管理目标层IT运维管理体系的建立要面向业务,以业务需求和目标为出发点,制定IT运维管理的远景、目标和策略。确保在目标层面,IT与业务相融合。,1.1 信息系统运行维护概述,1.1.3.2组织模式层基
6、于IT运维管理目标,建立科学的IT运维管理机制。结合组织的实际,将IT服务相关的全部活动进行统一决策与规划,确定和规范IT运维管理体系运行的管理方式和与之相配套的组织机构设置,形成集中统一的IT运维管理机制,合理配置IT运维管理资源,实现对客户的端到端服务。,1.1 信息系统运行维护概述,1.1.3 信息系统运维管理体系1.1.3.3制度规范层依据管理模式,从管理角度制定的用来规范IT运维和服务工作的准则,建立IT运维管理过程中各个参与要素(人、流程、工具)的管理制度与工作流程,建立考核评价体系,规范运维费用,实现精细化管理。,1.1 信息系统运行维护概述,1.1.3 信息系统运维管理体系1.
7、1.3.4技术支撑层技术支撑体系是IT运维管理的实现手段,制度规范体系的具体落实有赖于技术支撑体系的技术支持。需要建立针对面向业务客户的IT服务请求响应窗口和面向技术支持人员的体系运行管理窗口;建立负责IT运维管理流程运行的流程管理平台和负责IT基础设施和业务应用系统运行监控的集中监控管理平台;根据不同类型IT 基础设施和业务应用系统的管理职能,建立技术管理子系统,建立知识库、配置库、报表及日常操作等共享支持子系统和为业务管理提供服务的业务运维管理子系统。,1.2 运维管理要求,IT运维的责任是什么? 第一是要使现在的IT工具化,在用到IT的时候,它可以作为一个工具来提供给其他部门使用;第二是
8、要安全,要让所有人使用的时候,不需要担心他的信息内容会被人窃取或者遭到别人的恶意破坏;第三是要可靠,不要因为它的可靠性不够而发生宕机或者系统崩溃;,1.2 运维管理要求,IT运维的责任是什么?(续)第四是可用,IT能够被用户所理解,能够很容易地使用;第五是透明,这是一个很难做的工作,要做到人们只关心自己的业务,而不在乎IT系统;第六是可控可管理,这也就是资产要保值增值,最终目标要实现IT的充分利用,发挥IT的最大价值。,1.2 运维管理要求,1.2.1运维管理制度 医院需要建立完善而成熟的IT运维管理体制,通过运维管理的制度化、运维内容的明细化、运维服务流程化,建立全新服务标准。使其根据院内用
9、户的需求,建立能够快速响应并适应医院的规范化、高效性发展的运维模式,不断提高IT运维质量,实现高效运维,提升医院内IT服务满意度。,1.2 运维管理要求,1.2.2 运维管理机构随着医院信息化的范围不断扩大,集中的运维管理需科学的划分机构职责,并细化运维内容。根据实际经验,医院信息化系统的运维管理机构可划分为五个部分:服务台二线运维部三线运维部硬件维修部网络部,1.2 运维管理要求,1.2.3 运维人员管理运维管理岗位技能划分如下:一线运维工程师二线运维工程师网络工程师信息安全工程师维修工程师,1.3 信息系统移交,信息系统建设阶段完成后,将转入运行维护阶段。为了做好运行维护工作,需要很多建设
10、过程中产生的文档材料。在信息系统建设阶段完成后,需要做信息系统移交工作。信息系统移交的内容主要是信息系统设计文档,信息系统实施过程中产生的文档,硬件子系统文档,网络子系统的文档,系统软件文档,应用系统文档等。,1.3 信息系统移交,1.3.1网络系统网络拓扑图网络拓扑图给出了网络设备之间的逻辑关系。在了解一个网络时,首先要看网络拓扑图。通过网络拓扑图可以看出网络交换机之间的关系,可以看出核心交换机,汇聚交换机,接入交换机。可以看出核心交换机与汇聚交换机连接情况,可以看出汇聚交换机与接入交换机的连接情况。,1.3 信息系统移交,设计的拓扑图,1.3 信息系统移交,实际测试的拓扑图,1.3 信息系
11、统移交,交换机命令配置清单交换机配置清单是配置交换机命令序列。每台交换机都要有相应的交换机配置清单。交换机配置清单包括交换机初始化配置,基本功能配置,VLAN配置,交换机安全配置,路由配置等。端口对应表配线架表,1.3 信息系统移交,IP地址表VLAN表设备情况说明,1.3 信息系统移交,设备标签说明。按照标签使用规范明确定义网络设备标签名并对应做好标签标识工作。应急策略或方案,1.3 信息系统移交,常见问题集。对网络设备运行过程中出现的常见问题提供解决方法或技术支持。维护联系方式。网络设备维护单位及相应维护人员联系方式,以及网络设备相应维护等级及响应时间。防火墙配置清单路由器配置清单,1.3
12、 信息系统移交,1.3.2服务器与存储设备服务器与存储设备配置说明。对服务器硬件生产厂家、型号、CPU核数、CPU芯片数量、内存容量、硬盘单盘容量、硬盘数量、RAID卡情况、RAID方式、HBA卡情况、电源功率及数量、BISO版本、服务器数量,存储设备控制器缓存容量、存储设备控制器数量、硬盘单盘容量、硬盘数量、对于FC SAN的光通道交换机配置情况等进行简要说明。,1.3 信息系统移交,操作手册或维护手册。逻辑关系图。服务器之间关系图或简易拓扑图,服务器与存储设备连接图,服务器与交换机连接图等,用于明确各设备之间依存关系。,1.3 信息系统移交,网口对应表。描述该服务器每块网卡对端交换机连接情
13、况,各网卡IP地址使用及路由信息。设备情况说明。设备硬件配置数据,设备硬件及软件版本说明,购买日期,设备序列号,设备保修状况,设备维保情况等。设备标签说明应急策略或方案常见问题集维护联系方,1.3 信息系统移交,1.3.3系统软件这里系统软件主要是指操作系统、数据库和开发工具。1.3.3.1 操作系统版本说明。描述操作系统主版本号、小版本号及相应补丁情况。用户名及权限最大用户数超级管理员名称及口令加固说明。当前操作系统进行哪些加固工作。说明必须根据操作系统的变化随时修改。配置环境说明,1.3 信息系统移交,1.3.3.2 数据库版本号。描述数据库版本号。配置路径。描述数据库配置路径。数据库日志
14、文件增长规则。描述数据库日志文件增长规则。日志文件路径。描述数据库日志文件访问路径。数据库日志文件增长限制情况说明数据库参数配置情况说明,1.3 信息系统移交,1.3.3.3 开发工具开发工具版本号开发工具访问路径。开发工具软件适合在哪些平台运行说明,1.3 信息系统移交,1.3.4应用系统软件应用软件主要指业务应用软件。应用软件模块表。医疗行业的信息系统是由若干个软件模块组成。在该表中反应了所有软件模块的名称、用途。应用软件各模块配置文件应用软件占用的网络传输层端口表正式库名称调试库名称,1.3 信息系统移交,数据库表清单。一个数据库是由若干个表组成。每个表有其用途。数据库表清单描述了每张表
15、的名称和用途。字段说明。描述各字段名称、数据类型、数据长度,字段属性相应说明以及特殊值含义说明等。后台任务说明数据备份说明。数据库备份说明给出备份任务名称、备份文件存储位置、备份任务启动时间、备份策略、备份周期等。,1.3 信息系统移交,1.3.5安全工具安全工具分为硬件设备和软件。1.3.5.1 硬件设备设备情况说明。对安全设备硬件型号、用途、功能、安全策略、电源功率及软件版本进行简要说明。系统必要性说明安全设计说明维护联系方式常见问题集,1.3 信息系统移交,1.3.5.2 安全软件软件版本号。软件大小说明。描述软件占用存储空间大小。软件授权使用环境配置路径,1.4 信息系统参数,信息系统
16、参数反映了信息系统性能和运行状态。在运维过程中,通过信息系统参数了解信息系统运行状态;根据信息系统参数进行风险评估;根据信息系统参数对信息系统进行调试; 使得信息系统在一个稳定状态下运行。信息系统参数分为静态参数和动态参数。静态参数一般反映了信息系统的性能;动态参数一般反映了信息系统运行状态。以服务器为例,服务器的CPU数量是一个静态参数,它反映的服务器在处理能力方面的性能。CPU利用率是一个动态参数,它反映了服务器处理负荷的大小。,1.4 信息系统参数,1.4.1 服务器和存储设备参数管理1.4.1.1.物理服务器参数服务器生产厂家、品牌、型号服务器序列号:每台服务器有一个生产厂家给的唯一生
17、产序列号。用作维修存档。在需要原厂提供维修服务时,需要给维修部提供该序列号。,1.4 信息系统参数,服务器名称服务器CPU芯片数量。反映CPU数量的单位有两个,一个是CPU芯片的数量,一个是CPU内核的数量。经常有些人有意或无意的把CPU芯片数量与CPU内核数量在概念上混肴。服务器CPU核数CPU利用率服务器内存总容量服务器内存条单条容量、内存条数量,1.4 信息系统参数,1.4.1.9、1.4.1.10服务器所连交换机名称、端口号服务器物理网卡数量服务器所连交换机名称、端口号物理服务器IP地址群集IP地址。HBA板卡的通信速率。HBA卡数量。,1.4 信息系统参数,服务器物理硬盘容量服务器物
18、理硬盘RAID方式服务器逻辑硬盘盘符和容量服务器管理IP信息对于小型机,一般都需要用另外的计算机对其进行管理。对小型机进行管理需要通过IP地址登录到小型机上。,1.4 信息系统参数,1.4.2、存储设备参数 1.4.2.4.控制器缓存容量控制器缓存容量存储设备物理硬盘参数。包括单个硬盘容量、硬盘转速、硬盘接口电路类型、硬盘数量等。存储设备总裸容,1.4 信息系统参数,存储设备总有效容量。硬盘经过格式化后其可使用的存储容量要小于标称存储容量。是硬盘的有效存储容量。使用RAID 1模式的存储设备有效存储容量=单盘有效容量*硬盘数量/2。使用RAID 5模式的存储设备有效存储容量=单盘有效容量*(硬
19、盘数量-1)。,1.4 信息系统参数,存储容量划分信息。存储容量划分信息指存储设备划分了几个逻辑硬盘,每个逻辑硬盘的容量。物理链路图物理链路图光纤交换机的zone划分。在一个光交换机连接多个服务器及多个存储单元时,要给光交换机配置好那个服务器访问哪个存储单元。或者说是将交换机连接存储的端口,和某个特定的端口划分到一个区域里,以便实现从端口到存储的连通性。使服务器能够看到存储。光纤交换机使用前应进行zone设置。,1.4 信息系统参数,LUN划分。lun的全称是logical unit number,也就是逻辑单元号。scsi总线上可挂接的设备数量是有限的,一般为6个或者15个,可用target
20、 ID(也有称为scsi id的)描述这些设备,设备只要一加入系统,就有一个代号,我们在区别设备的时候,只要说几号就行了。而实际上我们需要用来描述的对象,是远远超过该数字的,于是我们引进了lun的概念,也就是说lun id的作用就是扩充了target id。每个target下都可以有多个lun device,我们通常简称lun device为lun,这样就可以说每个设备的描述就有原来的target x变成target x lun y了。,1.4 信息系统参数,1.4.2.11.LUN划分(续)lun是一些虚拟的对象。比如一个阵列柜,主机那边看作是一个target device,那为了某些特殊需
21、要,我们要将磁盘阵列柜的磁盘空间划分成若干个小的单元给主机来用,于是就产生了一些什么逻辑驱动器的说法,也就是比target device级别更低的逻辑对象,我们习惯于把这些更小的磁盘资源称之为lun0,lun1,lun2等。对于操作系统,识别的最小存储对象级别就是lun device,这是一个逻辑对象,所以很多时候被称之为逻辑设备。,1.4 信息系统参数,1.4.4 网络运行参数网络设备品牌、型号交换机的光口数量交换机光电模块数量交换机的电口数量核心交换机下连端口汇聚交换机、接入交换机上连端口,1.4 信息系统参数,VLAN表。给出了所有VLAN的VLAN ID、VLAN名称、VLAN使用说明
22、等信息。VLAN使用的IP地址段说明核心交换机CPU利用率重要交换机端口数据传输率(流量)防火墙端口使用说明路由器端口IP地址,1.4 信息系统参数,1.4.5 布线参数1.4.5.1线缆桥架图线缆桥架图。线缆桥架图标识了建筑物中桥架的走向和截面尺寸。楼层机房位置图。楼层机房表。标识了各楼层机房的面积、房间号等信息。,1.4 信息系统参数,配线架表。给出了楼号、楼层、房间号、工作区模块号、配线架号、交换机名称、交换机端口号等信息。一般情况下,一个配线架对应一张配线架表。光缆资料。光缆数量,每条光缆类型(OM1、OM3),光缆芯数等信息。光缆布线图。标识了光缆在楼内或园区内的走向。,1.4 信息
23、系统参数,1.4.6 系统软件参数1.4.6.1操作系统参数服务器群集状态。这是一个动态参数。正常情况下服务器群集应该始终是群集中主服务器处于工作状态。主服务器发生故障时,群集操作系统和数据库自动从主服务器切换到备用服务器上,这时群集备用服务器处于运行状态。主服务器发生故障后,应该及时排除故障,然后将群集从备用服务器切换回主服务器上。,1.4 信息系统参数,日志文件。有系统日志文件、安全日志文件、应用日志文件、域控日志文件。日志文件反应了操作系统运行情况。根据日志文件内容可以发现操作系统的故障。,1.4 信息系统参数,1.4.6.2数据库参数全局数据库名称。本服务器上数据库管理系统(DBMS)
24、名称。实例数据库名称。具体使用的数据库名称。实例名称最好不使用全局数据库名称。,1.4 信息系统参数,数据库中索引BLEVEL值。BLEVEL是B-tree索引形式的一部分,与Oracle为搜索某些纪录而减少索引搜索的次数相关联。在一些情况下,BLEVEL需要单独的磁盘命中。如果 BLEVEL大于4,那么建议重建索引。这是一个动态参数。表空间利用率。对于表空间使用率超过90%以上的情况,需要防止应用将表空间涨满。,1.4 信息系统参数,1.4.7 应用软件参数1.4.7.1应用软件模块表医院的信息系统是由若干个软件模块组成。在该表中反应了所有软件模块的名称、用途。1.4.7.2应用软件各模块配
25、置文件1.4.7.3应用软件占用的网络传输层端口表有些应用软件运行中要使用网络传输层得端口号。该表反应了应用软件使用端口情况。,1.4 信息系统参数,1.4.7.4数据库表清单数据库表清单给出了数据库中所有用户表的名称和用途。1.4.7.5数据库表结构数据库表结构给出了数据库中所有用户表中的字段名、字段类型、字段长度、字段位置、字段用途、字段特殊取值范围、字段属性等。,1.5 配置管理,1.5.1 配置管理的概念配置管理流程负责核实IT基础设施和应用系统中实施变更以及配置项之间的关系是否已经被正确记录下来,确保配置管理数据库能够准确地反映现存配置项的实际版本状态。其目的是提供IT基础架构的逻辑
26、模型,支持其它服务管理流程特别是变更管理和发布管理的运作。,1.5 配置管理,1.5.2 配置管理的功能:(1)支持对配置项的登记和管理;(2)支持对配置项属性的记录,如序列号、版本号、购买时间等;(3)支持配置项间关系的建立和维护;(4)支持配置项及其关系的可视化呈现;,1.5 配置管理,1.5.2 配置管理的功能(续)(5)支持对配置管理数据库访问权限的控制;(6)支持对配置项变更的历史审计信息;(7)支持配置项的状态管理;(8)支持针对配置项的统计报表;(9)支持与事件管理、问题管理、变更管理等其他管理流程的集成。,1.5 配置管理,1.5.3 配置管理内容(1)服务器参数(2)存储设备
27、参数(3)网络设备参数(4)系统软件参数(5)应用软件参数1.5.4 配置管理注意事项服务器、存储设备、交换机等在配置前要先列出并明确配置参数清单。配置参数要及时进行更新,1.6 事件与问题管理,1.6.1 事件管理 1.6.1.1 事件管理的概念1.6.1.1.1事件管理定义事件管理(Incident Management) 是IT运维过程中最基本的活动,可以说医院IT运维部门的职责就是处理各类事件(Incidents),事件管理指的是突发事件管理或意外事件管理,处理IT的危机并要从中恢复运转。即在出现事故的时候,能够尽可能地恢复服务的正常运作,避免业务中断,以确保医院IT运维管理最佳的服务
28、可用性级别。,1.6 事件与问题管理,1.6.1.1.2 事件管理相关术语(1)事件(incident),即在医院IT服务中不属于标准操作的,并且能够导致、或者可能导致此医院业务中断或者服务质量下降的任何事件(event)。(2)服务请求(Service Requests),用户想要获得递送、支持、信息或建议的请求,并不属于IT设施设备方面的故障。,1.6 事件与问题管理,1.6.1.1.2 事件管理相关术语(续)服务请求的例子包括:(a)程序功能方面的请求或问题;(b)信息状态查询;(c)账号口令重置;(d)数据提取。,1.6 事件与问题管理,1.6.1.1.2 事件管理相关术语(续)(3)
29、影响度(impact),指就所影响的医务人员或医院业务数量而言,事件偏离正常服务级别的程度。重要事件是指那些对医院业务带来非常严重的事件。而有些时间上极度紧迫的需要解决的事件也应当作重要事件来处理。(4)紧急度(urgency),指解决故障时,对医务人员或医院业务来说可接受的耽搁事件。,1.6 事件与问题管理,1.6.1.1.2 事件管理相关术语(续)(5)优先级(priority),主要基于紧急度和影响度来决定。而对于具有同样优先级事件,可按解决他们需要花费的精力的多少来安排顺序。例如,对医院业务影响不大且容易解决的故障,可先于一个影响较大且需要大量精力解决的故障。,1.6 事件与问题管理,
30、1.6.1.2 事件管理的目标 1.6.1.2.1 事件管理的目标医院IT运维部门事件管理的目的是在尽可能最小地影响医院业务的情况下,使IT系统恢复到正常运行的状况。事件管理需要保留时间的有效记录便于能够权衡并改进处理流程,以及正确提供报告进展情况,并给其他的服务流程提供合适的信息。,1.6 事件与问题管理,1.6.1.2.2 事件管理在整个医院IT服务管理中的作用(1)对整个医院业务来说:更及时地解决事件可减少事件对医院业务的影响;提高医务人员的工作效率。(2)对医院IT部门来说:更有效的使用运维人力,合理安排二线运维任务;记录医院IT服务请求,事后进行运维数据统计分析,为进一步完善事件管理
31、提供数据支持;完善配置信息库;提高医务人员对信息系统的满意度。,1.6 事件与问题管理,1.6.1.3 事件管理的流程,1.6 事件与问题管理,1.6 .1.3 事件管理的流程(续)事件管理流程首先对事件进行分类 ,确定该事件是否为已知事件作出判断 ,并根据影响和紧急度判断该问题的优先级。通过调查和诊断 ,将服务台不能处理的问题迅速转至二线、三线技术支持 ,最后将处理结果反馈回服务台,由服务台告知用户解决方案并关闭本次事件处理流程。在管理过程中,通过“审核”,事件主管将重要或者严重的问题提交上会。在事件“升级”中,对于提交上来的问题分别进行处理。决定进入下一阶段的“问题”、“变更”或“发布”,
32、并指定处理计划和方案。,1.6 事件与问题管理,1.6.1.3.1 服务台接收事件对事件的发现可有以下几种方式 由临床科室用户发现:用户将此事件报告给服务台;自行发现:在运维工作中发现的事件;分配事件编号:系统会自动分配一个唯一的事件编号,在后续沟通过程中可使用通过提供的事件编号来引用事件。记录基本信息:包括时间、用户、地点、处理人员以及受影响的医院业务或硬件配置等信息。,1.6 事件与问题管理,1.6.1.3.2 事件匹配在知识库中检查以前是否发生过类似的事件,如果发生过,则查看解决方案和应急措施。如果新事件与某一问题或某一已知错误内容相匹配,那么就可将事件与这些已知的问题或错误进行关联。1
33、.6.1.3.3 事件转线如果服务台不能在事先规定的时间内解决事件,就要决定应该由二线或三线人员来负责处理该事件。转线时应准确地将事件转到相关的负责人和部门。运维问题应转给二线的维护、网络或维修组,系统问题及程序BUG应转给三线研发组;这种转线是按已分配好的事件所属的类别来进行的。合理的事件处理转移机制对有效的事件管理非常重要。,1.6 事件与问题管理,1.6.1.3.4 事件整理事件主管每天监督事件记录的完整性和及时性,并对三级以下人员进行评分,对于不完整或者记录不清楚的事件记录,及时催促相关人员完成;事件主管在整理事件记录的过程中,对于存在问题的事件或是有可能引起其他隐患的事件进行上会处理
34、,并于次日早会汇报并讨论解决方案。,1.6 事件与问题管理,1.6.1.3.5 生成问题或变更无需上会的事件,每天由事件主管在进行事件整理的时候即对事件进行归档;上会的事件在早会讨论后,事件主管应及时对上会事件进行相应处理,提交问题、变更或归档;对于需要给用户回复或向用户解释的事件,根据早会讨论的结果反馈给用户。,1.6 事件与问题管理,1.6.1.3.6 事件分析定期对一段时间内的事件记录进行统计和分析,统计出该段时间内事故频发的事件和科室、以及找出有可能存在隐患的事件,分析事故频发原因,商讨解决方案,以减少事故发生率。,1.6 事件与问题管理,1.6.1.4 事件管理中可能产生的问题 1.
35、6.1.4.1 事件处理的堆积未能落实上会事件处理方案,及时转入ITIL其他流程,虽然事件临时得到解决。但类似事件在临床业务中继续出现,事件未能得到彻底解决,同时导致不能成功地对事件进行分配或转交。,1.5 事件与问题管理,1.5.1.4.2 事件未被完整的记录缺乏事件及事故的记录,不利于处理过程的跟踪;如果医务人员不经过一系列的处理过程而是自己解决错误或直接联络三线人员帮助他来解决。那么与此事件相关的信息不会被完整记录。而遗漏的信息对问题管理、配置管理的成功实施非常重要。另外,服务台也不能得到事件解决数量等信息。这会导致定期提交的事件管理报告不能充分反映当前情况。,1.6 事件与问题管理,1
36、.6.1.4.3 知识库等未及时更新新变更的信息未能与知识库相关联,导致知识库、解释口径、配置库等信息未能及时更新。导致查询知识库等信息时得到错误数据。,1.6 事件与问题管理,1.6.2 问题管理1.6.2.1 问题管理的概念1.6.2.1.1 问题管理定义问题管理(Problem Management)是指从事件管理环节或自行发现的方式找到目前医院信息系统中存的问题,并充分利用现有资源对问题进行调查、分析,查明问题产生的潜在原因,制定解决问题的方案和防止事件再次发生的措施,将问题对临床业务产生的负面影响减小到最低。此外,问题管理还需对已知错误进行管理。,1.6 事件与问题管理,1.6.2.
37、1.2 问题管理相关术语已知错误(known error),对于那些已经找到问题产生的根源,以及处理它的临时解决方案,没有进行最终解决的问题为已知错误。,1.6 事件与问题管理,1.6.2.2 问题管理的目标1.6.2.2.1 问题管理的目标问题管理的目标是找到引起问题的根本原因,并依据实际情况制定临时解决方案或最终解决方案,以将问题对临床业务产生的负面影响降至最低,防止问题再次发生。1.6.2.2.2 问题管理在整个IT服务管理中的作用通过解决临床信息系统中的存在的问题,提高IT服务质量、信息管理水平;将问题的解决方案及应急措施保存在知识库中,为服务台一线解决提供信息支持,提高解决效率。,1
38、.6 事件与问题管理,1.6.2.3 问题管理的流程,1.6 事件与问题管理,问题管理的流程的主要节点1.6.2.3.1新增问题新增待审核问题:服务台主管定期整理日常工作中发生的待处理事件、自行发现的待处理问题、其他部门提交的书面申请、待处理的任务等事项,生成待审核的事件或问题,等待部门会议讨论。新增问题需要记录的内容有:问题来源、启动时间、申请部门、申请人、重要程度、紧急程度、问题类型、总负责人、终结时间、相关负责人、问题标题、问题描述,其中申请部门、申请人、重要程度、紧急程度、问题类型为必填内容。,1.6 事件与问题管理,1.6.2.3.2 问题审核在问题审核会议上对待审核问题进行审核,未
39、通过审核的事件将返回到事件管理流程进行处理;通过审核的事件则转为待查明问题进入到问题管理流程,对于新生成的待查明问题需要设立其紧急重要度和问题负责人。,1.6 事件与问题管理,1.6.2.3.3 待查明问题处理待查明问题处理方法:根据问题的紧急重要度安排问题解决的时间表,并按照问题的解决时间表展开工作,在问题处理记录中记录相关的工作内容和解决进度。1.6.2.3.4待查明问题反馈方法每周的早会上汇报问题的解决进展或遇到的问题(同时修订问题的紧急重要度)。,1.6 事件与问题管理,1.6.2.3.5制定问题解决方案制定临时解决方案制定问题解决方案待方案问题,1.6 事件与问题管理,1.6.2.3
40、.6 已知错误管理对于那些已经找到问题产生的根源,以及处理它的临时解决方案,没有进行最终解决的问题,可将其状态调整为已知错误,并生成知识库内容。当问题负责人制定出已知错误的最终解决方法,可将其转至变更管理。,1.6 事件与问题管理,1.6.2.4 问题管理中可能产生的问题 1.6.2.4.1 记录不完整问题相关信息记录不明确,可能会造成线索的丢失,十分不利于找到问题原因和制定问题解决方案;问题解决进度记录不详尽,会造成重复工作的发生;问题解决方案描述不清晰,会造成给运维人员提供的信息不准确,影响问题处理效果。,1.6 事件与问题管理,1.6.2.4.2 事件管理与问题管理之间联系不紧密若事件管
41、理与问题管理流程之间没有很好的信息沟通机制,那么问题管理很难及时了解到当前问题在运维中的监控情况,事件管理也很难及时了解到问题管理产生的知识库信息,如临时解决方案等。,1.7 变更与发布管理,1.7.1 变更管理1.7.1.1 变更管理的概念变更管理定义变更可由事件、问题、自行增加等途径引发。变更管理(Change Management)是确保临床信息系统中的所有变更按照预定的流程和时间进行修改,即对变更的质量和时间进度进行管控,以保证变更修改的质量和效率,降低或消除因为变更所造成的问题。,1.7 变更与发布管理,1.7.1.2 变更管理的目标1.7.1.2.1 变更管理的目标变更管理的目标是
42、对变更项目进行管控,确保变更安全有序进行。1.7.1.2.2 变更管理在整个IT服务管理中的作用对变更项目进行严格的管控,确保变更质量和时效性,有效将变更对临床业务的影响控制在最小;通过变更可以进一步完善临床信息系统,增加信息系统稳定性,同时满足临床科室提出的新需求,增强系统可用性。,1.7 变更与发布管理,1.7.1.3 变更管理的流程变更来自事件和问题管理,变更主管通过变更整理,确定变更方案,或是将变更转为问题或归档。针对变更制定工作计划,组织研发人员编写程序,安排测试。具体负责人填写变更日志,记录任务实施的沟通协调进程。,1.7 变更与发布管理,1.7.1.3 变更管理的流程(续),1.
43、7 变更与发布管理,1.7.1.3 变更管理的流程(续)变更管理的流程说明1.7.1.3.1新增变更新增待审核变更:待审核变更的来源有三种,分别是由事件直接转为待审核变更、自行新增待审核变更、由问题直接转为待审核变更,这些待审核变更需要会议中讨论。新增变更需要记录的内容有:变更来源、申请部门、重要程度、紧急程度、申请人、总负责人、相关负责人、变更类型、申请报告、变更标题、变更描述、解决方案、关联资源等,其中申请部门、重要程度、紧急程度、申请人、变更类型、变更标题为必填内容。,1.7 变更与发布管理,1.7.1.3.2 变更审核变更审核会议上对待审核变更进行审核,未通过审核的变更将返回到事件管理
44、流程或问题管理流程进行处理,抑或留存在未通过审核变更列表中;通过审核的变更则转为待处理变更,由变更负责人进行处理。,1.7 变更与发布管理,1.7.1.3.3 变更处理变更转入待处理流程后,将依据变更实际处理情况历经“处理中”、“暂停中”、“已完成”、“已关闭”几个状态,只有高级用户有“暂停中”状态的设置权限。变更处理过程中需要对变更处理经过进行记录,记录内容包括:变更创建时间、通过审核时间、开始处理时间、处理完成时间、发布时间、解决时间、解决记录等。,1.7 变更与发布管理,1.7.1.3.3 变更处理(续)变更修改完成后,如需进行测试,则进入到测试流程,测试完成后变更完成。变更完成后需要进
45、行必要的知识库记录。如需发布,则进入到发布管理流程;如需修改配置信息,则进入到配置管理流程。,1.7 变更与发布管理,1.7.1.4 变更管理中可能产生的问题变更拖延、堆积变更内容没能按照项目预计时间修改完成,造成变更拖延和堆积,影响变更质量,增大了发布风险。变更测试范围的界定在变更管理环节,制定变更测试要求时,测试范围比较难以界定,可能出现测试要求制定不全面的情况发生。,1.7 变更与发布管理,1.7.2 发布管理1.7.2.1 发布管理的概念1.7.2.1.1 发布管理定义发布管理(Release Management)是指对经测试后导入实际应用的新增或修改后的变更项目或配置项进行分发的管
46、理流程。即采用固定的发布流程来实施变更项目,使变更项目安全正确的分发到各个客户端。发布管理与配置管理和变更管理密切配合,以确保每项发布都被更新到公用的配置管理数据库(CMDB)中。发布管理还要确保发布的内容软件库(DSL,Definitive Software Library)中也得到更新。,1.7 变更与发布管理,1.7.2.1.2发布管理相关术语1.7.2.1.2.1最终软件库(DSL):最终软件库是一个存储所有软件配置项的最终批准版本的安全存储库,最终软件库中可能包括同一种软件的多个版本,包括存档版本、相应的文档记录和源代码等。最终软件库需要定期进行备份和管理。,1.7 变更与发布管理,
47、1.7.2.1.2.2最终硬件库(DHS)最终硬件库中包含了硬件的配置信息。1.7.2.1.2.3 配置管理数据库(CMDB)存储与管理信息系统设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转,发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。在发布管理巡检中,需对各配置项信息进行检查,以便更新完善配置库。,1.7 变更与发布管理,1.7.2.2 发布管理的目标1.7.2.2.1发布管理的目标发布管理的目标是按照标准的发布流程,将变更项目正确安全的发布,确保只有正确的版本可以进入到正式运行环境。,1.7 6 变更与发布管理,1.7.2.2.2 发布管理在整
48、个IT服务管理中的作用发布管理制定了标准的发布流程来管控程序发布活动,确保了发布工作安全有序的进行;实现了对软件版本的统一管理,解决了在用版本不统一的问题;建立了系统的发布培训机制;发布管理会制定发布回滚方案,能够在发布出现问题是将其对客户端的影响降至最低;发布之前,开发和测试都在质量控制之下,以确保硬件和软件质量;降低发布不正确版本的风险。,1.7变更与发布管理,1.7.2.3 发布管理的流程,1.7 变更与发布管理,1.7.2.3 发布管理的流程(续)发布管理的流程说明1.7.2.3.1新增发布测试组完成变更项目的测试工作后,由变更负责人提交发布申请,发布主管在ITIL中新增发布项,一般将相同程序在一次测试中涉及的变更内容规划为一次发布任务。,1.7 变更与发布管理,1.7.2.3.1 制定发布部署和规划每次发布前,发布主管都须制定发布计划,来定义一项发布怎样以及在何时得以配置。在对一项发布进行规划之前,需要收集有关发布的各项信息。通常在规划一项发布时主要需要考虑下列问题:确定发布范围,包括变更内容、使用科室、相关人员等;制定发布日程安排;制定培训计划,包括培训内容、培训人员、受训人员等;与其他相关流程做好前期沟通工作;制定回退计划;进行发布前测试工作;向上级主管提交发布申请。,