1、ICS 35.240.01 L67 DB 32江 苏 省 地 方 标 准DB 32/T XXXX2018电子政务外网建设规范第 8 部分:运维服务Construction Specifications of E-Government Network Part 8:Operational service2018 - XX - XX 发布 2018 - XX - XX 实施江 苏 省 市 场 监 督 管 理 局 发 布DB32/T XXXX2018I目 次前言 IV1 范围 12 规范性引用文件 13 术语和定义 14 建设目标 24.1 联动运维 24.2 主动运维 24.3 智能运维 25 运
2、维服务总体架构 25.1 总体架构 25.2 基础服务 35.3 运维服务管理平台 35.4 服务管理体系 36 运维服务管理平台 36.1 总体要求 36.2 平台功能要求 36.2.1 资源管理 36.2.2 集中监控管理 46.2.3 日常运维管理 56.2.4 ITIL 服务 .56.2.5 级联管理 66.2.6 系统管理 67 平台对接设计要求 67.1 网络资源对接 67.2 安全综合管理平台对接 67.2.1 对接设备信息库接口,具体接收字段件附录 B。 67.2.2 对接告警管理接口,具体接收字段请见附录 C。 77.2.3 对接运行监测性能接口,基本信息接收字段见附录 E,
3、运行信息接收字段见附录 D。 .77.3 日常运维管理对接 78 运维队伍管理 79 运维制度管理 7附录 A(规范性附录) 网管平台对接字段 .8附录 B(规范性附录) 对接设备信息库接口对接字段 10DB32/T XXXX2018II附录 C(规范性附录) 对接告警管理接口对接字段 11附录 D(规范性附录) 监测设备信息接收字段 12附录 E(规范性附录) 监测设备性能信息接收字段 13DB32/T XXXX2018III前 言DB32/T XXXX-2018 电子政务外网建设规范分为八个部分:第1部分:网络平台;第2部分:IPv4地址、路由规划;第3部分:IPv4域名规划;第4部分:安
4、全实施指南;第5部分:安全综合管理平台技术要求与接口规范;第6部分:安全接入平台技术要求;第7部分:电子认证注册服务机构建设;第8部分:运维服务。本部分为DB32/T XXXX-2018电子政务外网建设规范第8部分。本部分按照GB/T 1.1-2009给出的规则起草。本部分由江苏省人民政府办公厅提出并归口。本部分起草单位:江苏省人民政府办公厅电子政务办公室。本部分起草人:吴中东、李强、朱德宇、李寒、叶纪华、张坤、徐慧琴。DB32/T XXXX20181电子政务外网建设规范 第 8 部分:运维服务1 范围本标准规定了电子政务外网建设中运维服务的术语和定义、建设原则与目标、运维服务总体架构、运维服
5、务管理平台功能要求、平台对接设计要求、运维队伍管理和运维制度管理。本标准适用于电子政务外网建设的运维服务工作。2 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 20985.1-2017 信息技术 安全技术 信息安全事件管理指南GB/T 21061-2007 国家电子政务网络技术和运行管理规范ISO 20000系列 信息技术 服务管理系列3 术语和定义3.1 国家电子政务外网数字证书中心 National Center for E-government Netw
6、ork Digital Certificate承担国家电子政务外网电子认证服务工作的机构。3.2 资产目录 Assets Directory运行于电子政务外网所有软硬件产品、IP地址等资产的数据目录体系。3.3 IT 服务管理 IT Service Management(ITSM)帮助企业提升对IT系统的规划、研发、实施和运营进行有效管理的高质量方法。3.4 信息技术基础架构库 Information Technology Infrastructure Library(ITIL)适用于IT服务管理(ITSM)。ITIL为IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。3.5 DB32
7、/T XXXX20182配置管理信息库 Configuration Management Database(CMDB)存储与管理企业IT架构中设备的各种配置信息。3.6 简单网络管理协议 Simple Network Management Protocol(SNMP)由一个应用层协议(application layer protocol)、数据库模型(database schema)和一组资源对象组成的网络管理协议。3.7 Java 管理扩展 Java Management Extensions(JMX)一个为应用程序、设备、系统管理功能的框架。3.8 Java 数据库连接 Java Data
8、 Base Connectivity (JDBC)一种用于执行SQL语句、可以为多种关系数据库提供统一访问的Java API。4 建设目标4.1 联动运维建设省、市二级运维服务体系,并实现与国家电子政务外网运维服务体系的互连互通。4.2 主动运维实时监测IT基础资源运行状态,及时识别事件并启动相关处理流程和应急响应机制,实现业务系统平稳运行。4.3 智能运维利用大数据和人工智能技术,进行更精确的故障定位和趋势预测,实现智能化运维。5 运维服务总体架构5.1 总体架构运维服务总体架构由基础服务、运维服务管理平台和服务管理体系组成。按照ISO20000的要求,参考ITIL V3基础架构,规范运维服
9、务管理平台和服务管理体系。如图1所示:DB32/T XXXX20183图 1 总体架构图5.2 基础服务采集网络设备、安全设备和数据中心相关运维资源信息,通过数据清洗进行格式化、标准化处理,供相关运维服务应用系统使用。5.3 运维服务管理平台由资源管理、集中监控管理、日常运维管理、ITIL服务、级联管理以及系统管理组成。资源管理包括资源登记、资源类型管理、资源目录管理、全生命周期管理、IP地址管理;集中监控管理包括网络资源运行监控、安全资源运行监控、数据中心运行监控(计算机设备、存储设备、数据库、中间件、安全设备、业务应用等资源);日常运维管理包括值班管理、日常巡检、供应商管理;ITIL服务包
10、括服务台、事件管理、问题管理、变更管理、发布管理、知识库。5.4 服务管理体系建立运维服务管理体系,包括运维队伍建设和运维制度建设等。6 运维服务管理平台6.1 总体要求应按照:a) 采用成熟的技术,并满足先进性与实用性并重;b) 符合 GB/T 20985.1-2017 中 7.2 的要求;c) 具有开放性、可移植性、可扩展性;d) 实现运维服务过程可控、可视、可分享、可追溯。6.2 平台功能要求6.2.1 资源管理DB32/T XXXX201846.2.1.1 资源登记按照GB/T 21061-2007要求,根据IT资源的基础特征属性参数、资源间关系建立资源信息档案,构建完整的IT资源配置
11、管理数据库。资源来源主要包括采购、赠与、配发及租赁等。以资源设备统计数据为基础,对网络设备、服务器、数据库、中间件、业务系统等运行情况进行统计分析。6.2.1.2 资源类型管理提供IT服务相关的资源分类定义功能,资源管理人员可以在运维服务管理平台中定义资源类别和性质。资源类别是指计算机设备、网络设备、安全设备、IP地址、软件资产等IT资源类别划分;资源性质是指软件、硬件、耗材等IT资源性质类别划分。6.2.1.3 资产目录管理按照资产目录体系进行目录分类管理。其中软硬件产品目录包括该产品的使用寿命、厂商、参考价格、保修年限、参考折旧方案等信息。6.2.1.4 全生命周期管理对资产目录定义的各类
12、资源实现全生命周期的管理,主要包括资源的需求规划、新增(资源入库)、领用、维护、调拨、变更、报废等一系列操作管理。6.2.1.5 IP 地址管理通过对IP-MAC实时信息、变更信息的管理,实现IP地址的分配、使用、回收,全面管控IP地址的使用。6.2.2 集中监控管理6.2.2.1 网络资源运行监控包括网络设备自动发现、拓扑自动生成、网络故障管理、网络设备性能管理、网络链路流量管理、网络安全管理等内容,支持网络管理协议SNMP v1/v2/v3,支持对多厂商路由交换设备的监控和管理。6.2.2.2 安全资源运行监控监测和管理安全设备的运行状态,对安全事件、脆弱性、配置、可用性与安全相关的数据进
13、行统一采集、集中分析,并进行宏观可视化展现,发现事件或安全风险时可实时触发告警。6.2.2.3 数据中心运行监控运行监控包括对服务器、存储设备、网络设备、数据库、业务系统以及机房动环等资源的监测和控制;根据不同情况设置不同告警级别及阈值;自动报警,自动响应和自动处理;对监控的历史数据进行存档和查看。具体如下:a) 服务器运行监控:监控内容包括基本信息、CPU 负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等;b) 数据库运行监控:监控内容包括工作负载、配置、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性;
14、c) 中间件运行监控:监控内容象包括配置信息、连接池、线程队列、负载监测、通道情况监测等参数。分析和监测中间件的各项运行状态参数;DB32/T XXXX20185d) 业务监控:以业务为主线,实现面向业务的监测和管理,监控内容包括应用运行状态、应用连接数、进程、服务(端口)状态等,并能够实现阈值设定、故障告警、告警级别设置、流程管理、统计通报等功能;e) 动环运行监控:根据机房分布,自动建立机房结构拓扑视图,采取分区管理方式,集中采集温湿度、电源、电压、UPS、空调、视频等性能状态及预警事件。6.2.3 日常运维管理6.2.3.1 值班管理建立值班负责人、值班人员、值班开始时间、结束时间、交班
15、开始时间、交班结束时间、强制交班时间等信息。6.2.3.2 日常巡检设定巡检范围、指标、频度以及巡检报告表单,通过自动、手动两种方式对服务器、网络设备、数据库、中间件、业务系统等配置指标、性能指标、网络指标、链路状态、小型日志、系统进程状态进行日常性、周期性巡检,自动生成巡检报告。6.2.3.3 供应商信息管理建立管理设备和服务供应商清单,包括供应商的基本信息,联系人和联系方式。6.2.4 ITIL 服务6.2.4.1 服务台作为服务窗口统一接受呼叫请求,同时反馈请求处理进度;服务台功能包括事件支持、工作调度、任务指派以及其他IT服务流程等。6.2.4.2 事件管理制定事件报告和处理管理制度,
16、明确不同告警事件的报告、处理和响应流程,规定事件的处理管理职责等。事件管理应具备以下功能:a) 上报所发现的事件;b) 对造成运维服务管理平台中断的重大事件采用不同的处理程序;c) 在事件报告和响应处理过程中,分析和鉴定事件产生的原因,收集证据,记录处理过程,形成相关日志记录。6.2.4.3 问题管理制定问题管理制度,规定问题处理管理职责等。问题管理应具备以下功能:a) 上报所发现的问题事件;b) 查找问题事件产生的根本原因,制定解决方案和预防措施,形成相关日志记录;c) 建立问题管理申报和审批流程,依据流程控制处理相关问题。记录问题解决过程,形成知识库。6.2.4.4 变更管理应具备以下功能
17、:DB32/T XXXX20186a) 建立变更的申报和审批流程,依据流程控制处理所有的变更,记录变更实施过程;b) 建立中止变更并从失败变更中恢复的流程,明确流程控制方法和人员职责;c) 明确运维资源变更需求,变更前根据变更需求制定变更方案,变更方案审批后方可实施。6.2.4.5 发布管理运维服务主管部门负责制定发布管理制度。发布管理制度应通过正式、有效的方式发布,并进行版本控制。6.2.4.6 知识库在运维服务管理过程中,对历史故障的现象、原因、处理方法等经验进行收集和分析,形成的解决方案集合。6.2.5 级联管理将下级的告警信息、运维工单、知识库等同步到上级平台跟踪管理,上级平台下发预警
18、、安全事件、通报等信息,实现省、市运维工作的联动与协调。6.2.6 系统管理6.2.6.1 用户管理集中管理运维服务用户账号,实现用户信息维护,包括修改、增加、删除等维护功能。6.2.6.2 权限管理根据用户身份从资源使用、用户角色等方面进行分级别、分功能授权,实现权限控制。6.2.6.3 日志管理应具备以下功能:a) 对运维管理平台的启动、自检、故障、恢复、关闭等运行状态信息进行记录;b) 对运维管理平台的用户登录、退出、增加、删除、修改等操作进行记录;c) 按照日志类型、时间等对日志进行检索与统计分析。7 平台对接设计要求7.1 网络资源对接应符合以下要求:a) 通过 SNMP 协议采用定
19、时轮询方式,采集网络设备资源信息和运行数据信息,进行统一管理;b) 通过与网管平台统一告警管理接口对接,实现对网管平台各类告警信息的接收和处理,同时对产生的告警数据,形成统一的数据工单,并通过 API 接口标准数据的形式发送给 ITIL 服务流程系统,完成不同设备和运维服务管理平台发出的告警信息集中展现在运维管理平台;c) 与网关平台对接的接口的具体字段见附录 A。7.2 安全综合管理平台对接DB32/T XXXX201877.2.1 对接设备信息库接口,具体接收字段件附录 B。7.2.2 对接告警管理接口,具体接收字段请见附录 C。7.2.3 对接运行监测性能接口,基本信息接收字段见附录 E
20、,运行信息接收字段见附录 D。7.3 日常运维管理对接省级节点建立知识库,下级节点可以访问并可上传案例;上级节点可以向下级节点推送工单信息,内容可以是按照指定的告警信息、工单处理信息等。8 运维队伍管理根据运维服务内容和流程确定岗位设置和职责分工,并按照相应要求配备所需各类业务岗位的专职人员和执业技术人员。具体要求如下:a) 及时性:运维人员和客户保持良好的沟通机制,快速响应客户的需求,及时解决各类故障问题;b) 专业性:运维人员需要具备高水平的运维经验,了解各项安全规范,熟悉网络架构以及设备的操作规范。9 运维制度管理针对运维管理流程和内容,制定相应的运维管理制度,实现各项工作的规范化管理。
21、具体包括:a) 应对安全管理活动中的各类管理内容建立安全管理制度;b) 应对要求管理人员或操作人员执行的日常管理操作建立操作规程;c) 应形成由安全策略、管理制度、操作规程、记录表单等构成的全面的信息安全管理制度体系。DB32/T XXXX20188A A附 录 A(规范性附录)网管平台对接字段表 A.1 网管平台对接字段标签名 名 称 类 型id 告警 ID 长整数(long)类型OID 告警事件 OID 字符串(String)类型originalType 告警来源类型 整数(int)类型originalTypeDesc 告警原始类型描述信息 字符串(String)类型deviceId 设备
22、 Id 长整数(long)类型deviceIp 设备 Ip 字符串(String)类型deviceName 设备名称 字符串(String)类型alarmLevel 告警级别 整数(int)类型alarmLevelDesc 告警级别描述信息 字符串(String)类型alarmCategory 告警分类 整数(int)类型alarmCategoryDesc 告警分类描述信息 字符串(String)类型faultTime 告警发生时间 长整数(long)类型faultTimeDesc 告警发生时间详细信息 字符串(String)类型recTime recTime 长整数(long)类型recTi
23、meDesc 告警恢复时间详细信息 字符串(String)类型recStatus 告警恢复状态 整数(int)类型recStatusDesc 告警恢复状态描述信息 字符串(String)类型recUserName 告警恢复人 字符串(String)类型ackTime 告警确认时间 长整数(long)类型ackTimeDesc 告警确认时间详细信息 字符串(String)类型ackStatus 告警确认状态 整数(int)类型ackStatusDesc 告警确认状态描述信息 字符串(String)类型ackUserName 告警确认人 字符串(String)类型alarmDesc 告警描述信息
24、字符串(String)类型paras 告警参数 字符串(String)类型parentId 告警关联分析父 ID 长整数(long)类somState 告警分发状态 整数(int)类型remark 告警备注 字符串(String)类型eventName 告警事件名称 字符串(String)类型DB32/T XXXX20189表 A.1 网管平台对接字段(续)reason 告警事件原因 字符串(String)类型suggestion 告警修复建议 字符串(String)类型experience 告警维护经验 字符串(String)类型tipMessage 告警事件定位字符串 字符串(String
25、)类型defineType 告警定义类型 整数(int)类型customAlarmLevel 用户自定义级别 整数(int)类型DB32/T XXXX201810B B附 录 B(规范性附录)对接设备信息库接口对接字段表 B.1 对接设备信息库接口对接字段标签名 名 称 类 型id 设备唯一标识 字符串(String)类型ip 设备 ip 字符串(String)类型mac 设备 mac 地址 字符串(String)类型name 设备名称 字符串(String)类型os 设备操作系统 字符串(String)类型type 设备类型 字符串(String)类型value 设备价值 整数(int)类型
26、DB32/T XXXX201811C C附 录 C(规范性附录)对接告警管理接口对接字段表 C.1 对接告警管理接口对接字段标签名 名 称 类 型id 告警唯一标识 字符串(String)类型name 告警名称 字符串(String)类型risk 告警级别 整数(int)类型srcip 源 ip 字符串(String)类型dstip 目标 ip 字符串(String)类型time 告警发生时间 字符串(String)类型type 告警类别 字符串(String)类型DB32/T XXXX201812D D附 录 D(规范性附录)监测设备信息接收字段表 D.1 监测设备信息接收字段标签名 名 称
27、 类 型ip 设备管理 IP 字符串(String)类型manufacturer 设备厂商 字符串(String)类型hostName 设备名称 字符串(String)类型category 设备型号 字符串(String)类型osName 操作系统名称 字符串(String)类型osVersion 操作系统版本 字符串(String)类型sysObjectId 设备的 sysObjectID 字符串(String)类型instance CPU 实例号 整数(int)类型rawDescr 原始描述 字符串(String)类型instance 内存实例号 整数(int)类型rawDescr 原始描
28、述 字符串(String)类型memType 内存类型 整数(int)类型memSize 内存总大小 整数(long)类型instance 接口实例号 整数(int)类型ifAlias 接口别名 字符串(String)类型ifDescr 接口描述 字符串(String)类型ifType 接口类型 整数(int)类型ifMtu 接口最大传输单元 整数(int)类型ifSpeed 接口速率 整数(long)类型ifAdminStatus 接口管理状态 整数(int)类型ifOperStatus 接口操作状态 整数(int)类型ifLastChange 当前状态时间 字符串(String)类型dup
29、lex 接口(网卡)工作模式 整数(int)类型ip 接口 IP 地址 字符串(String)类型mac 接口 MAC 地址 字符串(String)类型mask 接口掩码 字符串(String)类型instance 硬盘分区实例号 整数(int)类型rawDescr 原始描述,即盘符或挂载点 字符串(String)类型volumeSize 硬盘分区总大小 整数(long)类型DB32/T XXXX201813E E附 录 E(规范性附录)监测设备性能信息接收字段表 E.1 监测设备性能信息接收字段标签名 名 称 类 型ip 设备管理 IP 字符串(String)类型status 设备状态 整数
30、(int)类型instance CPU 实例号 整数(int)类型perfCpu CPU 单核使用率 整数(float)类型instance 内存实例号 整数(int)类型memSize 内存总大小 整数(long)类型memUsed 内存已用大小 整数(long)类型instance 接口实例号 整数(int)类型ifSpeed 接口速率 整数(long)类型ifOperStatus 接口操作状态 整数(int)类型inFlow 流入字节数 整数(long)类型outFlow 流出字节数 整数(long)类型inPacket 流入单播报文数 整数(long)类型outPacket 流出单播报
31、文数 整数(long)类型inNPacket 流入非单播报文数 整数(long)类型outNPacket 流出非单播报文数 整数(long)类型inDiscard 被丢弃的流入报文数 整数(long)类型outDiscard 被丢弃的流出报文数 整数(long)类型inError 流入的错误报文数 整数(long)类型outError 流出的错误报文数 整数(long)类型instance 硬盘分区实例号 整数(int)类型volumeSize 硬盘分区总大小 整数(long)类型volumeUsed 硬盘分区已用大小 整数(long)类型instance 进程号 整数(long)类型processName 进程名称 字符串(String)类型processState 进程状态 整数(int)类型processCpu 进程占用 CPU 时间 整数(long)类型processMem 进程占用内存大小 整数(long)类型processType 进程类型 整数(int)类型_DB32/T XXXX201814