1、IT运维整体解决方案介绍IT运维整体解决方案经验总结IT运维体系使客户实现 “ 三个放心 ” 提升信息化的效益。 降低信息化的 风险 。 支持 领导 宏 观 决策。 提升信息化科学管理水平信息主管 领导 放心 系 统 了解用 户对 服 务 的需求和 规 范了用 户 使用服 务 的行 为 。 提升 IT服 务质 量和服 务 感知。业务 用 户 放心 主 动监 控和 预 防信息故障 发 生。 提升信息中心工作人 员 的 专业 化水平和能力建 设信息中心工作人 员 放心Gartner IT 信息化管理过程成熟度模型被动管理事件发生 /解决,控制台,故障记录,备份,拓扑,资产清单主动管理性能,变更,问
2、题管理配置,可用性管理,自动化与工作调度服务管理支持能力计划,服务级别管理,持续性管理业务价值以业务作为衡量标准的紧密结合混乱 缺少网管工具与手段,没有用户通知机制NSMITSMBSMIT安全运维 越复杂环境越需要简单管理手段 ITIL: 以流程为中心的 IT管理行业标准 ISO20000: ITIL 的国际标准认证IT运维项目 建设步骤IT运维平台设计原则 综合考虑到项目的成本、资源、执行时间以及流程的可操作性,建议采用以下流程设计的原则:方便简捷 流程的制定必须简单易行,方便使用急迫优先 尽量首先制定对业务和实际工作发展影响较大的管理流程和监控点实用性 制定的流程具备可操作性渐进性 在较长
3、的时期内,在一个不断演进的环境中持续改进、逐步完善服务管控体系平台标准化、规范化-符合 ITIL方法论,符合 ISO20000认证标准业务部门知识库IT服务台配置库综合报表系统其它管理系统基础架构管理系统呼叫中心Apps AppsAppsApps AppsAppsApps AppsApps外包服务人员现场支持人员IT运维平台 的设计管理领导CEO、 COO、 Service Manager其他部门服务人员 角色与岗位定义 按服务划分 热线,一线,二线(专家) 按技能划分 系统、应用、网络、安全、桌面 按职能划分 技术人员、技术管理人员、项目管理人员、领导层、合同管理员、供应商、外包商 技能服务
4、职能集团管理信息中心服务对象确定标准与客户交互方式IT运维体系 各种事件的处理流程服务台事件管理 问题管理 变更管理 发布管理配置管理服务请求网管事件设备故障应用软件业务系统故障。 其他业务需求生成业务需求审批产品发布管理需求变更管理软件缺陷追踪软件测试管理NOCAMS项目进度管理服务台事件整合软件配置管理 资产管理 安全资产管理 终端资产管理 /AD补丁、软件分发终端设置变更终端事件终端远程协助预发布管理(打包)SOCTOC安全事件病毒防护网络漏洞网络堵塞网管事件分类处理问题控制主动问题管理安全事件关联过滤变更评审实施外包管理知识库安全问题处理变更安全策略IT运维 平台主机监控资产管理子系统
5、采购管理个人工作台 综合监控 应急管理 安全管理服务管理IT运维统一 访问门户 ITSM Portal系统配置 报表统一资产配置库( ICMDB)监控数据库 流程支撑库流程管理子系统事故管理综合监控子系统网络设备监控链路监控 服务监控环境监控 应用监控自动发现 拓扑管理告警管理 桌面安全数据总线库存管理资产管理 调拨管理合同管理 文档管理调拨管理 大修管理报废管理 资产清理台帐管理 卡片管理智能分析 巡检管理服务请求问题管理 变更管理知识库 值班管理绩效管理 SLA管理配置管理 厂商管理报表管理流量分析 流程管控呼叫中心受理请求创建工单处理工单分派工单监督工单关闭工单Portal总线访问门户
6、Portal平台 个人工作台:个性定制个人主页。 综合监控:集成综合监控系统。 服务管理:集成流程平台。 应急管理:提供应急预案的管理。 安全管理:提供安全管理,用户远程对设备的管理。 系统配置:组织结构管理。 报表:在门户中展示相关报表。 单点登录:实现对资产子系统,监控子系统,流程子系统等的统一鉴权,避免多次登录和记忆许多系统的帐户和密码信息。个人工作台 根据角色配置不同的菜单 根据管理要求制定主页显示内容集中监控 集中展示系统所有故障信息 集中处理故障 集中监控系统 大屏幕 个人终端统一故障处理告警平台 告警通知方式:%手机短信%电子邮件%RTX即时通信平台告警%页面弹出 告警内容:%告
7、警来源、类型、级别、发生时间、接收时间、责任人、告警详细描述等 告警处理方式:%告警压缩;%告警关联性分析;%告警影响范围分析;%告警定位;%告警类型重定义;%告警过滤;%告警取消;%转发工单(自动、手动)故障告警管理告警显示告警方式告警过滤告警关联性分析告警升级告警定位告警前转告警清除告警诊断预警安全管理 单点登录,安全鉴权, CA接入 提供快捷方式登录相关的业务系统和设备。一般事件管理流程接收记录分类确定优先级服务台人员用户网管KEDBCMDB PDB异常KDB审计SLM一线二线问题 管理工单变 更管理匹配回访关闭 分析调查解决通知投诉咨询、请求、需求、投诉等故障管理流程应急管理流程 现场
8、支持人员:第一时间响应故障第一时间处理故障第一时间上报故障易耗部件更换现场负责 制多 线协 同作 战集团支持人员:协助判断解决故障远程协助协调专家支持备品备件调用现场解决合同管理人员 事件管理 规则接口manager问题分析组CMDB事故单工单KEDB根本原因工作组已知错误事故管理解决方案 变 更管理KDB问题管理流程记录关联分类优先级分派调查解决变更请求关闭关闭通知升级变更管理 记录建立变更请求 直接录入、事件管理模块产生、问题管理模块产生 评审、变更请求 分类和确定优先级 制定变更实施计划 变更管理在规划、构建、测试 变更实施 根据资源和其它情况确定实施日期,分配相应资源 提供沟通、监视功
9、能,并在必要时进行协调 评价和终止变更 当变更完成后,问题、事件和配置元素应当自动或手动随之更新配置管理 计量 IT资产和配置项、成本 有效对 IT环境管理,快速评估故障对业务产生的影响 属性扩展方便 通过变更确保配置信息的更新和准确 追踪系统软硬件变化配置管理数据库服 务影响能力管理财务管理可用性管理持 续 性管理访问 、控制CMDB审计 基 线 视图类别 属性 关系状 态 数据 日志生命周期变更管理发布管理访问 、控制自动发现监控告警识别监 控映射网管CMDB SLM工作台自服务台访问监 控巡检事故管理问题管理方便其他流程直接调用、管理配置关系管理配置巡检配置管理数据库 配置视图分类: 关
10、系类视图 物理视图 业务视图 位置视图 个体视图 基本信息视图 生命周期视图 全日志视图个性配置视图服务水平管理优先级 +时间 明确客户的业务需求及相应的 IT服务需求; 确保以合理的成本提供约定的 IT服务级别; 确保实际的 IT服务级别达到约定的服务级别的要求; 改善客户关系和提高客户满意度。 丰富的通知方式:短信、窗口、 RTX、邮件知识共享平台 记录 :提供知识评论,收藏夹,点击排行等功能 检索 :提供关键字检索,知识点检索,分类检索等,支持全文索引 运用 :支持知识相关性匹配,自动按知识点收集和发布,支持专栏设置和展示,支持知识订阅 更新 :记录知识更新历史日志,提供知识版本管理,支
11、持版本对比和恢复 统计 :提供知识分类统计,来源,点击率,使用率统计,提供知识价值分析 管理 :对知识发表观点;将用户感兴趣的知识加入收藏夹;根据知识的浏览次数进行排行SKMS SKMDBSKMDB服务支持流程服务运营流程配置管理服务设计流程JMS/WebService JMS/WebService外部系统SKMDB知识 知识 知识知识 知识评论检索收藏 排行专栏 匹配更新 日志版本 统计知识管理排班 交接班手 动 排班 自 动 排班 有排班表 方式 无排班表 方式值班日历值 班 报 告(巡 检 )值班管理建议: 总部 24小时值班 现场值班 5*8第一时间处理故障 定期备份 日常巡检 机房管
12、理任务计划管理巡检任务安全管理任务维护任务其他任务 组织绩效管理 IT资源绩效管理 供应商绩效管理报表引擎SLM监 控数据员 工工 单 完成情况考核团队 工 单 完成情况考核IT资 源可用性 评 估IT资 源故障 统计供 应 商 UC执 行情况 评 估员 工 OLA执 行情况 评 估团队 OLA执 行情况 评 估供 应 商 资产 故障率 业务 流程数据 CMDB组织绩 效考核工具绩效管理网络设备管理 自动生成网络拓扑 主动式网络管理 设备性能监控 事件收集及过滤 阀值控制及告警 性能分析 实时性能监测 快速故障定位 与第三方系统集成支持网络中 Cisco/H3C/华为/ZTE等多厂商的网络设备服务器管理 性能监控:监控 UNIX服务器、各类 PC服务器的性能指标( CPU、内存、硬盘的使用率等),根据预先定义好的阀值进行报警,并且把性能数据存储到标准的数据库或者数据仓库中,以便对其进行数据分析; 日志监控:日志文件的变化情况,可跟踪操作系统、数据库及用户应用系统的日志文件,根据日志中出现的特定信息进行报警或自动执行用户预定义的动作: 进程监控:能够实时监控进程的运行情况,以及子进程、进程对 CPU/内存的占用情况等等。 监控方式 Agent代理 Telnet/SSH、 SNMP支持 Aix、 Hp_unix、 Solaris、 Windows、 Linux等