收藏 分享(赏)

IT运维管理解决方案.ppt

上传人:weiwoduzun 文档编号:3170183 上传时间:2018-10-05 格式:PPT 页数:110 大小:10.77MB
下载 相关 举报
IT运维管理解决方案.ppt_第1页
第1页 / 共110页
IT运维管理解决方案.ppt_第2页
第2页 / 共110页
IT运维管理解决方案.ppt_第3页
第3页 / 共110页
IT运维管理解决方案.ppt_第4页
第4页 / 共110页
IT运维管理解决方案.ppt_第5页
第5页 / 共110页
点击查看更多>>
资源描述

1、IT系统集中监控及运维 管理解决方案 成都勤智数码科技有限公司 2011年,公司介绍IT运行维护需求理解IT Manager解决方案及优势IT Manager监控系统介绍IT Manager成功案例,公司介绍,勤智数码科技有限公司创建于2005年,是一家为最终用户提供IT运维管理服务基础平台整体解决方案(包括软件、工具、流程制定及策略设计以及人员、备件、合同管理平台等)的高新技术企业。 勤智数码科技有限公司的主要产品IT Manager,在技术上处于国内领先的地位,填补了多项国内技术空白。 产品用户涉及运营商、金融、电力、政府、企业等多个行业,客户地域范围跨越全国多个省、市,并保证了优异的运行

2、效果,目前投入使用的系统获得用户的广泛赞誉。,公司介绍,成都勤智数码科技有限公司拥有如下资质:(1) 国家双高双软企业、高新技术企业; (2) ISO9001:2000质量管理体系认证和软件成熟度CMMI3认证; (3) AAA级银行信用企业; (4)中国电信下一代IT运维平台开发合作伙伴; (5)信息产业部IT运维管理服务平台标准参与制订者(6)ISO20000运维服务标准认证 (7)ISO27001运维安全标准认证,公司介绍,勤智数码IT Manager典型案例与客户: 民生银行总行及全国二十余个分行IT运维管理保障平台 实施中 贵州省移动公司全省营业厅综合管理系统 实施中 陕西省全省电子

3、政务运维管理平台 已实施结束 杭州电信IT管理支撑平台 已实施结束 河南省网通IT服务管理平台 已实施结束 浙江省联通IT服务管理平台 已实施结束 湖南省电信IT服务管理平台 已实施结束 杭州小网通(广电)综合网络管理平台 已实施结束 中国移动卓望移动梦网应用监控管理系统 已实施结束 内蒙古电力生产管理系统 已实施结束 云南省电信163网络网管系统 已实施结束 云南省农行网管系统 已实施结束,公司介绍IT运行维护需求理解IT Manager解决方案及优势IT Manager监控系统介绍IT Manager成功案例,硬件 操作系统 网络 电源、灾难,未经测试的变更 负载超额 较差的问题管理 不合

4、理的架构,遗忘 缺乏流程 培训 安全意识,面向流程的纪律、规定 培训 自动化工具 变更管理 问题管理,体系架构和设计 变更管理 问题管理 配置管理 性能管理 容量计划,冗余技术 服务协约(SLA) 可用性监控,将信息系统的高可用性看成为产品质量问题的孤立事件,指望依赖软硬件产品质量的提升来改进系统的可用性缺乏明确的IT系统的可用性目标,即使有,也是通过对软硬件系统的可用性指标的叠加得到,而非通过对业务的影响程度所设定 缺乏较好的监控系统及服务管理系统,被动服务 =服务不及时 =失望的结果 =不满意,“80%的停机由于人为错误和流程的问题”,成就高可靠的IT的主要障碍,源于我们对于系统高可用性各

5、环节上的一些错误认知,运维需求理解,全年只允许53分钟计划的Down机时间,可用性必须要达到99.99%以上 但是靠硬件根本无法保障99.99%的可用性 需要从整个IT系统的评估、规划、优化、监控、服务管理再加上基础设施的服务才能完全保障99.99%的可用性,IT运维管理面临的一些主要问题,主动式、预警管理的运维系统能力的需要进一步提升,以提高网络系统的高可用性 缺乏统一的监控,如能对思科设备、华为设备、主机、数据库等进行集中监控和分析 缺乏预警功能 缺乏故障的及时检查、故障定位功能 缺乏智能的网络健康检查功能 缺乏及时通告(短信、Email)功能 缺乏SLA监控和评估功能 缺乏完善、灵活的报

6、表统计和报表生成功能自动化、标准化运维流程系统的缺乏和优化,以提供运维效率、降低运维压力 没有知识库积累和自动修复建议功能 缺乏完善的突发事件管理、问题管理、配置管理、变更管理流程运维人员的短缺,需要增加相关人员或培训,或进行部分运维工作外包,以便移动运维人员更加关注于核心业务 运维人员工作人员较少 运维人员工作量、压力较大 人员需要不断保持技术更新 在IT服务管理的质量方面有困惑,业务部门对于IT服务质量或者IT服务所提供的服务的范围不满意 希望通过IT分析来减少IT成本 希望对自己运维实现量化,运维需求理解IT Manager解决方案及优势IT Manager监控系统介绍IT Manage

7、r服务管理系统介绍IT Manager成功案例,解决方案介绍,其他,告警采集,配置采集,性能采集,告警处理,配置处理,性能处理,故障监控,拓扑应用,报表展现,数据采集层,数据处理层,应用展现层,事件,管理,服务管理系统,变更,管理,配置,管理,问题,管理,流程支撑层,监控人员、维护人员、管理人员,网络,数据库,中间件,应用,主机,监控数据库,服务管理数据库含CMDB,知识库,知识库,SLA,监控系统,关键指标数字化采集、监控、分析: 7*24系统健康、故障监控 为量化考核提供依据 从业务视图- 资产平台- 故障的定位,ITManager监控,产品优势,将复杂的网络运维于ITManager来完成

8、, 全面提高网络运维质量。,产品优势,丰富的数据采集指标,网络设备性能数据网络设备综合性能指标:CPU、 内存、缓存等网络性能指标:延迟、利用率、可用性、端口流入/流出流量、错包数、丢包数等 网络设备告警数据故障告警 性能阀值告警SNMP Trap 网络设备配置数据设备配置信息,主机性能数据主机CPU管理主机内存管理主机磁盘管理主机文件系统管理主机进程管理 主机告警数据故障告警性能阀值告警SYSLOG 主机配置数据日志配置信息,产品优势,数据库性能数据 数据库内存使用信息 数据库内表空间的读写次数 数据库特定表的空间性能信息 数据库表空间的利用情况 数据文件或数据设备的读写次数 数据库碎片的情

9、况 数据库日志空间或回滚段使用情况 数据库锁使用情况 数据库用户占用资源情况 数据库告警数据 数据库状态 表空间状态 有无死锁产生 表空间使用率,数据库配置数据 数据库配置信息 数据库内存配置信息 数据库内表空间的信息 数据库日志空间或回滚段信息,ITManager突出的优点总结,运维需求理解IT Manager解决方案及优势IT Manager监控系统介绍IT Manager服务管理系统介绍IT Manager成功案例,ITManager监控系统介绍,资产报表,功能介绍,网络设备/主机/数据库/中间件,KPI性能采集,配置采集,故障采集, ,脚本文件,数据库 (DB),数据采集,数据处理/业

10、务逻辑,数据呈现,事件数据库 (Event Server),SNMP/ICMP,事件/故障,性能阀值,变更,拓扑 & 监控示图 报表,Rping,SNMP Trap,Syslog/Logfile,SNMP/Telnet,数据采集,SLA,服务器,数据库,网络设备,7*24状态监控,业务视图监测,拓扑状态监测,故障状态监测,7*24无间隙的网络性能监控平台,丰富的设备性能和信息展示:网络设备,丰富的设备性能和信息展示:主机设备,丰富的设备性能和信息展示:数据库,丰富的设备性能和信息展示:中间件,灵活周全的性能阀值,可以对不同设备、不同链路设置静态(固定的)的或动态(根据基线的偏移值)告警阀值,端

11、到端链路SLA监测,通过强大的SLA监测引擎,真正实现端到端链路级监控。,拓扑管理,客服,拓扑功能,拓扑的自动发现 手动编辑 分组显示及分层定位 和故障告警、性能阀值和报表相关联,强大的拓扑自动发现引擎,搜索网络中所有设备。,事件监控,7X24事件、故障监测 事件状态变更及跟踪 事件通告 事件分析及修复建议 事件整合策略 事件统计报告,对用户网络提供7x24事件及故障监控,包括节点Down、链路Down、以及超过阀值的事件等。提供对事件的压缩、过滤、定额、互斥、拍发、跟踪等处理,事件监控展现,事件处理机制,通过事件策略设置可设置声、光、电告警通告规则,短信报警,邮件报警,声音报警,事件策略设置

12、,资产管理,建立配置管理数据库 基本的资产信息自动获得 配置文件的检查、分析及备份 资产分类查询与统计 设备口令的统一管理 故障监测与资产信息有效的关联,通过存如到数据库的CMDB配置信息,可管理包括设备型号、名称、板卡、序列号、合同号、服务商等重要信息。还可以对资产信息进行分类查询与统计、配置文件检查、设备口令统一管理等管理。故障监测与资产信息的关联,可将故障第一时间得知相关人员。,资产管理,资产管理,配置备份,性能报表 事件报表 资产报表,提供详细的设备性能报告,统计设备性能、设备状况、设备基线性能、链路性能、端口性能、性能趋势及SLA性能统计报告。还可提供设备性能事件、SYSLOG事件、

13、事件分析等事件报告。并对资产的统计数据生产报表。,运维报表,运维报表,运维报表,运维报表,增加新的设备类型,增加新的监测KPI,开放的监测扩展引擎,根据级别可以把用户分为系统管理员、管理员和一般用户; 可以根据权限把用户分为:有管理权限(增加、删除、修改)和浏览权限; 根据地域可以把用户分为中心、省级用户和地市区县级用户; 根据平台可以把用户分为主机管理员、网络管理员、数据库管理员、中间件管理员、应用管理员等等;,角色型用户管理引擎,角色型用户管理引擎,集中管理所有网络设备口令;不同用户用于不同设备权限,可进一步控制口令的权限,如telnet、console、enable等各级权限;批量修改网

14、络设备(交换机、路由器)的telnet、console、enable密码,可按需进行批量修改上述密码。可选择定期自动修改密码,密码的产生有工具自动实现; 口令生成、修改后,同时生成口令密码,以便超级管理员进行管理及保存。注:不同的交换机、路由器的修改密码的命令不相同。需要考虑各种密码均不同的情况。,安全、统一的系统口令管理,Cisco/Nortel/Junniper 产品系列 华为/H3C/中兴/博达产品系列 IBM/SUN/HP UNIX/SCO Unix/Linux/Windows Oracle/DB2/Sybase/Infomix/SQL Server 所有支持SNMP Mib2的产品(

15、包括UPS /空调等),支持的产品,标准的SNMP Netflow/Cflowd Syslog RMON 与网络测试仪器、仪表接口 数据库接口 文件接口 消息/文件方式消息方式可采用Socket(套接字)方式或Message Queue(消息队列)等方式,可通过SOAP协议进行消息传递。 通过以上接口可于机房监控等系统进行无缝集成,支持的管理接口,运维需求理解IT Manager解决方案及优势IT Manager监控系统介绍IT Manager服务管理系统介绍IT Manager成功案例,功能模块,流程控制引擎,服务台,管理者,客户,Phone,Email,Web,服务台,数据库,技术支持,事

16、件 管理,服 务 支 持 系 统,流程管理系统,IT Manager 监控系统,问题 管理,变更 管理,配置 管理,知识库,系统门户,分类与技能,分类 硬件|-服务器|_Aix 软件|-应用软件|_Weblogic,技能 硬件|-服务器|_Aix 软件|-应用软件|_Weblogic,角色设计,事件管理 事件分析员 事件分析员 事件经理,问题管理 问题分析员 问题经理,变更管理 变更申请者 变更受理者 变更审批人 变更实施者 变更经理,配置管理 配置管理员 配置经理,知识库 知识管理员,系统主界面,服务台,申请服务 查询知识/解决方案 申请状态查询和其他 ITIL 过程交互: 和事故或变更管理

17、集成 和SLA集成,事件管理,事故管理 记录终端用户所遇的软硬件故障 服务台对事故进行分类 建立事故处理流程、跟踪事故处理 设置上报流程、进行自动Email通知 建立与问题管理和变更管理的关系 产生知识库,方便对类似事故的处理,事件管理,三种方式创建事件 接受ITManager监控系统及其它系统告警 通过电话/邮件方式新建事件 通过服务请求转事件管理,事件流程,事件流程,问题管理,建立IT资产问题库 找出事故原因、方便快速识别错误 方便对主要问题形成解决方案体系 减少问题对系统的影响,问题工单,问题流程,问题流程,变更管理,管理软硬件系统各种变更操作 记录系统各类变更 管理变更审批流程 及时通

18、知相关岗位与人员 减少随意变更所产生事故,变更管理,变更管理,变更流程,变更管理,审批模版,变更管理,审批工单,配置管理,IT资产管理的特点 管理对象独特: 硬件、软件涵盖系统配置、升级等方面信息 资产在网络上可跟踪 资产管理与合同管理、服务协议紧密关联 以服务为导向的IT管理模式 遵循ITIL管理规范 建立全面服务流程 建立全面的IT资产管理体系 跟踪所有IT资产、位置、变更和资产对服务的关系 接收全面流程管理,配置管理,CI审核规则,通过审核规则定期要求管理员审核配置信息是否准确,位置管理,通过位置管理定位Ci的物理位置,业务系统管理,通过业务系统定位Ci的所服务系统,分类管理,通过CI分

19、类定位CI,关系管理,通过配置项关系描述CI间的拓扑关系及关系类型,网络端口管理,网络设备的端口间的连接管理,VLan管理,通关VLAN管理可以清晰的了解VLan的使用情况,IP管理,使用IP网段和子网掩码计算出该网段已用IP的使用情况,监控系统同步CI信息,由监控系统自动发现设备,保障CMDB完整性,监控告警管理,服务台人员可以在运维系统界面看到全部告警相关的CI,可以根据告警的实际情况,为系统管理员创建事件单,配置管理与其他流程的关系,服务等级管理,SLA,定义事件严重等级(优先级),定义升级政策和目标解决时间SLA,事件服务级别管理,服务水平管理主要从以下几方面对其他流程提供服务等级支持

20、 响应时间 解决时间 优先级,任务管理,任务是流程具体操作处理的凭证,为了对流程操作的统一和规范,要求所有的流程在处理时都必须开具相应的任务单 创建任务 处理任务 验收/关闭任务 任务类型通常包括: 普通任务 事件任务 问题任务 变更任务,任务管理,顺序任务前置任务,知识库,知识库分类知识库标签知识库修订,附件搜索 Zip Excel Word Txt PPT,值班管理,自动排班手工排班,系统管理,系统管理涉及系统基础模块和数据的配置,主要涉及以下: 用户管理 人员组管理 分支机构 部门管理 分类管理 域管理 权限控制 技能管理 基础信息配置等,报表,通过报表实现对运维数据的统计分析需求,提升

21、数据的利用效率,科学分析和决策,包括各种固定报表和自定义报表,可以让用户根据其权限运行相应的报表,同时将报表生成PDF、Excel等格式,并能够支持报表自动生成和自动推送等功能 标准标准 服务类型统计报表 事件管理报表 问题管理报表 变更管理报表 配置管理报表,报表,统计表明细表,流程(系统)日志跟踪,流程日志,处理日志,系统特性,流程自动化 生成自动化 分配自动化 升级自动化,集成多样化 Notes/邮件/WEB LDAP认证 短信集成,配置参数化 工单数据参数化 功能权限参数化 组织结构参数化,操作智能化 工单级别自动匹配 客户信息自动识别 工单自动生成,业内产品比较,系统效果,主要内容,

22、背景阐述解决之道-ITSMSmartITSM解决方案SmartITSM功能介绍使用SmartITSM进行运维工作,SmartITSM逻辑视图,流程控擎,服务台,管理者,问题 管理,客户,IVR/ACD/PBX,Email,Web,服务台,数据库,变更 管理,技术支持,事件 管理,服 务 支 持 系 统,配置 管理,服务水平 管理,系统门户,流程管理系统,IT Manager 监控系统,客户使用知识库,使用知识库自助解决故障,服务台,登记服务请求,服务台,跟踪查询服务请求,技术人员,处理工作列表,技术人员,创建、分派事件工单,技术人员,处理变更单,技术人员,查看变更单相关附件,管理人员,通过自定

23、义过滤器可跟踪所关心的流程工单,如: 网络相关的服务申请 服务器相关的服务申请 终端类型的服务请求,成功案例,杭州电信舟山电信杭州网通信息港湖南电信中山移动揭阳移动顺德社保,辽宁农业银行贵州移动民生银行杭州数字城管中国商务部河南网通陕西省电子政务,典型案例介绍-舟山电信,需求分析舟山电信现有的IT系统,主要包括112系统、10000号系统、号百系统、计费系统、97系统、资源管理系统及各专业网管系统等等。目前这些系统都靠每日维护人员逐台登陆检查的方式去维护,且并不能实时地监控系统的健康状况。随着下一阶段企业转型带来的IT系统规模的不断扩大和日益复杂,以及IT内控对系统的日常管理和维护提出了更高的

24、要求。因此,为了提高舟山电信IT系统的整体运营水平和维护水平,需要建立一个集中的监控管理系统以满足日益增长的管理和维护要求。,部署情况通过ITManager系统的部署,将舟山电信IT系统的各组成部分(不同品牌的网络设备、各种操作系统、服务器、进程、数据库、中间件、业务系统等)进行综合管理,由点到面的集中管理整个IT系统,同时基于平台良好的扩展能力,成功实现了与舟山电信现有的电子工单系统、综合告警平台进行数据接口,最终成为舟山电信的统一运维管理平台。,用户使用情况通过ITManager系统能够详细地了解IT系统的结构、性能和设备利用率,并以此为基础实现了全面的资源管理,为改善当前IT系统的性能和

25、将来的发展提供科学依据。通过系统的使用提高设备了的综合利用率,是优化IT系统网络结构和性能、降低运营成本的重要手段。通过对IT系统中各种设备的使用情况和运行性能进行准确的监控、记录和综合排名,为设备的调度和充分利用提供依据。,典型案例介绍-舟山电信,典型案例介绍-陕西省电子政务网,需求分析陕西省电子政务网包括政务外网和政务内网,网上存在着大量的网络设备(交换机、路由器、防火墙等)、主机设备、数据库、中间件和视频会议终端等,设备厂家各异,管理难度大,目前仅通过简单的网管工具或者厂商网管来进行管理,管理力度需要加强,管理流程需要规范化,因此需要建立一套统一的网络运维管理平台对整个陕西省电子政务网进

26、行集中、统一和有效的管理。,部署情况通过ITManager网络运维管理系统的部署,对陕西省电子政务网的政务外网、政务内网中的所有网络资源进行了集中监控,并按照陕西省电子政务网的运维流程和运维制度等进行相关的客户化工作,实现陕西省电子政务网的分权分域进行监控和运维维护,通过完整的、标准化的运维管理制度和先进的运维管理手段帮助陕西省电子政务网实现网络整体运维,部署的平台软件包括包括监控系统、服务流程管理系统、服务业务管理系统等。,用户使用情况通过项目的成功实施为陕西省电子政务网建立了流程化、标准化及高效的运维模式,有效界定了运维范围和内容,提高了陕西省电子政务网运维服务队伍的运维效率。总的说来,借

27、助ITManager网络运维管理平台我们有效的提高了客户满意度,大幅提升了运维工作执行的质量。,典型案例介绍-陕西省电子政务网,项目目标 建设全行主要IT设备监控体系 建立全行IT资产的基本配置库 建立网络系统的服务请求、故障处理、配置变更过程电子流程化管理体系,实现全行IT运维工作电子化流程,项目范围及内容 实现总行主机、总行及部分分行网络设备的基本监控、实现运维流程的基本模块包括服务请求、事件管理、变更管理、配置管理,运维处、网络处员工及相关代维工程师使用电子流程进行日常运维。实现全行IT设备监控、运维过程的流程化管理,把运维系统推广到民生全部分行应用(总行统一监控其核心设备)。支持业务部门使用电子平台提出服务申请,全行IT系统相关员工、代维人员使用电子运维平台进行办公。实现对民生银行新核心业务主机及相关应用进行监控管理,在全国29个分行部署监控系统,由总行统一进行运维及管理建立总行的大服务台。实现运维流程的其他模块包括发布管理、问题管理等。,典型案例介绍-民生银行,典型案例介绍-民生银行,民生银行案例介绍,谢 谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > 解决方案

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报