1、上海品易信息科技有限公司,品易科技运维管理解决方案,2,目录,运维管理的解决方案,3,IT的环境越来越复杂,IT运维的难度也越来越大,4,降低IT成本 如何提升员工、资产、项目和活动的产出?,提升服务质量 如何满足您的企业对IT服务性能的要求?,控制风险 如何定义和控制风险,提升系统可靠性?,增加对业务的影响 如何确保您的IT投资和运营决策与业务优先级要求相吻合?,提供可视性 如何清晰掌握IT中的成本和活动?,业务对IT的期望也越来越高,5,运维管理:“治”、“管”、“监”、“控” 的整体工具框架,事件管理,问题管理,变更管理,6,目录,运维管理的解决方案,主要功能和特点包括:从多种IT资源中
2、获取实时可用性和性能数据开箱即用阀值监控以自动生成告警事件 (Situation)事件报告和自动响应预定义的告警事件 (Event reporting)借助于浏览器的管理界面自定义的管理逻辑视图历史数据存储以用于统计报表和回顾,7,系统和应用监控的基石 IBM Tivoli Monitoring 体系架构,系统监控架构及部署方式,分支机构,数据中心,监控架构,服务器操作系统数据库中间件及应用,服务器操作系统数据库中间件及应用,被管系统,被管系统,TEPS,TEMS,TDW,TEMS,用户界面,Agent-based,Agent-less,Agent-based,Agent-less,TEMS,
3、TEPS = Tivoli Enterprise Portal Server TEMS = Tivoli Enterprise Management Server TDW = Tivoli Data Warehouse,典型架构设计,系统和应用监控范围,平台,数据库,应用,商业集成,Web 架构,通信 & 协作,Lotus DominoExchange,Unix,Windows,Linux,OS/400,DB2 (Z & Distributed),Oracle,Informix,SAP MySAP,SiebelTuxedo,WebSphere MQ,WebSphere MQ Integrato
4、r,WebSphere (Z & Distributed),IIS,iPlanet,Apache,WebLogic,SQL,.NET,CICS,IMS,z/OS,Sybase,Citrix,VMWare,Web Services,Cluster(s),IBM Tivoli 监控程序支持您的整个IT环境,并且可以快速实施,实现价值,40个以上用 于修正的定 制包示例: Cisco Works S1 Tuxedo etc . . .,OPAL 最佳实践库,Universal Agent (通用服务代理)( URL, SNMP, File, Socket, ODBC, API, ) Syslog P
5、robe, Syslog Daemon,管理门户 Tivoli Enterprise Portal,11,Intelligent Linking,Personalized Views,Easy to use Browser controls,Persistent customized workspaces for future use,从单一界面管理IT资源和应用,管理报警条件,设置阀值,Multiple thresholds linked by Boolean logic for determining complex problems Allows for an automated/ref
6、lex action in response to violation,自动化处理流程,13,定义逻辑视图,历史数据采集分析,15,Real Time Data,所有数据,包括实时数据和历史数据,都可以从Tivoli Enterprise Portal中展示,Tivoli Data Warehouse 2.1 汇集和剪除数据,使长期数据的管理更简单,并且提供对DB2、MS SQL和Oracle的支持,实时数据,短期历史数据,长期历史数据,RDB,Tivoli Enterprise Portal,操作系统监控,CPU处理器 内存使用情况 磁盘性能 进程监控 文件系统监控 RPC调用的性能情况 日
7、志文件 用户访问情况 服务器网络使用情况 ,磁盘资源监控,操作系统监控,进程监控,网卡监控,增强的IBM System p / AIX主机监控,ITM System Edition for System p 更轻量级的System p监控 可视化管理System p系统可用性和健康状态 虚拟资源到物理资源的映射全面的System p性能监控 可视化管理System p系统性能 历史数据收集 客户化定制视图、Situation和Workflow与IBM Director System无缝集成,数据库监控,应用服务器运行状态监控,指示应用服务器的总体健康状态,包括 CPU使用率、内存堆分配、换页率
8、, 垃圾回收率, 池大小, 线程池使用率等,应用服务器健康状态监控,JMS summary by app. server,HTTP Session and Web Container per app. server,Top 5 delays and completion rates per application,内存垃圾回收效率分析,垃圾回收效率会对应用服务器性能产生重大影响,包括其发生频率、回收时间等,因为在垃圾回收执行期间,其他进程不能活动。ITM工作视图能够展示细节的GC行为和全面的GC效率分析。,最近的GC具体性能分析,回收频率 - # GCs per Minute,最近的JVM堆使
9、用趋势,% GC消耗时间,响应时间监控,Web应用监控,交易响应时间监控,Client响应时间监控,初始目标,当前状态,专家建议,采取措施解决问题,专家建议提供了问题和推荐恢复措施的详细描述 使IT操作可以解决已知的错误,并且使主题专家抽出时间进行更多的附加值活动 可以通过定制来获得本地的专家知识,或者与使用说明书相链接,专家建议减少了问题解决方案的时间/成本,扩展机制 Universal Agent,Universal Agent为ITM提供了极大的扩展能力,25,目录,运维管理的解决方案,网络监控 Netcool #1 网管软件,保障网络的最佳健康状况和不间断的运行,保障至关重要的依靠网络
10、连接的业务和服务 IDC针对Netcool的报告: 每年节省运维费用 $58.7M 65 days收回软件投资成本 服务可用性达 99.99% 减少内部 downtime 64% 减少外部 downtime 72% 降低故障修复时间 64% 提高IT有效性 18% 提高操作员生产力 22%,事件管理,业务的优化,网络智能化管理 先进的相关性,服务管理,业务影响分析,全面的网络监控 “网管的网管”,Probes ( 200):,ATM Forum MIB RFC 1695 for ATM switches ATM Forum PNNI (Single Pier) MIB ATM Forum IL
11、MI MIB ATM Forum LANE Client MIB Frame Relay MIB RFC 1315 FDDI MIB RFC 1512,ADC Metrica NPR Airspan Sitespan Alcatel 1000 E10/OCB-283 Alcatel 5620 Logfile Alcatel 5620 NM CORBA Alcatel 5620 SAM Alcatel AWS Alcatel DSC Dex per Class 5 Voice Switch Alcatel MT20 Alcatel NMC 1300 Alcatel OMC-R (3GPP) Al
12、catel OMC-R (Q3 Interface) Alcatel OMC-R (Terminal Server Connection) Alcatel OMC-S Alcatel OS-OS Alcatel S12 Alcatel SMC 1360,Enterprise SNMP EMS Probe Ericsson 3GPP (OSS-RC/RANOS/CNOS) Ericsson ACP 1000 Ericsson AXE 10 per Class 5 Voice Switch Ericsson BNSI Ericsson MD110 Ericsson RANOS (3GPP) Eri
13、csson Xmate,Lucent 5ESS - Class 5 Voice Switch Lucent Agile ATM Lucent ECP Lucent ITM-NM/OMS Lucent ITM-SC Lucent JMTE (CORBA) Lucent Naviscore Lucent NFM Lucent OMC (CORBA) Lucent OTAF/SDHLR Lucent Wavestar SNMS,Vendor Alliances (25): Alcatel Motorola Siemens Ericsson Tellabs Marconi Lucent Nokia H
14、uawei Fujitsu Ciena Cisco Juniper Checkpoint Cramer Metasolv SAP Xtera Voyence,Bridge MIB RFC 1493 MIB-II RFC 1213/2096 RMON MIBs OSPF MIB BGP MIB ifStack MIB VRRP MIB,31 different Cisco MIBs (including MPLS VPNs) 21 Nortel MIBs 6 different Extreme Networks MIBs (inc VLANs) Juniper MPLS VPN support,
15、SNMP support (175 MIBs), including:,优秀的网络运维平台是整个网管系统成功的技术基础 高性能的核心满足大型网络管理性能要求 体系结构能够适合大型网络管理的结构要求 实现运维流程,提供足够的灵活性,TNM网络管理运维平台,呈现评估,信息综合分析处理,全面信息采集,实时监控界面,Precision,自动化处理,Actions,Triggers,相关性 分析,事件自动处理,报表,统计分析报告,设备告警,设备告警,性能和流量监控,拓扑发现 故障点定位,G,网络连通性,网络管理基本包,二/三层拓朴管理(可选项),客户自有数据库和报表系统,TNM深入的网络监控和信息采集,
16、TNM事件采集特点 Netcool探针,集成网元等各种管理信息 Netcool Syslog Probe 提供对Cisco Syslog几千行规则,Syslog 信息详细的分类,解释和严重性判断,不仅仅只是简单的数行字串匹配 对其他厂商Syslog处理规则 全球用户信息处理经验的大量累积 对原始信息的丰富,以实现更灵活和方便的信息过滤、分析和丰富 自动的存储转发功能,状态采集,事件采集,自动拓扑,端到端性能和服务质量监控,网络事件类型和来源,SyslogTrapICMPSNMP,路由器/交换机路由器/交换机线路和设备连通性路由器/交换机,Voice,Security,Datacenter Ap
17、ps,Data Center Servers,Wireless,Optical,Routers & Switches,VPNs,端到端服务管理,现成的处理规则大大减少实施和维护的工作量,网络实时综合监控,显示运维关注的主要实时信息,可以根据用户的需求进行调整,广域网实时监控,广域网视角显示关注的节点、线路的状态信息,局域网实时监控,局域网视角,按照局域网核心路由器、核心交换机、楼层交换机进行分类,监控参数按照设备故障事件(包括各类syslog告警事件)、设备性能事件(包括各类SNMP采集的性能事件)、线路事件(包括设备端口事件)。,网络设备性能,网络流量,动态拓扑图:,物理网络连接和逻辑分区视
18、图MPLS VPN 和VLAN等逻辑视图查看网络设备的配置信息直接查看网络设备的事件网络拓扑和事件,网络拓扑视图,丰富的应用协议级性能管理,Internet Service Monitoring(ISM)支持绝大部分应用协议级性能监控,可以帮助用户对 HTTP、HTTPS、FTP、DNS、邮件等企业级服务提供性能检测。,举例说明,针对HTTP监控,ISM提供如 下丰富的性能KPI:StatusLookup TimeConnect TimeDownload TimeResponse TimeBytes Per SecBytes Transferred,网络设备的配置信息管理,事件分类视图,事件分
19、类监控视图,包括:10分钟内故障事件告警、严重级别故障事件告警、性能类事件告警、连通性事件告警、配置类的故障信息等等,将事件按照最佳实践的分类方式进行显示,方便运维人员监控故障,对网络资源的性能和质量进行分析,端到端的性能采集:,基础网络设备性能(SNMP)网络路径服务质量(ICMP):可用性、响应时间、SLA 在性能出现问题时通过事件进行报警,统一报告到故障平台,40,网络运维流程的实现和支持,网络运维流程 职责分工,提高效率 对问题的处理效率进行监控 有助于提早将问题解决在萌芽阶段 事件标记有用户和组的分配信息,能够根据事件流程完成手工或自动 事件的分配 事件的确认 事件转发 事件升级 事
20、件关闭 处理日志的记录,某个节点故障导致所有下联设备ping不通 将故障节点定位为Root Cause,其它节点为Symptom Root Cause的事件级别为5级红色事件,Symptom的事件降为1级紫色事件 每个事件会记录自己的Root Cause或Symptom,这样可以找到对方,网络故障根源分析: 单个设备的故障导致所有下联设备的故障,42,深入的故障关联,帮助定位根源故障点,自动故障/恢复关联 自动基于拓扑连接的故障根源点定位 物理端口故障导致逻辑端口报警 上层连接设备故障导致下级设备报警 板卡故障导致端口报警 物理资源故障导致逻辑协议,如路由报警 灵活的策略编辑,定义事件的关联策
21、略,43,深入的故障关联,帮助定位根源故障点,44,目录,运维管理的解决方案,ITSM成功实施的三大要素,ITIL是IT服务管理的最佳实践,已经成为中国客户IT运维流程设计的首选标准,咨询专家和实施队伍,具备多年国内各行业的实施经验,保证了IT运维平台的高质量的定制实施和维护,=,+,+,成功实施!,IBM Tivoli Service Request Management 和 Asset Management提供了基于SOA和J2EE的IT服务管理和资产管理平台,流程设计:以ITIL为基础的IT运维管理流程,流程设计:以ITIL为基础的IT运维管理流程(续),工具选择:TSRM先进的 IT服
22、务管理平台,IBM TSRM拥有专业的数据展示,KPI分析的工具和报表平台,提供管理视图,可有效的反应lT服务管理的运行状况和关键性能指标,灵活的个人门户定制,可依据不同的流程角色进行定制,提供工作的便利性,通过IE浏览器,即可灵活的进行数据库配置和图形化界面设计,有效的降低了项目的实施难度和以后系统的维护难度,定制化管理报表,生产调度一览,生产调度一览-明细数据,定制化启动中心,工单信息,工作流,支持基于规则的多级工单转派系统,基础设施 运维组,基础设施类故障,业务支持组,业务应用类故障,网络组,网络类故障,服务台,桌面终端类故障,服务商,服务商,服务商,服务商,实现自动化满意度分发调查,I
23、BM的工具平台具备强大的图形化流程设计器,可灵活设置业务规则,结合流程的角色,支持IT服务管理流程的设计,变化和修订 (不仅仅是图形化的展现工具),支持按业务时间的工单处理时间计算,超时通知,业务升级,支持与Tivoli监控解决方案的快速集成,支持主流监控工具,LDAP工具,SAP等系统集成,ITIL流程平台,创建事件单,NETCOOL监控,IT环境,ITM监控,OMINBUS事件平台,监控软件,事件平台,告警接口,按既定规则Event进行过滤,创建ITIL事件单,MAXIMO,匹配CI项,短信邮件通知,CI相关责任人,IBM工具平台的良好的横向和竖向的扩展性,可以满足当前和未来发展的需要,软
24、件 硬件,采用应用服务器的管理工具集群负载均衡容错,62,目录,运维管理的解决方案,63,品易科技的介绍,与荷兰ITPreneurs公司合作,作为认证的ITIL 培训机构,提供ITIL培训、认证和咨询服务,64,金融行业,通信行业,工商企业,政府教育,总公司,上海移动,浙江移动,品易科技的典型客户,65,金融行业 中国建设银行 交通银行 中国银联 广东发展银行 深圳发展银行 友邦保险 天安保险 通信行业 中国移动集团总公司 中国移动通讯(上海) 中国移动通讯(浙江) 中国电信(上海),品易科技的参考案例,工商企业 立邦漆 安利 四川烟草 甘肃烟草 巨人网络 NetStar DONS 政府和教育行业 国家知识产权局 上海经济和信息化委员会 长宁区教委,66,目录,运维管理的解决方案,67,