1、第 1 页 共 33 页IBM 系统管理和集中监控实施案例介绍一、全球范围内的集中监控和流程管理的成功案例1、UMI 架构的成功案例UMI介绍:UMI( Universal Management Infrastructure)通过对网络和系统设备的监控,资产和配置信息的获取,提供一种完全的环境监控和管理方案。UMI架构是从传统集中监控项目的最佳实践中总结出来的一套模型和设计方法,UMI 支持的流程如下: 配置管理:允许IT管理者通过对设备及设备配置的变更情况的记录和说明,管理设备的情况 操作系统和应用软件的版本升级和补丁管理:允许管理者通过迅速简单的补丁实施来解决问题和进行维护软件 资产跟踪:
2、跟踪和审核配置的变化、问题的决定和纠正行为的执行情况 服务器审计:通过对服务器的访问和修改日志的维护,来帮助用户满足审计的需要,同时解决问题 环境配置的存档:通过配置数据库中存储的配置数据来跟踪变化,或者配置新环境 软件库服务:通过维护预先确定的软件和已经通过验证的代码来维护知识库第 2 页 共 33 页UMI通过提供以下几类报表,帮助提高对应用的操作和架构的可见度: 资源(存货、配置、软件分发、可用性) 错误(告警和事件) 性能和容量 问题和变化 跟踪审计 软件库 SLAs规定IBM全球服务部和全球的客户共同合作实施UMI,可以在多个层次实现业务价值,包括降低基础架构和人员成本,提高业务流程
3、的速度和效率,以及通过标准化获得的较好的服务质量,一致性和可靠性。客户名称 客户简介 实施方案 管理范围John Hancock保险和金融服务公司John Hancock 保险和金融服务公司是世界第 5大和北美地区第 2 大寿险公司。项目于 2005 年 11 月份由 IBM 全球服务部实施完成。John Hancock 保险和金融服务公司通过实施 IBM Tivoli 解决方案和采用 UMI 架构体系,达到建立完整的监控体系和自动化操作机制,优化化系统性能的目标。实施的解决方案包括 IBM Tivoli Enterprise Console,IBM Tivoli Monitoring,IBM
4、 Tivoli Monitoring for Databases,IBM Tivoli Monitoring for Messaging and Collaboration,IBM Tivoli Configuration Manager,IBM Tivoli Access Manager for e-business 等软件模块。三台大型机一千多台分布式 Unix 服务器,分布在全球不同地区福特汽车福特汽车是世界第三大及北美第二大汽车公司。福特公司通过实施 IBM Tivoli 解决方案和采用 UMI 架构体系,达到降低管理成本,提高运维效三百台分布式Unix 服务器,分布在美国不第 3 页
5、 共 33 页项目于 2005 年 9 月份由 IBM 全球服务部实施完成。率的目标。实施的解决方案包括 IBM Tivoli Enterprise Console,IBM Tivoli Monitoring,IBM Tivoli Monitoring for Databases,IBM Tivoli Configuration Manager 等软件模块。同州摩根斯坦利投资银行摩根斯坦利投资银行是世界最大的银行,业务遍及全球 28 个国家和地区。项目于 2005 年 12 月份由 IBM 全球服务部实施完成。摩根斯坦利投资银行通过实施IBM Tivoli 解决方案和采用 UMI架构体系,达到
6、提高运作效率,降低 IT 管理成本的目标。实施的解决方案包括 IBM Tivoli Monitoring,IBM Tivoli Monitoring for Databases,IBM Tivoli Configuration Manager,IBM Tivoli Business System Manager, IBM Tivoli Enterprise Console 等软件模块。十台大型机六百台分布式Unix/Linux 服务器,分布在世界各地Sysco 公司Sysco 公司是美国最大的食品销售公司,分公司遍及美国各州。项目于 2005 年 9 月份由 IBM 全球服务部实施完成。Sys
7、co 公司通过实施 IBM Tivoli 解决方案和采用 UMI 架构体系,达到提高运作效率,降低 IT 管理成本的目标。实施的解决方案包括 IBM Tivoli Monitoring,IBM Tivoli Monitoring for Databases,IBM Tivoli Configuration Manager,IBM Tivoli Enterprise Console 等软件模块。三十台分布式Unix/Linux 服务器和上百台Windows 服务器更多参考案例:(采用 UMI 架构)公司名称 国家 完成时间ING 公司 (荷兰) 2005 年 6 月Hallmark 公司 (美国
8、) 2004 年 12 月可口可乐公司 (美国) 2005 年 3 月NSTAR 公司 (美国) 2004 年 5 月Circuit City 公司 (美国) 2005 年 10 月UNUM 公司 (美国) 2005 年 10 月Federated 保险公司 (美国) 2005 年 4 月IBT 公司 (美国) 2006 年 1 月第 4 页 共 33 页2、传统架构的成功案例客户名称 客户简介 实施方案 管理范围英国电信公司英国电信是一个重要的电信运营商,总部设在英国伦敦。项目于 2005 年 9 月份由 IBM 全球服务部实施完成。英国电信通过实施 IBM Tivoli Monitorin
9、g 解决方案,达到快速定位解决业务系统故障和优化系统性能的目标。实施的解决方案包括 IBM Tivoli Monitoring,IBM Tivoli Monitoring for Databases,IBM Tivoli Monitoring for Web Infrastructure, Tivoli Enterprise Console 等软件模块。二台主机一百多台分布式 Unix 服务器Rogers 通信公司Rogers 通信公司是位于加拿大的一家通信公司。项目于 2005 年 7 月份由 IBM 全球服务部实施完成。Rogers 通信公司通过实施集中式的系统管理和监控,其结果是提高了
10、5 个百分点的服务水平,并且降低了成本。实施的解决方案包括 Tivoli Enterprise Console, IBM Tivoli Monitoring, IBM Tivoli Monitoring for Applications, IBM Tivoli NetView, IBM Tivoli Business System Manager 等软件模块。八十多台分布式 Unix 服务器Belgacom通信公司Belgacom 是一家欧洲领先的电信公司,位于比利时。项目于 2005 年 12 月份由 IBM 全球服务部实施完成。Belgacom 通过实施 IBM Tivoli 软件,实现了
11、在多级体系中进行集中化管理,达到了提高 IT 管理效率的目标。实施的解决方案包括 IBM Tivoli Configuration Manager, IBM Tivoli Business Systems Manager, IBM Tivoli Decision Support, IBM Tivoli Enterprise Console, IBM Tivoli Monitoring for Databases, IBM Tivoli Monitoring for Messaging and Collaboration, IBM Tivoli Monitoring for Transactio
12、n Performance, IBM Tivoli Monitoring for Web Infrastructure, IBM Tivoli Monitoring 等软件模块。七十多台 Unix服务器,二百多台 Linux 服务器,分布在欧洲不同国家境内第 5 页 共 33 页Vodafone信息系统公司Vodafone 信息系统公司是世界领先的Vodafone 公司的 IT 子公司。项目于 2005 年 12 月份由 IBM 全球服务部实施完成。Vodafone 信息系统公司通过实施IBM Tivoli 软件降低了系统管理成本,同时对 IT 环境的控制力加强了。实施的解决方案包括 IBM
13、Tivoli Configuration Manager, IBM Tivoli Intelligent Orchestrator, IBM Tivoli Provisioning Manager, IBM Tivoli Business Systems Manager, IBM Tivoli Enterprise Console, IBM Tivoli Monitoring等软件模块。二百多台分布式 Unix 和Windows 服务器二、中国大陆范围内的集中监控和流程管理的成功案例中国大陆范围内近年来集中监控和流程管理的成功案例一览表中国银监会运行监控及服务管理系统项目(实施中)山西移动企业
14、信息化部集中监控和服务管理项目集中监控+流程管理 广东发展银行总控中心建设项目(实施中)中国银行全国网络管理项目(使用 CIC)中国银行信用卡中心数据中心管理系统实施中国民航信息网络股份有限公司全国网络管理二期项目一汽大众系统管理三期项目中国网通存储管理项目实施中国银行西南/西北数据中心 IT 管理项目中国铁道部清算中心系统管理项目江苏农行系统管理项目集中监控广东移动网管中国银行数据中心管理咨询及实施(实施中)中国农业银行数据中心管理咨询中国建设银行运行中心服务管理咨询及实施(华北/华东合作,实施中)中国银联信息中心 IT 服务管理咨询及实施(华北/华东合作)中国太平洋保险有限公司总部网络管理
15、平台建设和流程咨询项目中国工商银行数据中心管理咨询(华北/华东合作)中国海洋石油 IT 服务管理咨询及实施项目中国交通银行总行数据中心流程管理项目浙江移动 IT 服务管理咨询及实施项目上海移动 IT 服务管理咨询及实施项目流程管理江苏移动 IT 服务管理咨询及实施项目第 6 页 共 33 页东风汽车 IT 服务管理项目1、集中监控 + 流程管理案例2.1 广东发展银行总控中心建设第一期项目项目背景随着广发银行数据集中工作的逐步完成,分行的交易和数据处理基本都集中到总行电脑中心。目前,总行电脑中心从仅支持省内分行的业务发展到支持了全行33 个分行合计54 个业务系统的处理,支持逻辑网点数约700
16、 多个,客户数从原来的540 万个增加到890 万个,每天处理交易笔数从原来的20 万笔增加到45 万笔。随着深圳分行数据集中,客户数将增加到1000 万个,每天处理交易笔数将超过50 万笔。作为全行信息系统运营中心,总行电脑中心的运营压力日渐增大,运营风险也日益增高。如何通过行之有效的管理手段,使用先进的管理工具,建立并完善总行电脑中心运行支持平台和服务平台,更好支持业务发展和创新,成为当前迫切需要解决的问题。总结广发银行面临的挑战如下: 环境集中后,运行管理困难 操作维护效率低 业务支持无法满足第 7 页 共 33 页项目介绍广发银行信息化建设的长期目标包括了要实现服务水平管理、业务服务管
17、理,实现成本管理(包括成本核算、分析、辅助决策) ,实现信息管理(例如通过对基础环境运行数据和业务数据的分析,为业务决策提供依据)等。这些目标的实现有赖于长期持续不断的企业信息化建设,以及总体规划的体系架构。IBM的随需而变(On Demand)体系架构为实现上述目标提供了参考性的建设方向广发银行总控中心管理平台分为以下四个层次:第一层(最底层)为IT组件层。在该层,各种主机系统、网络、存储、应用、安全等资源通过各自的监控系统进行管理,并将经过过滤的事件信息传送到上面的监控层(即事件管理) 。对于网络资源,考虑到其作为公用服务(Share Services)的特点,为其配备独立的系统提供网络管
18、理视图。第二层为监控层(即事件管理平台) 。在该层,基于定义的规则,将IT组件层提供的事件信息进行分类、选择,以及进行关联,从而实现统一的监控和智能的问题分析。第三层为运作层(即流程管理平台) 。在该层,实现事故管理、问题管理、变更管理、配置管理、发布管理等流程和资产管理等功能,并通过连接下面的监控层,实现从事件到流程的联动,以及实现可用性管理和性能管理。第四层为服务层(或业务层) 。在该层,基于下面的流程管理平台和事件管理平台,实现服务水平管理以及成本核算等面向业务的服务功能。在物理上,第四层可以与第三层在一个平台上实现。本期项目,总控中心的建设以IT服务管理平台和事件管理平台的建设为重第
19、8 页 共 33 页点,优化服务流程,完善管理制度,提高整体服务质量;初步实现系统、网络、应用、安全等基本信息的采集、汇总、展现、通知,实现集中监控和操作,强化核心网络、主要生产系统、数据库和部分核心应用的运行状况管理,实现运行故障及时准确的预警,提高故障的应急处理能力,提高业务系统整体运行质量。目前,本项目正在实施中。2.2 银行业监督委员会运行监控及服务管理系统建设项目项目背景信息系统是银监会防范金融风险、维护金融安全的重要手段,是加强金融监管的不可缺少的工具。随着银监会科技信息系统建设的快速发展,投入运行的计算机系统结构越来越复杂、数量持续增多,目前银监会内部网络内已运行几十个重要的信息
20、系统。保证系统安全、可靠、稳定运行,提升运行管理水平,为银监会系统内和金融行业提供有效的信息服务,是科技部门运维工作的核心任务。 银监会信息系统设备数量、业务种类目前已达到一定规模,新机房和主要业务系统在建设之中,运行监控管理和服务工作一直依靠人工检查和制度手段,迫切需要一套行之有效的技术平台,完成包括机房、运行系统的监控和自动化的支持服务流程管理。在本项目中,IBM承担总集成商的角色,提供咨询、设计、实施和产品供应服务。负责支持整个银监会信息中心的IT运维。第 9 页 共 33 页项目介绍IBM立足于对银监会需求的理解,将需求分为三个管理层次:最底层是被监控对象层,它包含信息中心运行管理的所
21、有对象,可分为网络设备、系统软件和硬件设备以及机房基础设施三类。第二层是监控管理层,它包含网络监控,系统监控,机房环境监控,告警事件管理四个模块组成。监控管理层实现对被管理运行对象的监控,掌握运行资源的配置状况、监控对象的运行状态和性能参数、预警和快速发现IT系统的根源故障,并通过与服务管理流程的集成,以及时响应和规范化地处理故障。第三层是服务管理层,它包含呼叫中心和服务管理平台两部分内容。服务管理层实现对被用户的统一服务接口,通过提供规范的运维服务流程,为用户和业务提供准确和优质的IT服务。本项目将实施三个管理平台,分别是系统监控平台、服务管理平台和统一管理门户平台。目前,本项目正在实施中。
22、2、集中监控案例2.1 中国民航信息网络股份有限公司全国网络管理二期项目客户介绍中国民航信息网络股份有限公司是中国民航信息集团旗下的重点企业,是中国航空旅游业信息科技解决方案的主导供应商。公司致力于开发领先的产品第 10 页 共 33 页及服务,以满足航空公司、机场、非航空旅游产品和服务供应商、分销代理人、机构客户、民航旅客及货运商等所有行业参与者,进行电子交易及管理与旅游相关信息的需求。 公司的核心业务集中在电子旅游分销(ETD) 、机场旅客处理 (APP) 、数据网络、航空货运(ACS)及基于互联网的旅游平台等5 个重要领域。2004年,电子旅游分销系统处理旅客量13220万人次;机场旅客
23、处理系统在国内外 129个机场使用,2004年处理旅客量达10230 万人次。公司目前所拥有的数据网络现有83个节点,用户终端数约 32000台。国内的服务网络已覆盖各主要城市以及港澳地区,网络接入服务延伸到约300个城市,并通过SITA连接到全球50余个城市。向中国大陆所有航空公司、120余家机场和5000余家旅行社、宾馆等代理机构,提供实时数据传输和交换服务。 2001年2月7日,中国民航信息网络股份有限公司H 股在香港联交所主板成功上市,交易代码0696,共募集企业发展资金约12亿港币。公司上市后,获得投资者好评,当年被香港恒生指数服务公司列入恒指成分股,并被香港联交所认可为“ 可沽空股
24、份 “。2001年,中国航信等八家香港上市公司被国际财经杂志福布斯评选为本年全球最佳二百家小型企业。2002年,中国航信入选德勤亚太区高科技高增长500强(“Technology Fast 500”)企业,中国航信以过去三年实现年收入增长38% 的良好业绩,位列第218位。2002年底,本公司建立第一级美国预托凭证计划(ADR) 。 中国民航信息网络股份有限公司面临的挑战中国民航业在经历了90年代的高速增长后,正进入自身发展的 “高原期”;第 11 页 共 33 页同时,入世又为国外航空巨头进入中国航空市场打开了方便之门,随着航空运输服务的销售和营销服务、计算机订座系统服务等逐渐放开,民航业将
25、直面跨国航空巨头的激烈竞争。在即将面临的这场中国航空史上前所未有的竞争中,中国民航一方面要寻求与跨国公司合作,以规避风险;另一方面要大力推动自身的信息化建设。根据集团公司发展战略,公司下一步的发展目标是加速实现从平台运营商到综合产品服务提供商的根本性转变。如何能够提高信息网络的管理水平,将成为集团公司的一个重要任务。同时在信息网络的管理方面,TravelSky还面临以下的挑战: 有限的人员维护全国庞大的网络系统 需要减少故障处理时间 系统可靠性需要提高 数据网络业务发展迅速 大量系统监控的工作手工进行,效率低且容易出错 需要更多了解应用层面的运行状况 集中的告警和自动处理项目介绍本次中国民航信
26、息网络股份有限公司(TravelSky)网络管理项目设计的管理范围包括TravelSky的总部和TravelSky 各分中心 :北京地区、东北地区、华北地区、华东地区、南航、中南地区、西北地区、西南地区,超过300台路由器和交换机。网管系统需求分为六部分,一是网络事件管理需求,二是网络拓扑管理需求,三是网络性能管理需求,四是网管系统监控需求,五是网络配置管理需求,第 12 页 共 33 页六是网络管理统计分析。针对前四部份之需求,本系统分为四大模块(Tivoli Framework,Tivoli Netview,IBM Tivoli Monitoring,Tivoli Enterprise C
27、onsole)以设计各项功能。整个项目的实施目标如下 对通信线路、网络节点设备的故障进行主动性告警,提高网络故障响应能力; 收集网络性能数据进行分析,消除故障隐患,为网络的扩容、改造提供科学依据; 利用分布式网络拓扑来查看和管理网络设备,提高网络运行、维护、管理的整体水平和质量; 利用系统监控体系来保障网管系统的正常工作,提高网管的可靠性; 利用全方位的报表系统,为相关领导决策分析提供依据,提高网管水平。整个项目的带来的价值如下 保障网络资源稳定、可靠地运行,减少故障时间 变被动维护为主动管理,实现集中告警 通过事件相关性处理确定问题根源,减少故障处理时间,提供了自动化处理的机制和手段 灵活、
28、可扩展的系统管理架构 根据不同业务系统的特点和需求,采取多种有效的报警手段 对网络管理工具和管理数据进行了全面整合,对网络运行的实时状况和历史运行情况有全面的掌握。第 13 页 共 33 页本项目使用的工具包括 Tivoli Monitoring,Tivoli Enterprise Console,Tivoli NetView 以及报表工具 Brio。2.2 一汽大众系统管理项目面临的挑战一汽大众的 FIS 系统是一汽大众的生产控制系统,它的运行状态是否正常,直接关系到生产线的一线生产,所以客户需要及时了解到FIS的运行状态,提前了解故障隐患,从而达到防患于未然。第一时间发现问题,解决问题,避
29、免大的生产事故。FIS 系统对可用性的要求非常高,一次不到一分钟的意外系统故障都将给生产部门带来较大的经济损失。因此需要监控系统不仅能够实时展现 FIS 系统的运行状况,还要对 FIS 系统的历史运行状况进行智能分析,同时还能够对未来可能发生的故障进行预警和趋势分析。项目介绍FIS 系统的全部设备包括 IBM UNIX 服务器、FIS 系统 PC 终端前置机,磁盘存储服务器、磁带库以及存储交换机。同时还需要监控在这些设备上运行的AIX操作系统、 IBM DB2 UDB 数据库、IBM WebSphere MQ 中间件以及 IBM Tivoli Storage Manager 存储管理软件。另外
30、,还需要对支撑 FIS 系统的存储区域网( SAN )和以太局域网( LAN )进行实时的监控。提供给用户的监控界面有四个。首先是系统的监控,展示给用户的是事件第 14 页 共 33 页管理平台。其次,我们可以通过Tivoli Netview的界面来监控网络环境的状态,Netview的典型界面如图所示。图中的节点颜色为绿色时,代表时没有故障,为黄色时代表部分设备故障,为红色则表示全部设备发生故障。用户可以通过点击相应图标的方式,进入具体查看故障的设备。通过Tivoli Product Center For Fabric,我们可以监控存储区域网的状态,图中的颜色定义与Netview 是一样的。最
31、后是我们的报表系统,报表系统是在监控软件收集到的数据的基础上,进行统计和分析,将 FIS 系统历史运行状况的数据展示给用户,从而给用户非常直观的了解一段时间系统的运行状况。同时,用户还可以利用报表所提供的工具对于历史数据进行人工的分析,查找趋势,找到问题之间的关联等。图就是我们的报表系统的管理界面。用户将上述的四个监控界面展示在监控室的终端机的屏幕上,一旦发现有黄色以上级别的事件或故障产生,需要及时定位并报告。由负责系统的管理员进行处理。本项目使用的工具包括 Tivoli NetView,Tivoli Product Center For Fabric,Tivoli Monitoring,Ti
32、voli Enterprise Console,Tivoli Data Warehouse, Tivoli Service Level Advisor 以及 报表工具 Crystal。2.3 江苏农行系统管理项目面临的挑战第 15 页 共 33 页江苏省13个地市行的业务数据全部集中共享在中国农业银行江苏省分行省域数据中心的一套数据库管理系统中,已经实现了省域数据大集中,全面实现了各项银行业务全省通存通兑。江苏省农行的业务建立在以 IBM eServer 为核心的三层架构之上,此外,省中心还有一些Unix和 PC服务器,作为代收费、报表等应用服务器。各个银行网点的终端通过运行SCOUnix的前
33、置服务器连接到省中心的应用服务器。经过多次数据集中、数据上收后的省域中心,主机资源众多,应用种类复杂,系统管理人员又偏少,数据中心面向的是全省2000多个网点,日平均交易量近150万笔,主机集群系统为江苏省农行主机业务处理能力打开了广阔的空间,然而软,硬件环节的增多,又加大了主机运行的压力及风险。 面对如此庞大的系统资源,仅仅依靠人力已无法进行全面有效的管理,一旦出现系统或应用问题,工作效率不但受到严重影响,江苏省农行还要承担高度的业务运行风险和经营风险,而且仅仅依靠主机系统本身提供的功能,也无法管理如此众多的大中型主机。项目介绍IT系统管理应该包括以下几个方面:服务器实时监控 自动值守江苏省
34、农行核心服务器的关键资源,管理人员可以只在故障隐患发生时,才对系统进行设置和管理。该功能可以通过 IBM 系统管理解决方案来实现,该方案的核心产品是Tivoli Monitoring,这是一个多用途监视引擎,该软件所采用的技术,能够为所有环境中受到监视的绝大多数资源部署单一监视解决方案,使用户可以通过系统监视器,分享共同的报告机制和图形用户界面,并具有产生历史报表的共同数据中心库。 第 16 页 共 33 页控制中心 通过一个控制中心,对整个系统进行监控。通过控制中心可以清楚地知道IT系统的全面状态,同时,能够集中处理故障事件,并累积故障处理的知识,减少处理问题所花的时间。Tivoli Ent
35、erprise Console 是 IBM Tivoli 事件关联和自动化的核心产品,它具有综合的事件集成能力,提供企业事件关联能力,允许进行自动事件告警,并利用可靠的安全功能进行响应,提供集成网络管理和诊断功能。 业务影响管理 从整个业务系统的角度来看待IT系统的服务水平,使管理人员可以从业务体系的角度观察每个业务体系的逻辑拓扑,各个子系统的状态及发生的相关故障的信息,通过逐步深入的分析,从而了解具体的故障发生原因以及对整个业务系统产生的影响。业务影响管理解决方案的核心产品是Tivoli Business System Manager。 该软件提供单一的、完全集成、可扩展的业务系统管理,在所
36、有的管理视图十具有一致的感觉,允许用户定制管理资源的范围及显示风格,允许灵活地管理整个计算环境,通过提供容易使用的工具及从Tivoli、 IBM和第三方系统管理源收集到的数据来扩展TBSM 的使用。 通过集中管理平台的建立、管理功能的实施和全面管理的实现,江苏省农行的管理系统有效地提高了整个系统的可靠性和对外服务能力,赢得了更好的客户满意度,提高了整个业务系统的服务水平全面监控省行环境中的多种服务器(OS/400、RS6000、Windows) 、数据库和应用等IT资源针对应用提供了额外的监控信息,帮助管理员对应用运行情况有更多了解保障IT资源稳定、可靠地运行,减少故障时间变被动维护为主动管理
37、,实现集中告警第 17 页 共 33 页通过事件相关性处理确定问题根源,减少故障处理时间,提供了自动化处理的机制和手段本项目使用的工具包括 Tivoli Monitoring,Tivoli Enterprise Console 以及 Tivoli Business System Manager。2.4 广东移动 BOSS 系统管理项目项目背景本项目是广东移动业务支撑系统BOSS 计费应用项目的一部分,实现了AIX系统、Windows系统、Informix数据库、CICS中间件、网络以及BOSS计费应用的实时监控和管理。项目实施范围包括一个省中心、6个区域中心,实现了集中、分级管理。通过上述功能
38、的实现,统一了该项目的维护流程,提高了系统故障处理速度,极大的降低了系统管理人员的工作负荷。项目介绍广东移动BOSS业务系统管理项目需要进行管理的资源主要包括二十三个地市的网络和服务器。其中,每个地市有6台AIX RS6000服务器和若干台PC 服务器以及SUN服务器。首先,在管理模式方面,Tivoli 既可以采用集中模式进行管理,即省一级结构,所有的系统由中心管理员统一集中管理。也可以进行分布式自治管理,即省市二级机构,由下面各区域职能中心的管理员管理各自的区域所属的系统,只是把严重的告警信息传给中心处理;或者,出现各分级管理员无法处理情况时,把关键设备的控制权交给中心,由中心的管理员处理。
39、第 18 页 共 33 页根据广东移动的要求,BOSS 系统的管理应该实现省、市两级的管理(考虑到GMCC暂时不设立省的网管中心):市中心应实现对本地网络设备、服务器和应用程序的监控、告警和配置,以及性能分析历史数据的采集和存储的所有功能。将来的省中心应实现对省中心网络设备、服务器和应用程序的监控、告警和配置、以及性能分析历史数据的采集和存储的功能;应实现对市中心核心网络设备、核心服务器和核心应用程序的监控、告警和配置,以及对于省内所有服务器和网络设备的性能的历史数据的存储、分析、产生报表等的功能。结合以上的需求,IBM为广东移动设计了省市二级分布自治的管理模式。和两层结构相比,三层结构无论在
40、系统的强壮性、灵活性、可扩展性以及效率方面,都要远远优胜。三层结构的优越性尤其表现在通讯效率和数据流量方面。Tivoli采用的是“ TMR Server / Gateway / Endpoint“的三层结构,分别对应于”省 / 地市 / 被管节点“。在这种情况下,对于具体某个地市的某台服务器在系统管理方面产生的流量,主要是该服务器和本地网关之间产生的局域网流量;只有在某些重要的信息需要由网关发送到省中心的服务器时,才会占用少量的广域网带宽。而且,一个TMR Server下面可以带200个Gateway,而每个Gateway最多可以带 2000个Endpoint。因此,如果在实际应用中发现, 由
41、于某台Gateway所管理的 Endpoint数量或监控任务过多,以至和Endpoint之间的通讯流量过大,那么可以通过另外配置一台或多台Gateway来进行负载分担。而且,在TMR 环境中执行系统监控任务时,Gateway 和Endpoint 之间的通讯并不是基于Gateway 向 Endpoint进行轮询的方式。Endpoint只有在监控的变第 19 页 共 33 页量超过阈值需要报警时才会和Gateway发生通讯流量。也就是说,系统管理对局域网带宽的占用其实也是很小的。所以,和其他厂商的产品相比,正是基于Tivoli这种先进的三层结构以及Endpoint主动报警的监控方式,在TMR环境中
42、是不会存在单点的通讯瓶颈而导致整个系统的性能下降的。因此,推荐使用省市二级的分布自治的管理模式。其次,在权限控制方面,根据GMCC的要求,BOSS系统应实现统一的用户权限控制:在市中心实现本地用户权限设置。在省中心实现全省用户权限设置。Tivoli的权限控制机制是内置于管理平台中的。由于所有的管理模块都是搭建在管理平台的基础上的,所以Tivoli提供的是真正集中的安全机制,而不是独立于各功能模块中安全功能的松散组合。因此,在Tivoli环境中,用户的权限可以根据部门、地域、管理对象、管理模块等进行灵活的划分。结合GMCC的需求,在BOSS的系统管理中可以根据地域划分不同的管理区域,不同的管理员
43、对应于不同的管理区域具有不同的管理权限。2.5 上海农行系统管理项目简介项目背景上海农行作为一家专业的银行,在整个上海市的经济中占有举足轻重的地位,上海农行的业务横跨整个上海市,有几百个营业网点。整个业务处理系统第 20 页 共 33 页以S390主机为主,同时分布式的UNIX 服务器承担着如网上银行等关键业务。网络系统同时运行SNA 和 IP,为了使整个系统的运行更为可靠、安全,更具有可管理性,所以农行提出了以下管理要求:希望提供全面的SNA 与IP 集成网络管理使之能适应新的网络架构希望提供直观的图形化的管理工具以降低管理的难度。希望提供对系统(网络、主机和分布式系统中的服务器)的监控,实
44、现故障管理,并且提供自动故障响应和自动处理。提供用户支持中心,同时使网络和系统管理能和用户支持中心联系在一起,信息共享,从而可以更快地解决发生的问题。项目介绍由于上海农行环境与需求的复杂性(要求集成SNA与IP 管理,管理功能多),IGS基于Tivoli管理平台的实施完成了一整套的技术方案。方案采用了Tivoli Framework, NetView (for AIX和for 390), Tivoli Enterprise Console, Distributed Monitoring, Tivoli Decision Support等产品,并集成了CISCOWorks。2.6 上海通用汽车系
45、统管理项目简介项目背景上海通用的计算机应用系统共分为主机(Mainframe)、分布式系统(UNIX,NT) 、OA(NT) 和网络四大块,分别服务于生产控制,ERP 系统,销售管理系统及后勤保障和办公自动化等应用。IT集成管理项目要求将以上平台和第 21 页 共 33 页应用(390除外)统一在一个具有全面集成能力和易于扩展的系统管理平台上,实现网络管理,系统监控,系统性能分析,服务台管理,资产管理,变更管理,统计报表等功能项目介绍将上海通用原有的HP OpenView,Cabletron Spectrum等网管产品集成到统一的Tivoli管理平台,同时完成了上海通用部分应用系统的监控集成,
46、实现了完整的网络管理,系统监控,系统性能分析,服务台管理,资产管理,变更管理,统计报表等功能。在上海通用的配合下,IGS团队完成从流程设计,需求分析,技术方案设计,实施,培训,到技术文档的全部工作,完全实现了客户需求。3、流程管理案例3.1 中国建设银行运行中心流程管理项目建设银行运行中心面临的挑战建设银行数据集中工程已经进行到第二阶段,即推广阶段,到2004年底,将有20个一、二级分行的核心业务将集中到北京和上海南北运行分中心,而在2005年底之前,建设银行将完成全行的数据集中工作。目前北京和上海南北运行分中心在进行分行上收工作的同时,日常运行管理的工作比重也随着分行的第 22 页 共 33
47、 页按计划上线而逐渐加大。南北运行分中心在确保分行上收工作的同时,在运行中心管理流程建设方面已经作了很多基础工作,制定并实施了针对问题管理、变更管理、配置管理、操作管理等要求的一些标准操作流程和相应的管理办法,通过纸质报告、Notes 邮件和常用办公软件方式进行处理。 IBM本地390技术支持人员和海外专家在建行数据集中工程中,在390主机系统、IMS 数据库系统、核心业务系统和网络系统等方面提供操作支持和技术管理维护工作,协助建行运行中心制订了运行中心核心系统的标准操作手册和应急处理手册等标准操作工作流程,还负责提供运行中心核心系统定期的全面健康检查、性能管理、容量管理等服务。随着分行的不断
48、集中,建行运行中心不但承担的运行任务不断加重,而且为了满足分行新的业务需求,新的核心系统应用版本也在不断更新,现有的管理工作方式已经很难满足运行中心运行高效管理的要求。借鉴国际上使用大型机的金融行业数据中心先进成熟的运行管理经验和标准,完善运行中心南北分中心的管理流程并最终建成一流的数据中心已经成为建设银行数据集中工程的重要工作内容。数据中心管理流程的建设就是要在分析建行核心业务系统的业务和管理特点的基础上,结合建行的大型主机运行维护和技术管理的实际情况,制定出一套适合建行特点的,涉及操作管理、问题管理、变更管理、资源管理、容量管理、性能管理、可用性管理、知识库管理、自动化、备份/恢复管理等全
49、方位的数据中心管理流程,并借助系统工具以确保流程的有效实施,确保能够持续提高运行中心南北方分中心的服务管理水平,提升核心系统的可用性,从而有力地保障核心业务系统的稳定运行,更好地配第 23 页 共 33 页合建行行股改工作的顺利实施。项目介绍流程管理平台项目分为两大阶段进行,第一阶段为流程咨询阶段;第二阶段为流程实施阶段,两个阶段的工作均由IBM负责实施。流程咨询阶段为数据中心流程管理平台项目的第一阶段,IBM 向建行提供运行中心流程管理平台所需的以下七个模块的管理流程咨询设计服务:服务台、事故管理、问题管理、变更管理、配置管理、发布管理、运行管理。以上七个模块所涉及的范围为建行运行中心南北分中心的日常工作及流程根据建行运行中心南北分中心现有的系统监控产品(包含主机、大前置、网络)的现状,提供与流程管理平台的接口规范及连接方案。流程管理平台的实施阶段为流程管理平台的第二阶段,通过使用业界领先的基于REMEDY 平台的流程管理工具,IBM专有IRMA解决方案,IBM在不足六个月的时间里完成了上述7个模块的工具实施工作。将第一阶段的流程设计成果进行电子化、自动化的实施。并与企业的邮件系统,短信系统进行了集成,系统上线以后获得广泛好评,建行计划将其向分行进行推广。本项目使用的工具包括Remedy ARS开发平台以及R