收藏 分享(赏)

机房DCIM方案.docx

上传人:cjc2202537 文档编号:4873339 上传时间:2019-01-18 格式:DOCX 页数:40 大小:2.50MB
下载 相关 举报
机房DCIM方案.docx_第1页
第1页 / 共40页
机房DCIM方案.docx_第2页
第2页 / 共40页
机房DCIM方案.docx_第3页
第3页 / 共40页
机房DCIM方案.docx_第4页
第4页 / 共40页
机房DCIM方案.docx_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、数据中心基础设施监控管理(DCIM)解决方案V1.02015 年 06 月 12 日目 录第 1 章 项目概述 31.1. 项目背景 31.2. 需求分析 41.3. 项目目标 4第 2 章 系统设计 52.1. 设计概述 52.2. 设计依据 52.3. 系统关键参数 62.4. 系统架构 72.4.1. 物理架构 .72.4.2. 功能架构 .8第 3 章 DCIM 系统亮点 .10第 4 章 DCIM 系统功能 .114.1. 个人工作台 114.2. 基础设施监控子系统 .114.2.1. 可监控的设备 .114.2.2. 设备展示功能 .184.2.3. 告警功能 .194.3. 能

2、效管理子系统 214.3.1. 能效展示 .224.3.2. 能耗分析 .244.3.3. 能效控制 .264.4. 资产管理子系统 264.4.1. 仓库资产管理 .274.4.2. 在架资产管理 .284.4.3. 办公资产管理 .284.4.4. 资产维保信息管理 .294.4.5. 其他资产相关功能 .294.4.6. U 位检测系统布署预留 294.5. 容量管理子系统 294.5.1. 容量建模 .294.5.2. 容量展示 .304.5.3. 容量预分配 .304.5.4. 趋势分析 .314.6. 变更管理子系统 314.6.1. 流程逻辑说明 .314.6.2. 变更流程控制

3、 .324.6.3. 变更风险控制 .324.6.4. 变更数据管理 .324.7. 可用性管理子系统 .324.8. 报表管理 334.8.1. 预定义常用报表报告模板 .334.8.2. 自定义报表报告模板功能 .334.8.3. 报表报告管理 .33第 5 章 客户收益 345.1. 基础设施监控回报 .345.2. 能效管理回报 345.3. 资产管理回报 355.4. 容量管理回报 35第 6 章 应用场景举例 .376.1. 统一监测 376.2. 报警定位:复杂事件分析 CEP376.3. 节能:幽灵服务发现 .376.4. 批量资产预占与上架 .376.5. 资产盘点 386.

4、6. 功耗控制与容量优化 .38第 1 章 项目概述1.1. 项目背景在当前高速信息化发展的时代背景下,数据中心是整个社会信息化的基础。数据中心础设施直接影响了数据中心安全、高效、环保、稳定的运行。如何维护好机房,及时发现隐患和排除故障,降低管理成本,提高运维效率,控制机房能耗,成为管理者关注的重点。对机房管理者来说,存在下列痛点:管理效率低 投产后的数据中心最关注的是稳定和高效,稳定与管理团队的日常运维相关,高效与科学化的监控管理系统相关,此中包含的三要素就是:数据中心监控管理系统 管理团队。由此可知,监控管理系统相当于数据中心和管理团队之间的纽带,管理人员通过监控管理系统去感知数据中心的各

5、项指标参数正常与否,结合数据调整运维流程,应对突发事件。目前,绝大多数数据中心投入使用的监控管理系统繁多复杂,且各系统间的相互独立造成信息孤岛;另一方面,现有的许多监控管理系统自动化、智能化程度不够,造成日常运维管理对人力依赖大。资产难管理 数据中心管理诸多管理工作中,涉及 IT 资产上架、下架、维护、盘点等工作十分头疼。现有对 IT 资产的管理主要是依靠人工+简单系统统计来实现,例如定期对在架的资产盘点,在缺乏智能资产管理系统的状态下,处理这些工作对人手依赖程度高,工作内容简单重复,很难保证操作与记录的准确性,导致账实不符。容量利用率低 数据中心的配电容量、制冷容量、机柜 U 位容量决定了该

6、数据中心的计算能力。在缺乏有效的管理工具的状况下,IT 设备部署需求与数据中心容量实际供给情况难以匹配,导致基础设施容量实际利用率低。据 Gatener,90%以上的数据中心容量利用率不到 70%。故障定位难 数据中心管理人员对监控系统的核心关注点在于告警准确性,但实际上因为数据中心本身复杂性高,当一台设备出现故障时,经常引发并发告警。因此,在基础设施的管理层面,必须依靠监控系统来精准定位故障,以确保管理人员第一时间知道后迅速处理恢复。鉴于以上数据中心管理者所面临的各种痛点,应当采用一套可将:基础设施、资产、容量、日常运维、机房安全性作出统一管理的系统。数据中心基础设施管理(DCIM )系统

7、就应运而生 ,亦是当前数据中心行业发展的必然趋势。共济 DCIM 定义如下 :通过监控、分析数据中心基础设施的运行信息(如状态、参数、配置等) ,帮助数据中心管理者掌握数据中心基础设施运行情况(当前与趋势) ,管理数据中心资产、基础设施资源(空间、电力、冷量等) 、能耗,提高基础设施可用性、资源利用率、管理效率与能效。1.2. 需求分析据与用户初步交流,此次机房改造,需完成如下工作:1、 集成原有动环监控系统;2、 新增 xxx 节蓄电池监测、x 台 UPS 监控;3、 增加移动巡检系统、资产管理、容量管理等管理功能;4、 全部子系统接入 DCIM 系统,通过 DCIM 平台对各子系统进行的统

8、一管理。1.3. 项目目标为机房布署数据中心基础设施管理系统。实现以下目标:1) 实现数据中心基础设施集中监控,全面直观展示数据中心基础设施运行状态,精准定位故障,分析预防故障。2) 实现数据中心资产全生命周期智能管理,给客户提供面向企业内部统一的资产管理平台。3) 提供机房实物资产自动化盘点工具,并为机房容量管理、配置管理等 IT 服务管理提供数据接口,协助管理员高效运维机房业务。第 2 章 系统设计2.1. 设计概述DCIM 系统通过统一的操作平台和统一的通信平台,完成对动力系统(供配电系统) 、环境系统、安防系统(包括视频监控系统、红外报警系统)各子系统无缝数据集成,实时获取各子系统监控

9、数据,通过对各子系统监控数据处理、分析及逻辑判断,实现上述各子系统的集中视图、集中监控、集中告警、集中数据分析和统一运维管理。对于各子系统集成,采用分布式部署、分散控制原则通过分布式部署系统采集网关,完成各子系统数据采集和分散控制交互,从而达到子系统之间的数据无阻塞交互、各子系统之间实现互通互联。DCIM 系统作为开放式信息交互平台,能够采用多种方式实现不同子系统厂商产品的信息接入及功能集成,如采用OPC、 SDK、Webservice、Socket 等多种方式。针对机房内分散、相对独立的系统,通过独立部署系统采集网关的方式经由运维网络实现各系统之间的互联互通。所有信息汇聚至 DCIM 系统,

10、DCIM 系统对外提供B/S 分布式远程访问,在运维网络的任意一台工作站上,运维人员均可采用 B/S 方式对自身授权范围内的子系统系统进行实时操作。整体操控界面采用组态方式,提供多种展示工具,实现动态图形、文字、图像相结合,满足运维人员的查看、查询及管理需要。DCIM 系统通过系统网关完成各子系统之间的协议对接、标准协议转换、数据转换,实现综合监控系统与各子系统间的通讯联网和数据交互。2.2. 设计依据电子信息系统机房设计规范 (GB 50174-2008)电子信息系统机房施工及验收规范 (GB50462-2008)电子计算机场地通用规范 (GB/T 2887-2000)数据中心基础设施监控白

11、皮书数据中心基础设施管理白皮书综合布线系统工程设计规范 (GB50311-2007)供配电系统设计规范 (GB 50052-2009)2.3. 系统关键参数参数类型 参数说明容量 单台服务器 50 万测点并发访问 200 个用户数量 大于 5000报警数据采集 小于 6 秒命令下发控制 小于 5 秒变化数据采集 小于 6 秒页面响应速度 小于 1 秒在架资产盘点 小于 10 秒运行网络环境 内部网络不低于百兆带宽;如需外网方位,需 VPN 网络做安全控制运行服务器环境 不低于如下配置:CPU: Intel Core I5 以上内存:8G 以上硬盘:1T 以上操作系统:CentOS 6.42.4

12、. 系统架构2.4.1. 物理架构DCIM 系统物理架构图 数据采集处理层数据采集处理层设计为系统的数据入口,是系统管理所需基础设施数据的来源,其通过提供标准接口及协议,接收原有的监控控系统、新增的资产容量系统以及蓄电池检测系统的监控数据。 管理服务层管理服务层以下服务:基础设施监控服务、能效管理服务、资产管理服务、容量管理服务、告警告知服务、移动巡检管理服务。通过对采集数据进行二次计算,形成上层管理所需的数据。随着数据中心管理成熟度的提高,增加功能模块扩展方式拓展运维管理功能,易满足数据中心管理需要,系统支持拓展增加工单管理等模块。管理服务层相当于发布各种监视和管理的核心层,作为数据采集层和

13、展示层之间的关键环节, “DCIM 系统”是发布上述服务功能的核心。 展示层展示层提供丰富的展示媒介,包括手机终端、PC 浏览器等;提供 2D/3D 展示效果;提供友好的用户界面。随着应用设备的发展,根据应用需要,在应用层增加展示应用模块。2.4.2. 系统性能(1) 测点容量:DCIM 系统数据处理容量最大 500,000 点;(2) 系统中断自恢复:当系统因供电及其他意外非正常中断运行时,系统将从软、硬件两个方面进行自动恢复,即服务器立即重新启动,软件自动启动运行;(3) 系统架构:系统采用分布式、模块化架构;数据的采集、传输、处理相互独立,互不干扰;具有热插拔和主设备倒换功能,技术成熟,

14、运行稳定可靠;(4) IE 客户端:最大支持 200 个 IE 客户端并发访问;(5) 移动客户端:最大支持 50 个移动客户端并发访问;(6) 报警数据采集周期:小于 5s;(7) 命令下发控制:小于 5s;(8) 变化数据采集:小于 4s;(9) 页面响应速度:小于 4s(远程监控刷新时间) ;(10 ) 报警方式:支持页面报警、电话报警、短信报警(短信网关) 、语音报警;(11 ) 告警发出:小于 20s;(12 ) 数据管理:运行状态、报警信息、系统日志全部记入数据库,可通过数据管理查询。DCIM 系统实时、准确的显示所有监控信息,系统采样时间由管理人员设定。2.4.3. 功能架构系统

15、采用模块化的架构进行设计,确保系统的稳定可靠运行,任何模块出现故障不会影响同级别的其他模块的正常工作;系统采用分布式系统架构,确保系统后续的扩容能力和系统反应速度。DCIM 系统基于网络分布式部署,运维网络内的任意一台或多台集成工作站,运维人员权限相同时,系统将以相同的界面操作,管理整个机房权限范围内的子系统,并具备授权的所有操作功能。当需要增加监控工作站时,可在机房区内的任何地方的运维网上增加网络点、工作站即可,通过系统提供的 B/S 方式进行管理,以最大限度保护投资,完成监控功能。第 3 章 DCIM 系统亮点1) 监控全覆盖,可视化展示基础设施实时状态2) 精细化微环境检测,监控每台 I

16、T 设备的进风温度3) 复杂事件分析处理,准确定位故障;大数据分析,智能预警4) 资产自动检测,线下资产变更,线上信息自动更新5) U 位级资产定位,资产部署维护准确高效6) 在架资产实时盘点,及时提交准确报表7) 数据中心全方位资产生命周期管理,资产说得清、管得住8) 可视化容量管理,直观展示容量使用情况及趋势分析,扩容决策及时准确9) 批量设备预占快速匹配,多套精细部署方案,减少容量碎片10) 设备部署合理,平衡各维度容量综合利用率,避免单项容量短板11) 精细化能效管理,监控每台耗电设备能耗,能效指标计算与对标12) 内置能效分析工具,多维度进行能效数据分析13) 提供多种节能控制方案,

17、包含手动控制和自动控制14) 节能方案进度跟踪,节能效果验证,输出节能报告15) 变更活动统一规范管理,变更风险管控,降低变更带给业务的影响16) 基础设施可用性实地建模,精确计算可用性变化,实时掌握可用性状况17) 准确提供灾备系统迁移依据或启动数据中心应急预案18) 提供多维度运行分析报告,为运营决策提供数据支持第 4 章 DCIM 系统功能4.1. 个人工作台共济数据中心基础实施监控管理系统可建立不同角色,不同角色拥有自己对应的个人工作台,在工作台中,显示自己关注或与自己相关的监控管理工作,以便只要打开 DCIM 客户端,就能立即查看自己所关心的、自己所要做的工作。不同的用户角色,不同的

18、权限看到不同的内容,执行不同的操作。个人工作台会把和每个人相关的任务推送给他,也会把执行任务所需的信息和他所关注的信息推送给他。进入个人工作台就能够完成任务,当需要更多信息时才进入到各个模块中。基于对用户的管理,系统在展示界面中以“个人工作台”体现角色的分配,根据人员所处的“管理” 、 “决策” 、 “执行”层级自行定义用户的工作台界面。4.2. 基础设施监控子系统4.2.1. 可监控的设备本次机房 DCIM 系统监控的设备,只包括原有的动环里的设备,以及清单里面的设备。序号监控分类 监控对象 监控指标低压进线总柜低压进线总柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度参数,以及断

19、路器的分/合状态;具有设备参数显示、故障波形捕捉、事件记录监控;监测其三相不平衡度、零地电压、谐波含量参数。ATS 自动切换开关ATS 自动切换开关:监测 ATS 设备的常用、备用电源线电压、频率参数,以及常用、备用电源的开/关状态。(ATS 应自带通讯接口,同时需 ATS 厂商开放通讯协议)UPS 输入配电柜UPS 输入配电柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度参数;监测断路器的分/合状态。低压配电柜低压配电柜:监测三相电的相电压、线电压、相电流、频率、功率、电度参数;监测断路器的开/合状态。UPS 不间断电源UPS 不间断电源:监测 UPS 三相输入电压,三相输入电流、

20、输入功率、输入频率、三相输出电压、三相输出电流、输出功率、输出频率、电度、旁路电压、旁路电流参数,UPS 输入、旁路、逆变器、整流器状态及电池充放电状态;宜监测电池后备时间参数。不对 UPS 进行控制。(UPS 应自带通讯接口,同时需 UPS 厂商开放通讯协议)1 动力监控蓄电池组 蓄电池组:监测蓄电池组总电压、单体电压、充放电电流以及单体表面温度参数;监测蓄电池单体内阻参数。UPS 输出配电柜UPS 输出配电柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度参数;监测断路器的分/合状态。列头柜列头柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度、各支路电流参数、各支路分/合

21、状态以及断路器的分/合状态。(列头柜应自带通讯接口,同时需列头柜厂商开放通讯协议)柴油发电机柴油发电机:监测发电机三相输出电压,三相输出电流,输出频率,输出功率参数,以及其工作状态(运行、停机)、工作方式(自动、手动)、市电故障状态;宜监测其油罐的液位、润滑油油压、润滑油油温参数;宜监测发电机的转速、水温(水冷)、皮带断裂(风冷)、启动失败,过载状态。(发电机应自带通讯接口,同时需列头柜厂商开放通讯协议)PDUPDU 电力分配单元:监测 PDU 主输入的电压、电流、功率、电度、各支路电流。(PDU 应自带通讯接口,同时需 PDU 厂商开放通讯协议)STS STS 静态转换开关:监测输入、输出线

22、电压,输入、输出相电流,频率,功率因数参数,以及双路电源的开/关状态。(STS 应自带通讯接口,同时需 STS 厂商开放通讯协议)精密空调精密空调:监测其开、关状态、送风温度/湿度、回风温度/湿度参数;控制其开、关机。(精密空调应自带通讯接口,同时需精密空调厂商开放通讯协议)普通空调普通空调:监测普通空调的开、关机状态,控制其开、关机、温度设置;实现来电自启动。新风机新风机:对机房的独立新风机进行监控;机房如与其他功能用房建于同一建筑内,并与其他功能用房共用新风系统,宜通过集成方式获取有关机房新风系统的监控数据;应监测新风机启/停、过滤网压差状态;宜控制新风机的启、停,同时确保新风机与压差的联

23、动。温湿度 温湿度:监测主机房内的温度值、湿度值;漏水漏水:监测机房内有水源区域的漏水状态,显示具体漏水位置。避雷防雷器:监测机房配电设备的各级防雷装置的工作状态。2 环境监控加湿器加湿器:监测加湿器的开、关机、工作状态,以及湿度参数,控制加湿器的开、关机。(加湿器应自带通讯接口,同时需加湿器厂商开放通讯协议)微环境系统微环境系统:监测机柜温湿度、机柜级电源、机柜烟雾、机柜门状态、机柜附近人员活动情况。视频监控视频监控:包含视频探测、图像实时监视和有效记录、回放;对多路图像信号实时传输、切换显示,应能定时录像、报警自动录像,报警自动录像应包含预录像功能,对云台、镜头预置和遥控;显示、记录、回放

24、的图像质量及信息保存时间应满足机房管理要求,每路视频存储时间应 30 天或以上。门禁门禁:监测主机房、支持区出入口的开/关状态,自动记录、存储各种刷卡、报警事件;系统应满足紧急逃生时人员疏散的相关要求,在紧急逃生时,能自动开门;对受控区域的位置、通行对象及通行时间等进行实时控制,能远程控制开关门。消防告警 消防告警:监测消防告警主机的告警信号。3 安防监控防盗入侵防盗入侵:安装入侵探测设备,构成点、线、面、空间或其组合的入侵报警系统;显示和记录报警部位和有关警情数据,提供与其它子系统联动的控制接口信号。4 IT 设备监 服务器 使用资产检测条:在架位置使用 IT 监测:实时功耗、进风温度、利用

25、率、硬件错误报警(风扇故障)远程开关机、远程控制功耗交换机使用资产检测条:在架位置使用 IT 监测: 实时功耗、进风温度控存储设备使用资产检测条:在架位置使用 IT 监测: :实时功耗、进风温度远程开关机、远程控制功耗消防系统消防系统:基础设施监控管理系统应通过集成方式获取消防系统的监控数据;监测消防系统的各种参数和报警事件,不对消防系统进行控制;消防系统提供集成接口及协议。高压变配电系统高压变配电系统:基础设施监控管理系统应通过集成方式获取高压变配电系统的监控数据;监测高压变配电系统内各种配电设备的参数、状态及报警事件,不进行控制;高压变配电系统提供集成接口及协议。5第三方系统集成配线系统配

26、线系统:基础设施监控管理系统应通过集成方式获取楼宇自控系统的监控数据;展示配线路由,监测配线设备参数、状态及报警事件,不进行控制。配线系统提供接口及协议。楼宇自控系统楼宇自控系统:基础设施监控管理系统应通过集成方式获取楼宇自控系统的监控数据;监测楼宇自控系统内各种设备的参数、状态及报警事件,不进行控制;楼宇自控系统提供集成接口及协议。智能照明系统智能照明系统:基础设施监控管理系统应通过集成方式获取数据中心的智能照明系统监控数据;应监测智能照明系统的灯光状态;进行开关控制、场景切换、亮度调节及联动控制;智能照明系统应对第三方系统提供集成接口及协议。4.2.2. 设备展示功能在系统中可动态的展示机

27、房内重要设备的关键参数,展示方式有 2D 和 3D 展示模式。 2D 展示监控平台界面显示为全中文界面,采用图形化设计。界面的结构、层次清晰明了,页面风格可以按照用户需求进行定制,能够实时直观地显示设备的运行数据和运行状态。通过软件界面可直观的展示出机房内的情况,包括整体结构、空调、PMM 柜、服务器机柜的摆放位置都要在图中体现出来。根据设备的种类分配每一个子系统,例如:电力子系统通过一张电力拓扑图,能快速掌握机房的电力系统,并通过该拓扑图帮助电力运维工程师管理机房内电力设备,在日常运维中发现风险点,保障机房供电安全。 3D 展示本次机房 DCIM 系统不包括 3D 展示。传统数据中心监控系统

28、主要采用“示意图+图例+数据”的展示方式,随着数据中心的日益扩大和用户需求的不断提升,这种方式已无法满足大型数据中心群的展示需要。为提高数据中心群的客户体验,我们推出了一套可将数据中心平面监控转化为具有高度现场感、仿真感的立体监控系统。通过前期的建模,将现实的建筑和设备模拟成 3D 模型,并在模型中动态显示出设备的关键参数。4.2.3. 告警功能系统提供灵活多变的告警管理功能: 报警机制:系统对报警事件按优先级的高低进行处理,并具备过滤机制。 报警方式:灵活多样,可以根据报警事件的报警级别提供不同的报警方式:短信、电话(此项不包括在此次 DCIM 系统中)等告警模式,同时告警信息可以限次播放,

29、而且在两次告警间的停顿时间可以设置。 定时信息发送:系统可通过短信等方式定时或按指定时间段发送机房相关信息,如:每天 8 点至 24 点期间逢整点发送指定测点温度、定时(每天中午 12点及晚上 8 点)发送机房整体运营状况等。 (此项不包括在此次 DCIM 系统中) 排班管理:根据预先设置的规则自动调整值班班次,实现自动短信通知值班人员进行上班提醒、值班情况考勤管理等功能。可与报警系统进行关联,还可以针对值班顺序作相应的报警发送,避免发生报警骚扰。 (此项不包括在此次DCIM 系统中) 按管理范围、值班情况报警:可以根据排班情况进行报警,报警只发给值班人员,休假时可以免除收到报警,避免形成“骚

30、扰” ;并可根据管理员管理范围划分进行报警,设置好后只会收到管辖范围内的报警,避免引起管理混乱。 (此项不包括在此次 DCIM 系统中) 报警屏蔽:可以屏蔽掉不重要的报警信息,增强系统的灵活性、提高对数据的可信度。 报警级别:报警信息可分级管理,用户可以根据实际发生的报警情况的紧急程度,选择不同的报警级别,对不同的报警级别,系统会以不同的报警方式对外报警。 报警升级:当一条报警信息在规定时间内没有得到确认,变会以升级的方式向上一层用户报警。主要有人员升级与设备升级两种方式。人员升级是指第一级报警接收人员在规定时间内没有确定报警信息,报警信息便发送给系统中设定好的上一级用户,以使报警信息能够得到

31、及时处理。设备升级是指当使用第一种报警方式发出的报警信息在规定时间内没有得到确认,系统便自动使用设定好的新一级报警方式发送报警信息,以使报警信息能够得到及时处理。 报警对象的准确定位:对报警的设备、事件、内容等进行准确定位,例如:“XX 机房的当前温度为 27.5 度,温度过高,请立即查看” “XX 机房 UPS 组电压偏低,请立即检查” 。 报警过滤机制:例如当某台 UPS 市电供入出现故障,可能会产生一系列的故障事件,如组电压偏低、单相参数为零、逆变器参数骤变等等,报警过滤机制则通过智能化的分析手段,对故障告警进行过滤,可准确定位故障为“UPS 市电供入断开” ,而不会发出一系列无关的告警

32、事件,防止短信骚扰管理人员。 短信查询:可以向监控系统发送短信获取设备数据。 (此项不包括在此次DCIM 系统中) 报警跟踪:系统提供对于任意一条报警信息的状态进行跟踪统计,包括报警时间,报警内容,确认时间,处理时间,处理日志以及处理人等情况的统计。并可对各项报警信息进行及时度统计。 (此项不包括在此次 DCIM 系统中) 未恢复报警事件列表:提供设备报警状态的显示列表,可查看哪些设备有报警,是否报警恢复。 设备屏蔽的邮件提醒解锁功能:对设备屏蔽报警后,可设置多长时间后通过邮件方式提醒管理人员进行解锁,且下次任何人员登录时系统自动显示所有已屏蔽的设备列表。 (此项不包括在此次 DCIM 系统中

33、) 预警管理:设备告警支持预警功能。用户可为关键的数据点设定预警阀值,系统通过趋势判断,在设备产生真正的告警之前先产生预警,提醒用户及时处理,避免真正告警的产生。 (此项不包括在此次 DCIM 系统中) 告警发送记录与查询:告警平台支持对所有告警发送任务的跟踪和记录,并提供方便的查询界面,便于用户对历史的发送情况进行管理。 双向短信查询系统支持双向短信查询,可以查询设备的实时数据、状态,也可以查询指定时间段、指定级别的系统事件。查询内容可由用户自行定义。每一组查询都有权限控制,只有经过授权的手机才可以执行相应的查询。 (此项不包括在此次 DCIM 系统中)4.3. 能效管理子系统信息化发展使数

34、据中心能耗逐年上升,运行费用成为重大经济负担,巨大的碳排放也污染了环境;数据中心高能耗已经成为公众关注的社会问题。能效管理子系统包含三大功能:能效展示、能效分析、能效控制。通过这三个模块实现数据中心的能耗可知可控。4.3.1. 能效展示1)PUE 展示PUE(电源使用效率)值已成为国际上比较通行的数据中心电力使用效率的衡量指标。PUE 值是指数据中心消耗的所有能源与 IT 负载消耗的能源之比。PUE 值越接近于1,表示一个数据中心的绿色化程度越高。PUE 是衡量一个机房是否节能的关键指标之一。 PUE 计算公式:a) PUE=总用电/IT 设备用电。b) pPUE=局部机房总用电/局部机房 I

35、T 设备用电。 历史 PUE 查询PUE 会存储到系统数据库内,方便用户随时检索以往任何时间点的 PUE 值,方便用户把历史 PUE 和当前实时 PUE 进行对比,可以了解机房电源能效比的变化。2)分子系统能效统计能效管理系统数据来自与机房的 UPS、UPS 配电柜、市电输入柜、精密配电柜、发电机等配电设备,通过能效管理模块就可以实时显示每个耗电系统(精密空调、冷水机组、照明、IT 系统等)当前的耗电情况,实时监测数据中心总能耗、IT 设备能耗、空调设备能耗等,数据显示支持数据列表、折线图、柱状图和饼状图等,用户可以根据需要自行定义。系统提供 24 小时能耗曲线,也可以查询这些设备的历史功率。

36、3)分模块电能管理整个数据中心分成多个模块机房,模块机房内分为多个冷通道,通过在每个模块机房的供电总进线安装电量仪统计该模块机房当前的耗电情况,并 24 小时能耗曲线。通过列头柜或者电能采集器统计每个机柜当前的耗电量和负载,由冷通道内 IT 设备与制冷设备用电情况计算出冷通道内 PUE 参考值。4.3.2. 能耗分析首先需要统计出数据中心的能耗系统图,了解各个模块能耗情况。如能源输入能耗、变配电能耗、负载能耗等。其次对各个分项能耗进行精细化分析,如对单台 IT 设备能耗进行统计,制冷子系统能耗、通风子系统能耗、变配电子系统能耗、照明子系统能耗等。数据采集完成后,通过能效分析管理平台分析,为我们

37、提高数据机房的电源使用效率指明方向。分析思路如下: 显示对标显示对标分为长期分析对标和短期测量对标。长期测量对标主要是记录一个相对长的时间周期,并且形成相应能效数据并且进行比对,可以分析在不同时间段的能源消耗情况,可以更直接有效地呈现数据中心能源消耗情况。 节能策略分析及能效分析方案输出通过能耗分析引擎,迅速找出能耗使用突破点,根据匹配的能耗知识库,关联出相应的节能改进建议;并支持通过共济云服务平台,一键导入能耗使用数据,由后台专家成员在线分析,输出人工能耗改进建议。 服务器能效分析(预留功能 )业务系统是运行在服务器上的,由于业务系统的迁移或冗余,数据中心在运行一段时间后往往会产生没有承载业

38、务量的高能低效的服务器,我们称之为“幽灵服务器” ,这些服务器消耗了大量能源却没有产生作用,因此把它们下架节省能源和空间是合适的选择。共济 DCIM 系统通 IT 设备监控读取服务器的能耗, CPU 利用率等参数进行实时监测,通过一段时间的分析可以找出幽灵服务器(即 CPU 利用率一直不高但依然耗能的服务器) ,再通过变更管理对这些服务器进行下架操作,最终达到 IT 设备节能的目的。4.3.3. 能效控制 空调节能控制通过对机房的温度分布与仿真,通过预设的空调控制逻辑实现空调的最优运行。结合空调变频控制器,实现对空调的组群运行控制,设定开关机、温度调节、风量调节等,核心思路是通过自动化控制将空

39、调送出的冷量与 IT 设备实际需要的冷量进行匹配,避免大马拉小车或小马拉大车的情况产生。 节能方案结合能效展示,系统采用大数据的分析逻辑自动分析各系统能耗使用分布,梳理出数据中心运行过程中的能耗消耗点,给出节能建议。 幽灵服务器的发现与控制(预留功能)在发现幽灵服务器后,通过 IT 监控自带带外控制可选择远程对服务器进行休眠或关闭,从而大幅降低整体机房 IT 设备的功率。 服务器功率使用限制(预留功能)通过 IT 监控可对服务器的功耗使用上限进行设定,例如:一台服务器额定功耗为500W,可设定服务器功耗不超过 300W。在几乎不对服务性能造成影响的前提下,一方面可确保单机柜可放置更多服务器,一

40、方面可对服务器能耗进行节省。4.4. 资产管理子系统数据中心日常运维的工作核心是保障业务系统不间断运行,而承载这些业务的物理载体是各类 IT 设备,所以对 IT 资产的管理显得尤为重要。然而,由于缺乏有效的技术手段,数据中心运行一段时间后,普遍出现数据中心资产管理工作普遍遇到信息维护难、资产定位难、资产盘点难、生命周期管理难等各种困扰,导致资产管理的混乱、信息不准确,管理效率低下,出现资产闲置、浪费,造成客户的运维成本高,影响到业务系统的健康运行。资产管理模块是共济科技 IT 服务管理解决方案的特色功能模块之一,旨在对机房相关实物资产(库存资产、在架资产、办公资产等)进行全生命周期管理,给客户

41、提供面向企业内部统一的资产管理平台,提供机房实物资产自动化盘点工具,并为机房容量管理、配置管理等 IT 服务管理提供数据接口,协助管理员高效运维机房业务。4.4.1. 仓库资产管理对于库房新增的资产,其资产从入库到出库的管理流程如下图:新 增 资 产 资 产 登 记入 库 申 请标 签 发 放 在 库 资 产出 库 申 请资 产 上 架个 人 领 用个 人 借 用资 产 维 修 入库:由资产使用单位发起入库申请,填写资产信息,申请入库。仓库管理员收到入库申请后进行审核,发放条形码,确认资产入库。 标签制作:标签制作功能为设备制作条形码,便于仓库资产及非机柜资产的标识和快速盘点。该功能支持按照客

42、户需求,设置和调整标签内容及打印格式,以便满足不同用户的个性化格式需求。 出库:由资产使用单位填写出库申请,资产管理员收到并审核确认。资产出库类型分为资产上架、个人领用、个人借用和资产维修四种。4.4.2. 在架资产管理对于机架内的资产设备,其管理流程如下图:在 架 资 产资 产 变更 申 请资 产 上 架位 置 变 更资 产 下 架 资产上架:将资产放入指定机柜的指定位置。 位置变更:当资产的位置需要变动时,有资产使用者填写位置变更申请,获得资产管理员确认后,将资产放入新的位置,系统自动更新资产位置。 资产下架:资产下架包括资产退回到仓库、资产维修处理、资产报废以及其他需要将资产下架的管理活

43、动。4.4.3. 办公资产管理对于办公设备的管理,其流程如下:在 库 办 公 资 产 个 人 资 产领 用 申 请归 还 申 请报 废 出 库 维 修报 废 申 请 维 修 申 请 定 时 盘 点 办公资产领用:包含领用和归还两个流程,确保资产责任人明确; 办公资产盘点:通过移动资产盘点终端盘点个人使用中的办公资产和库存里的办公资产,保证办公财产安全。4.4.4. 资产维保信息管理系统管理各种维保合同,包含维保合同所覆盖的各项资产、维保设备对应的厂家、联系方式以及维保日期等信息,通过对这些信息的统计和分析,可以做到对设备的过保统计和过保提醒功能,敦促用户及时续保。维 保 合 同厂家 维保日期资

44、 产 变更 申 请服 务 器交 换 机其 他 设 备4.4.5. 其他资产相关功能1) 资产报废对于到达使用年限的资产由系统发起报废,对于功能达不到相应要求或损坏的资产,由使用人发起报废,并在系统中注销相应的资产信息。2) 接口定制作为开放的平台,智能资产管理系统为第三方集成提供了多种数据服务(Webservice ,RESTful 等) ,可实现与其他平台的高效对接,能被更高层次的管理系统所集成,可与电网综自系统按照特定规约实现数据互联互通。4.4.6. U 位检测系统布署预留系统预留 U 为检测系统的建设和接入,该系统可实现机柜内 U 位级的资产信息识别和动态管理,实现资产的线上实时管理。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > 解决方案

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报