1、 2019 年中国电机工程学会年会论文集 基于深度学习的机房温度分区监控及节能研究 李丽莉 陈果 国网陕西省电力公司信息通信公司,陕西西安 710065;Research on Temperature Zoning Monitoring and Energy Saving in Data Center Based on Deep Learning Lilili Chenguo Stage Grid Shanxi Electric Power Company Information Communication Company;,Shanxi Xian 710065 摘要:本文设 计了 机房的 温
2、度 采集系 统,利 用采 集系统 采集 的数据 对设计 的精 密空调 控制 模型进 行训练,将 大数据技术和 人工智 能技 术应用 于机 房空调 节能,验证 了利用 深度 学习算 法设计 精密 空调控 制模 型对机 房空调 实现 节能的有效性,为降低 IDC 运维成本和能耗提供一种思路,同时在实验机房内实现了精密空调运行节能接近 30%;实现了对机房温度场的安全监控和评估。关键词:精密空调;数据中心节能;深度学习;ABSTRACT:This paper designs the temperature acquisition system of the data center,and train
3、s the precise air conditioning control model by using the data collected by the acquisition system.The paper applies the big data technology and artificial intelligence technology to the energy saving of the air conditioning in the computer room,and verifies the validity of using the deep learning a
4、lgorithm to design the precise air conditioning control model to realize the energy saving of the air conditioning in the computer room,and provides a way to reduce the operation and maintenance cost and energy consumption of At the same time,this paper realizes the energy saving of precision air co
5、nditioning operation in the experimental room,realizes the safety monitoring and evaluation of the temperature field in the data center。KEY WORD:the precise air conditioning;energy saving in data center;deep learning 1 概述 1.1 背景 近 年 来,随 着云 计算、大数 据、人工 智能 等行业的 迅猛发 展,中 国的 数据中 心(IDC)规 模一 直 维持 着每年 35%的高
6、增长速 度。而 IDC 是一个高 能耗(电能)行业,它 的高 速发 展必 然带来节能 的需 求。PUE 值(数 据中 心消 耗的 所有能 源 与 IT 负载 使 用的 能源 之比)是衡量 IDC 能源 使用 效率的关 键 指标。下表 1-1 为某数 据 中心 各个 部分 的能耗占比。从 表 中可 以看 到,如果 能提 高 机房 空调系统的 制冷 效率,在保 持 机房冷 却效 果相 同的 条件 下,降低 空 调系 统的 用电 量,可以 大 幅降 低机房的用 电量,提 高 PUE 值,节 约运 行成 本。同时也可 以有 效的 减少 机房 的二氧 化碳 的排 放量,响 应 了国 家在“十 三五”中
7、要 求的 节能 减排 的要求。同时,住 房城 乡建 设部 2017 年颁 布的 数据中心设 计规范(GB50174-2017)对数 据中心机房建 设和 运维 提出 了新 的要求,其中 对于 机房运行环 境参 数进 行了 修改,由 冷通 道或 机柜 入风口的推 荐温 度范 围从 231调 整为 18-27。新规范 放宽 了对 温度 的要 求,所以 机房的 精密 空调系统 拥 有了 节能 空间。基于以 上背 景,开展 相关 研究。表 1-1 某数据中心能耗占比 Tab 1 Proportion of Energy Consumption in a Data Center 栏目 能耗占比 IT 设备
8、 46%空调系统 UPS 系统 照明系统 41%4%2%办公及其它 6%1.2 方案设计 2019 年中国电机工程学会年会论文集 为了从 精密 空调 系统 中节 能,必须 改变 以往的精密 空调 控制 策略。之前 的 策略 只是 人为 简单的设置 空调 设定 温度,并 且空调 温度 一经 设定 在短时间内 不会改 变,这种空 调控制策 略太过 于粗放。实际 运行 过程中 机房中 服 务器 每时 每刻 的散热 量 都不 一样,如果 只是简 单 的设 置一 个设 定温度,在机 房中 服务 器高 负 荷运转 时会 存在 空调 制冷 功 率不 足的 情况,在服务 器 低负 荷运 行时 又会导致空 调制
9、 冷功 率过 剩的 情况。这 样就 造成 机房空调系统不能运行在制冷效率最高的运行状态下,导 致机 房的 整体 用电 效率下 降。为实现 机房 空调 系统 的精 确控制,就需 要建立空调 控制 温度 和机 房各 参数的 关系,这些 参数包括不同服务器的工作负荷、机房分区温度分布、空 间气 流 状况、散热气 阀 的开 启或 关闭 状态等。但这 些参数 的获 取是 十分复 杂且 困难 的,但这些参 数最 终都 作用 于机 房内的 温度,所以 可用温度在 一定 程度 上代 替上 述参数。最 终 确定 方案 如下:首先开 发 并部 署温 度数据采集 系统,通过 无线 网 络实现 不同 区域 温度 的实
10、时监控,实现温度无线传输网络的自组网功能;然 后建 立机 房温 度分区 监 控的 精密 空调 控制模 型,对不 同运 行参 数下的 机 房温 度网 络模 型进行 训 练和 调优;最后 通过训 练 的精密 空调 控制 模型,实 现机 房精 密空 调的 精准控 制。2 开发并部署温度数据采集系统 温度数 据是 数据 基础,所 以必须 部署 安全、可靠的 温度 数据 采集 系统,所 以开 发并 部署 温度数据采 集系 统是 第一 阶段 的首要 任务。2.1 温度采集模块开发 基于实 际环 境,对该 模块 的要求 如下:1.芯片 体积 小,正常 工作 外围电 路少;2.芯片 成本 低,便于 大批 量生
11、产;3.电压 低,小于 3V,能适用 于 电池 供电 的应用场景;4.芯片 运行 低功 耗,待机 电流小 于 1uA,工作电流 不超 过 1mA;5.工 作环 境为 080,能 够承受 暂时 的高 温环境;6.测量 温度 范围 要在-20 100,采集 精度在 0.20.5 以内,分 辨率低 于 0.01;最终选 用 TI 公司 的 TMP275 芯片 作为 温度传感器 芯片。TMP275 是一款 精 度为 0.5 且具有 12 位模数转换器(ADC)的集成数字温度传感器,可在低至 2.7V 的电源供电下运行。TMP275 采用 SOIC-8 封装,不需 要外 部组 件便可以进 行测 温,采用
12、 I2C 通信 接 口通 信,两线 制,结构简 单。其应 用原 理图 如下 图 2-1 所 示:图 2-1 温度采集模块图 Fig 2-1 Temperature acquisition module diagram 2.2 ZigBee 无线网络模块开发 通 信 模块 采选用 TI 的 CC2530 芯片。CC2530芯片为 TI 公司开发的第二代用于 2.4GHz IEEE802.15.4/RF4CE/ZigBee 的片 上解决 方案,具 有 低功 耗、低 成本、易开 发等 有点,非常 适合在机房 中进 行简 单的 数据 通讯。其 应用 原理 图如下图 2-2 所示:图 2-2 通讯模块原
13、理图 Fig 2-2 Communication module schematic diagram 2.3 供电模块开发 为了实 现温 度采 集模 块的 低功耗 运行,采集模块采 用纽 扣电 池供 电,并且连 续工 作时 长超 过3 个 月,这 就要 求对 采集模 块 的电 池容 量进 行精确的计算。使用的采集模块主要的耗电模块为CC2530 通 信模 块,在 进行 ZigBee 无线 通信 数据 2019 年中国电机工程学会年会论文集 的接收 和发 送过 程中,需 要消耗 大量 的电 量,同时 也 会产 生局 部的 大电 流现 象,对纽 扣电 池造 成不可逆 转的 危害。经过计 算,最终 采
14、用松 下 CR2032 纽扣 电池作为供 电电 源。松下 CR2032 属于 锂锰 电池,标称容量 为 240mAh,电池容 量 远大 于采 集模 块的容 量 要求,理论 可工 作时间 超过 2 年。此 外,松下 CR2032 的电压为 3V,工作温度为-30+60,尺寸为 20.0 x3.2mm,重量 为 3g,不 管是 电 压、尺 寸、工作 温度都 可 以满 足采 集模 块的工作条 件。其应 用原 理图 如下 图 2-3 所 示:图 2-3 供电模块原理图 Fig 2-3 Power supply module schematic diagram 2.4 采集整体系统开发 结合上 述模 块
15、可 以得 到采 集传感 器。然 后设计采集 系统,整 个采 集系统 的 结构 图和 功能 图如下图 2-4 和图 2-5 所示。图 2-4 采集系统结构图 Fig 2-4 Structure diagram of acquisition system 协调器建立 网络接收 解析数 据包串口 通信路由器加入 网络接收 子节点 入网转发 数据包路由 发现终端节点加入 网络接收 父节点 数据温度 数据采 集温度 数据打 包发送ZigBee 网络上位机串口 数据接 收数据 包解析 存储参数 设置图 2-5 采集系统功能图 Fig 2-5 Function Diagram of Acquisition
16、System 3 搭建并训练精密空调控制模型 精密空调控制模型是为了搜索在未来一段时间内 比较 节能 的精 密空 调设定 参数,所以 究其本质为 一个 搜索 算法,所 以采用 模拟 退火 算法 作为搜索 算法 的框 架。其运 行 流程图 如图 3-1 所示。同时,由 于机房 的动 态运 行,需要 对未来 一段 时间的机 房状 态进 行评 估,因此需 要构 建机 房的 仿真模型。如下 图 3-2 所示,其 中的 仿真 细节 如下图 3-3 所示,仿 真过 程需要:1、精密 空调 能耗模型;2、热通道温 度-回风温 度模型;3、冷通道温度-热 通道 温度 模型;4、精密 空调 设定 温度-冷通道
17、温度 模型;5、冷 热通道 温度 降维 模型。图 3-1 整体控制模型运行流程 图 Fig 3-1 Flow charts of integrated control model 2019 年中国电机工程学会年会论文集 图 3-2 仿真模型流程图 Fig 3-2 Flow chart of simulation model 图 3-3 仿真细节流程图 Fig 3-3 Flow chart of simulation details 3.1 精密空调能耗模型 精密空 调的 能耗 是关 注的 重点,是 评估 精密空调的 设定 参数 的重 要依 据,所以 该模 型应 保证预 测 精度。精密 空调 的
18、能耗 只 取决 于精 密空 调本身固有的状态,由于只控制精密空调的设定温度,所以 精 密空 调能 耗的决 定 因素 仅仅 为精 密空调的设 定参 数和回 风参 数。根据 这个 参数 和固 定的时间长度可以计算该段时间长度内精密空调的能耗。模型结 构示 意图 如下 图 3-4 所示意,图 中 能源估计层的输入为当前精密空调的设定参数和回风参 数,输出 为预 计功 率。能源 估计层 和能 源累计层 之间 的连 接权 重代 表时间,能源 累计 层的输入为 上个 单位 时间 的预 计能耗,得到 的输 出含义:累计 时间长 度内,精 密空调 共预 计使 用的 能耗。模型由神经网络搭建而成,取激活函数为R
19、eLu 函数,使 用 AutoEncoder 分层 训练(以 下模型均 采用 此激活 函数 和该 方 法进 行训 练)。图 3-4 精密空调能耗模型示意 图 Fig 3-4 Schematic diagram of energy consumption model for precision air conditioning 3.2 精密空调能耗模型搭建 精密空调的回风参数是精密空调吹出冷风作用于 数据 机房 IT 设备后 得 到的 反馈 效果,也是知晓 未来 一段 时间 精密 空调出 力的 风向 标,若设定参数小于回风参数,则精密空调将继续制冷,否则,精密 空调 将会 制热。该 模型 用于
20、刻画了热通 道温 度和 回风 参数 的关系。在物理 上,这个关系 体现 为机 房内 的气 流流动,存在 时间 上的滞后性,且滞后时间与气流流速及机房布局有关。在该 模型中,这个 滞 后性体 现为 模型 具有 一定 的 记忆 功能,可以 通过保 留 之前 热通 道的 温度信息作 为输 入,体现 这个 滞后性。实验机房 部署 174 个 采集 终端分 布于 5 个热通 道,对应 的回 风参 数为 6 个 精密 空调 的回 风温 2019 年中国电机工程学会年会论文集 度。其 模型 示 意图 如下 图 3-5 所 示意。先按 机柜提取每 个机 柜热 通道 上采 集终端 的特 征,再 把得到的特 征按
21、 所属 热通 道提 取特征,最后 结合 保留的过去一段时间的热通道特征对回风温度参数进行估 计。图 3-5 热通道温度-回风温度模 型示意图 Fig 3-5 Temperature Model Diagram between Hot Channel and Return Air 3.3 冷通道温度-热通道温度模型 该模型用于刻画了冷通道温度和热通道温度之间 的关 系,在物 理上,该 关系 体现为 机柜 内IT 设备的发热量对冷通道 温度和热通道温度的关系的 影响。当冷 通道 温 度较低 而对 应机 柜热 通道温度较高时表明该机柜 内或周围机柜内的 IT设备正 在高 负荷 运行,相 反,对应 热
22、通道 温度 较低则表 明该 机柜 周围 的 IT 设备负 荷一 般。实验机 房共 有 4 个 冷通 道,共 8 列机 柜,在冷通道 内共 部署 了 146 个采 集 终端。该模 型的 示意 图 如下图 3-6 所 示意。首先按 机柜 对各 个冷 通道温度 提取 特征,由 于气 流的扩 散,考虑 相邻、相对机 柜之 间的 温度 影响,所 以改 变神 经网 络的结 构,额外 加 入机 柜间 的交 互 作用 神经 元。然后再根据当前机柜的温度特征和机柜间交互作用预测对 应机 柜的 热通 道温 度柜。图 3-6 冷通道温度-热通道温度 模型示意图 Fig 3-6 Temperature Model D
23、iagram between Cold Channel and Hot Channel 3.4 精密空调设定温度-冷通道温度模型 该模型刻画的是精密空调设定与回风温度与冷通 道温 度之 间的 关系。在 物理 上,该关 系体现为精 密空 调出 力对 机房 内冷通 道的 温度 影响。空调出 力越 大,机房 内冷 通道温 度越 低。由于 精密空调 送风 口在 钢架 地板 以下,而 下方 气流 是贯通的且 空间 较大,所以 不 同位置 的精 密空 调出 力对各处 冷通 道温 度都 有影 响且存 在时 间滞 后。实验机 房共 有 6 台精 密空调,4 个 冷通 道。该模型 的结 构示 意图 如下 图 3
24、-7 所 示意。由 于 其结构复杂,所以用多层全连接神经网络直接刻画。同时 考虑 到不 同位 置 精密空 调的 时间 滞后 影响,对 一段 时间 的精 密空 调运行 参数 进行 保留,作 为 输入 传入 网络。其具体 层 数和 每层 神经 元个数需要 根据 实际 数据 训练 进行调 整和 优化 较。图 3-7 精密空调设定温度-冷通 道温度模型示意图 Fig 3-7 Temperature Model Diagram between Precision Air Conditioning Setting Temperature and Cold Channel 2019 年中国电机工程学会年会论
25、文集 3.5 精密空调能耗模型搭建 该模型 是辅 助模型,其用于 在 于减 少之 前模型搭建 和训 练时 的数 据使 用量。同 一个 冷通 道或热通道 内部 署了 大量 的采 集终端,对这 些采 集终端的温 度数 据分 析可 知,同一个 通道 内的 温度 可以用一 些局 部温 度特 征点 代替整 体通 道的 温度,所以可 以减 少不 同冷 热通 道的温 度特 征个 数。以上 四 个模 型中,部分 输入输 出 个数 等于 对应 冷通道或热 通道 内的 采集 终端 个数,由 此可 以减 少部分模型 的输 入输 出个 数,简化模 型,降低 数据 集大小。该 模 型结 构示 意图 如下图 3-8 所示
26、 意。从 左至右运 行模 型是 对数 据进 行降维,从右 至左 运行模型可 以还 原各 个采 集终 端的温 度。图 3-8 冷热通道温度降维模型 示意图 Fig 3-8 Temperature Dimension Reduction Model of Cold and Hot Channels 4 结论 将经过 训练、优化 的精密空 调 控制 模型 投入验证性 运行,即根 据模 型 的输出 值对 机房 的空 调系统的 控制 参数 给出 调节 建议和 参考,并试 运行一 段 时间,检验 按照 模型给 出 的控 制策 略运 行对机房能 耗的 影响,记 录能 耗数据。将模型 使用 前后的能 耗数 据
27、进行 对比,验 证 模型 在节 能方 面的可行性 与有 效性,确保 该 模型给 出的 控制 策略 能够 切 实提 高精 密空 调冷 却运 行 能效。下图 4-1 给出的为该段时间内精密空调平均每分钟能耗的变化图。从图 中可 以看 到 实验前 后机 房平 均能 耗0.41 千 瓦时 每分 钟,应用 本课题 控制 模型 后,实验机房 平均 耗能 约为 0.27 千 瓦时 每分 钟,机房平 均 每小 时节 约电能 8.4 千瓦时。图 4-1 试运行阶段每分钟精密 空调能耗变化图 Fig 4-1 Energy Consumption Change per Minute during Trial Ope
28、ration 同时研究存在一定的不足,改进的方向如下:1、可以纳入 更多的 因素在 模 型中,例 如精密 空调的风 速,湿度 等参 数;2、可以在训 练机房 的温度 场 各类模型 时,可 以调节更 好的 参数 以获 得更 好的精 度。参 考 文 献 1 范强.大型数据机房空调系统设计J.暖通空调,2013,43(2):33-36 2 吴茜茜.中国 IDC 产业发展现状与趋势研究J.数字通信世界,2015(8).3 柏荣敏.电信机房温度监控系统的设计D.安徽大学,2012 4 范志辉,张平,崔雷.基于 GSM 的机房环境智能监控系统设计J.电气自动化,2009,31(1):56-58 5 Lia
29、ng C J M,Liu J,Luo L,et al.RACNet:a high-fidelity data center sensing networkC/International Conference on Embedded Networked Sensor Systems,SENSYS 2009,Berkeley,California,Usa,November.DBLP,2009:15-28.6 Nguyen T D,Thanh T T,Nguyen L L,et al.On the design of energy efficient environment monitoring s
30、tation and data collection network based on ubiquitous wireless sensor networksC/IEEE Rivf International Conference on Computing&Communication Technologies-Research,Innovation,and Vision for the Future.IEEE,2015:163-168.7 王景晖,刘志峰,吕继祥,等.基于自然冷却的数据中心空调节能和经济性研究J.低温与超导,2016(9):72-77.8 Tarutani Y,Hashimot
31、o K,Hasegawa G,et al.Reducing Power Consumption in Data Center by Predicting Temperature Distribution and Air Conditioner Efficiency with Machine LearningC/IEEE International Conference on Cloud Engineering.IEEE,2016:226-227.9 Gao J.Machine learning applications for data center optimizationJ.2014.10
32、 DeepMind AI Reduces Google Data Center Cooling Bill by 40%.https:/基于 ZigBee 的无线温度传感网络的设计与实现D.东北大 2019 年中国电机工程学会年会论文集 学,2008.12 黄学哲.ZigBee 无线传感器网络通信协议标准若干改进机制研究D.东北大学,2013.13 钟景华.数据中心设计规范 GB501742017 解读数据中心分级与选址J.工程建设标准化,2017(12).14 Tashiro S,Nakamura Y,Matsuda K,et al.Application of Convolutional N
33、eural Network to Prediction of Temperature Distribution in Data CentersC/IEEE,International Conference on Cloud Computing.IEEE,2017:656-661.15 Tarutani Y,Hashimoto K,Hasegawa G,et al.Temperature Distribution Prediction in Data Centers for Decreasing Power Consumption by Machine LearningC/IEEE,International Conference on Cloud Computing Technology and Science.IEEE Computer Society,2015:635-642.作者简 介:姓名(出生 年-),性 别,籍贯,学 历,职 称,研究 方向 李丽莉,女,陕 西,本科,高 级工 程 师,信息 网络 及安 全;陈果,男,陕 西,本科,高 级工 程师,基础 设施 运维