1、大数据技术在燃煤电站发展中的应用研究 高学伟 付忠广 张连升 刘炳含 沈阳工程学院辽宁省电站仿真控制重点实验室 华北电力大学电站设备状态监测与控制教育部重点实验室 国电康平发电有限公司运行部 摘 要: 通过对燃煤电站大数据的特征和应用模式进行了研究和总结, 分析了大数据技术在燃煤火力发电厂中应用的动力和面临的挑战, 提出电站大数据需要解决的关键技术难题, 并以燃煤电站 SCR 脱硝系统大数据建模为例, 介绍了大数据挖掘建模过程。关键词: 大数据技术; 燃煤电站; 应用模式; 数据特征; 作者简介:高学伟 (1982-) , 男, 河北石家庄人, 工程师, 博士研究生。收稿日期:2017-07-
2、10Application of Big Data Technology in the Development of Coal-fired Power StationGAO Xue-wei FU Zhong-guang ZHANG Lian-sheng LIU Bing-han Key Laboratory of simulation and control of power station, Liaoning, Shenyang Institute of Engineering; Key Laboratory of state monitoring and control of power
3、plant equipment, Ministry of education, North China Electric Power University; Operation Department, Guodian Kangping Power Generation Co.Ltd.; Abstract: The coal-fired power plantsare regarded as an important technical field of big data application.The big data characteristics and application mode
4、ofcoal-fired power plants are summarized, and the motivation and the challenge of the application of big data technology in coal-fired power plantareexplored.The key technology of big data and the research focus at present stage are put forward, and the future development is prospected.Finally, taki
5、ng the big data modeling of SCR denitrification system in coal-fired power station as an example, the modeling process of big data mining is introduced.Keyword: Big data technology; coal-fired power station; application mode; data characteristics; Received: 2017-07-10当今大数据时代背景下, 大数据技术已经在商业、金融、医疗、交通、
6、教育等领域得到广泛应用。我国燃煤电站信息化、数字化水平已大幅提升, 分布式控制系统 (DCS) 、管理信息系统 (MIS) 、监控信息系统 (SIS) 以及全厂信息集成系统 (PI) 等已在燃煤发电厂普遍应用。这些系统产生了大量的运行生产数据, 未来燃煤电站必将成为大数据的重要应用领域之一:一方面, 发电厂存储着大量的历史运行数据, 以及输入煤质和气象观测等外部数据, 而这些数据目前仅限于日常的报表、查询, 大部分闲置, 数据缺乏深度利用;另一方面, 通过深度挖掘发电厂的数据价值, 可以用于燃煤机组的优化运行, 以及状态评估和性能监测, 甚至可以推动运行控制和管理模式发生根本性变革。自 201
7、2 年以来, 国内外大学、研究机构、IT 企业以及发电公司等单位分别从理论和技术应用等方面研究如何将大数据技术应用于燃煤发电厂的管理、生产运行过程, 才可以对生产过程中运行方式进行优化1, 对设备运行状态关键参数进行监测2-4, 对企业的管理和决策进行指导5-6, 对机组安全环保经济运行状态进行评估7-8。但总体来看, 研究成果仍不成体系, 研究尚处于起步和探索阶段, 在工程领域内的应用较少。因此, 在分析燃煤电站大数据在国内外研究和应用现状的基础上, 首先对燃煤电站大数据的特征和应用模式进行总结, 然后对大数据技术在燃煤火力发电厂中应用的动力和面临的挑战进行探讨, 提出电站大数据研究需要解决
8、的关键技术难题, 并以燃煤电站 SCR 脱硝系统大数据建模为例, 介绍大数据挖掘建模过程, 最后对燃煤电站大数据进行总结和下一步发展展望。1 燃煤电厂大数据1.1 数据特征数字化、信息化的发展以及在大型燃煤发电厂的逐步深入, 电力生产过程也逐渐体现出大数据的 5 个典型特征及 5 V 特性9。1) 海量性 (Volume) 电力生产设备需要大量安装测点以及回路进行监视和控制, 产生海量的信息, 每年会有数百 TB 的数据保存下来, 经过长时间积累构成了名副其实的数据海洋。2) 多样性 (Variety) 发电过程中除了通常记录生产过程的开关量及模拟量这类结构化数据外, 还记录下大量生产过程中重
9、要的图像、声音等非结构化数据, 使得电力生产大数据形式多样。3) 时效性 (Velocity) 电力生产规模庞大, 生产过程复杂, 机组运行工况多变, 数以万计的设备每秒会产生数百乃至上千 MB 的实时运行数据, DCS 和 SIS 系统中数据以及大量的非结构化数据需要被快速存储和分析处理。4) 准确性 (Veracity) 电站大数据的处理结果必须保证一定的准确度, 才能给电厂管理者和运行人员正确的决策支持以及正确的操作建议。5) 价值性 (Value) 电站大数据本身包含大量深度的价值, 大数据的挖掘分析和利用对于指导机组优化运行, 实施机组状态监测, 形成智能化的管理监控系统有非常重要的
10、价值。电力生产过程的大数据, 除具有上述 5 V 特性外, 还具有其独有的特征10:1) 高维易变性发电过程构成一个复杂的多变量系统, 涉及到众多参数用于过程描述。在空间和时间上, 这种描述具有高维度的特点, 且生产过程呈现出多变的形式, 机组运行工况多变, 有稳态工况和动态工况的区别。不同的操作运行方式和潜在的故障, 使数据有不同的体现, 数据间有不同的惯性与延迟, 这些都严重影响数据的可理解性。2) 强相关非线性发电过程伴随着多种物理、化学变化, 各个参数间相互耦合, 相互影响, 具有强相关性, 但变量大多不服从线性关系, 动态响应也不尽相同。3) 高噪声不完整性电力生成过程中的设备长期处
11、于高温高压的恶劣工作环境, 噪声污染严重, 导致电站大数据易出现离散值、遗失值以及不一致数据, 再者由于现阶段测量技术、数据传输与存储等因素产生不完整数据。1.2 应用模式燃煤电站大数据研究应采用尽可能多的数据, 且在实现跨专业和跨部门数据融合的基础上进行多维度的数据分析, 其应用模式一般包括以下几个方面:1) 大数据平台的建设将燃煤电站机组 DCS、MIS 及 SIS 系统中的结构化、非结构化的数据统一采集并存储到大数据平台中, 为下一步挖掘、分析和利用提供基础, 这是大数据技术应用的基础。2) 科学的假设根据机组实际运行情况及大数据平台中存储的有效数据, 做出科学的假设, 定义建模主题,
12、为大数据应用指明方向, 这是整个应用过程中最关键的一个环节。3) 数据的获取和预处理根据假设的建模主题, 选择相关参数和样本, 通过数据预处理和特征参数约简提高建模效率和精度。4) 数据挖掘和分析建模主题是预测建模还是分类诊断, 是状态评估还是运行优化, 需要研究选择并确定合适的算法, 从而准确确定模型的关键参数。5) 模型验证和结果分析对数据挖掘和分析结果进行专业分析, 并验证模型的精度和泛化能力。2 发展的动力与面临的挑战2.1 发展的动力1) 政策支持美国、日本、英国、法国、澳大利亚以及中国等各国政府从 2012 年开始相继出台了促进本国大数据领域发展的政策, 为大数据在各个行业领域内的
13、应用和发展提供了强大的后盾11。其中, 奥巴马政府于 2012 年 3 月发布了大数据研究和发展倡议 (Big Data Research and Development Initiative) , 投资2 亿美元以上, 正式启动“大数据发展计划”, 计划在科学研究、环境、生物医学等领域利用大数据技术进行突破, 把大数据研究和发展计划上升到国家战略层面。我国政府于 2015 年 9 月印发促进大数据发展行动纲要, 系统部署大数据发展工作, 开启了我国大数据国家战略。2016 年 1 月全国首部大数据地方法规贵州省大数据发展应用促进条例发布;2016 年 3 月, 第十三个五年规划指出:把大数据
14、作为基础性战略资源, 全面实施促进大数据发展行动, 加快推动数据资源共享开放和开发应用, 我国已经开始进入了一个开放、共享和智能化的大数据时代。2) 技术支持随着数据获取技术、数据存储技术、数据处理技术、数据可视化技术的进步, 以及 Hadoop、Spark、Storm 等大数据分析平台及技术的应用, 为大数据的应用提供了技术支持12。粒计算是基于信息粒化的复杂问题求解理论框架, 是当前计算智能领域中模拟人类思维和解决复杂问题的核心技术之一, 与其他人工智能理论和机器学习方法相结合, 已经应用于大数据挖掘中, 使得大数据的价值能够得以释放。3) 大数据、大效益目前, 燃煤发电在我国仍然占据主导
15、地位, 各发电厂及电力集团公司存储了大量的覆盖电厂生产全过程的运行数据, 这些数据包含大量有效、可用的信息, 机组安装的测点传感器及其他开关量设备提供大量实时监控数据和历史操作数据, 这些数据为大数据技术在燃煤电站中的应用和发展提供了数据支持。通过数据分析和深度挖掘, 找出其内在联系, 挖掘数据潜在的价值, 可以提高控制品质, 推广先进控制策略应用, 形成智能化的燃煤发电机组运行优化及管理监控系统。同时, 对于提高燃煤发电企业的核心竞争力, 保证机组生产过程中的安全性、环保性和经济性, 具有十分重要的意义, 这将成为发展大数据技术的主要推动力。2.2 面临的挑战1) 缺乏认同燃煤发电是一个传统
16、的行业。目前对大数据的基本概念以及在发电厂中的应用价值的认识仍然不足, 用一种离散的、平面的目光来看待那些大量有价值的数据, 很少有人去重视分析数据间的关系和时间特性, 没有从思想深处意识到数据的价值, 这急需有令人信服的成功案例, 才能得到企业的普遍认同13。2) 缺乏规划国内外一些科研院所和发电公司尚未制定出一个长期的关于整个发电企业的大数据发展战略, 目前仅开展了一些分散的研究和应用。由于发电厂复杂的热力系统数据模型需要逐步建立, 如果没有对生产运行数据进行一个长期的分析跟踪, 就不可能找到确实符合现场实际的分析模型, 可见发电厂数据挖掘需要统筹规划和长效机制的保障。3) 数据开放共享不
17、足目前, 发电公司的数据大多是采用不同的数据存储格式存储在不同的数据库中, 造成数据采集查询困难, 运行管理方面形成一种竖井模式, 不同部门、不同团队之间通常孤立工作, 数据交流和数据共享相当困难。在发电企业中, 有些数据不能公开使用, 有些数据涉及到安全问题, 需在有限范围内使用, 隐私保护和安全是大数据应用首先需要解决的问题。可见获取数据的困难不仅有来自软硬件方面技术的限制, 也有来自现有的企业管理机制的限制。4) 技术复杂性燃煤电站大数据的应用是发电厂理论、数学挖掘分析技术和 IT 技术的结合, 多学科交叉, 其先进性和综合性导致了技术实现的复杂性, 软硬件系统之间的技术差异和标准差异所
18、带来的互操作问题普遍存在。5) 缺乏人才对发电厂复杂的生产数据进行挖掘分析, 不仅需要掌握火力发电厂的相关理论知识, 也需要具备足够的计算机专业知识, 以及精通大数据分析技术相关知识。同时, 发电厂需要具有熟知如何申请、使用大数据分析且具有前瞻性思维的管理者, 能够制定相应策略并贯彻执行。可见, 知识高度融合的管理者和复合型技术人员的匮乏将是企业未来几年必须面对的难题。3 电站大数据需解决的关键技术3.1 大数据存储及处理平台电站数据存储分散, 数据量成倍增长, 数据类型多, 大数据平台开发需完善大数据的采集、存储和处理等问题。从大数据存储与处理之问相互关系的角度出发, 主要的存储及处理模式可
19、以分为流处理和批处理两种14。流处理是直接处理, 数据流本身具有量大、持续到达且速度快等特点, 当新的数据到来时就立刻被处理并返回所需的结果, 这种模式适用于实时性要求比较高的业务;批处理是先存储后处理, 其核心思想在于将问题分而治之, 这种处理模式适合于实时性要求不高, 但是数据量非常庞大繁杂的业务。燃煤发电厂需要将来自方方面面的数据在逻辑上集中起来进行管控, 很难同时保证其可行性、可靠性与可扩展性, 而云计算技术融合了分布式文件系统、分布式数据处理系统、分布式数据库等技术, 可以提高现有数据挖掘方法对海量数据的处理效率15-16, 如何将其作为电站数据存储和处理的基础平台与技术支撑, 可以
20、作为研究和实践的重点。3.2 大数据建模技术由于电站热力系统复杂高维, 机组通常处于变工况运行状态, 传统的机理建模和试验建模方法所建立的模型很难同时达到精确性和实时性的需求, 而电站机组大数据挖掘技术建模, 可以依据数据之间的相关关系, 构建相关参数间的数学模型。如何利用大数据技术建立模型, 以及将大数据建模与机理建模、试验建模相结合, 这将是今后电站机组建模的研究方向。针对电站系统的海量高维数据, 分析处理的时间相应增长, 时效性要求高, 算法的效率逐渐成为瓶颈等问题, 如何采用并行化及分布式计算来实现数据分解和变量分组, 是大数据建模技术研究的热点问题17。在建模过程中究竟是选择回归预测
21、类算法还是分类算法, 需要根据建模主题的不同, 采用不同的建模方法。如何将大数据分析技术和现代人工智能算法相结合, 是实现大数据建模的关键。3.3 大数据预处理技术数据预处理是建模成功的关键, 包括数据清洗、数据集成、数据变换、数据规约等。电站机组设备多、参数多、数据冗余、数据类型多、高噪声不完整等因素影响数据质量, 且生产过程数据具有实时性特点, 剔除实时数据流中的异常数据才能保证建模数据的准确性18。而机组运行参数复杂高维, 具有相关性、非线性、时变性等特点, 进一步通过特征参数选择剔除冗余参数来精简建模参数的数量, 通过离散点检测来删除离群的噪声点, 从而提高建模数据质量, 降低模型复杂
22、度, 有效保证模型精度和高效性。因此, 进一步深入研究数据的异常点处理、建模样本及特征参数的选取方法是技术人员努力的方向。3.4 大数据可视化技术数据可视化技术是将数据转换为图形或图像在屏幕上显示出来, 并进行交互处理的技术。该技术可以使数据更容易被理解, 能够最为直观的体现燃煤电站大数据的应用方式和应用价值。当数据量发生爆炸性增长时, 人对于大数据的理解变得极为有限。大数据可视化技术必须能够快速的收集、筛选、分析和展现用户所需要的信息, 并能够根据新增数据进行实时更新。而传统可视化方法用于大数据会产生一定的局限性, 不能有效地表达大数据背后的含义和价值。因此, 大数据技术对于利用可视化方法辅
23、助加强理解数据的需求就非常迫切。4 应用实例随着燃煤电厂智能化的进一步推进, 大数据技术在发电厂将会发挥越来越大的作用, 下面通过一个典型的实例来进一步论述大数据技术如何应用于燃煤电厂19。燃煤电站中的 SCR 脱硝系统喷氨量无法实现精确控制, 所建立的 SCR 脱硝系统模型的可靠性直接关系到脱硝系统控制和运行的可靠性。通过挖掘现场海量的实际运行数据, 采用大数据建模理论建立脱硝系统模型, 所建模型为下一步脱硝系统优化运行以及喷氨量的精确控制奠定了基础。SCR 大数据模型建立过程的整体流程如图 1 所示。图 1 模型建立整体流程 下载原图1) 通过理论分析与系统实际运行情况研究, 选取机组发电
24、量、喷氨量、SCR 反应器入口烟温、入口烟气含氧量、出口烟气含氧量、入口 NOx浓度以及脱硝效率作为模型的输入变量, 选取 SCR 反应器出口 NOx浓度为模型的输出变量。2) 对选取的参数进行稳态工况检测, 提取出稳态运行工况, 从而也能够删除异常离散值。3) 采用主成分分析方法 (principal component analysis, PCA) 对稳态检测之后的数据进行数据降维。4) 利用支持向量机回归 (support vector regression, SVR) 进行建模, 利用改进的混合粒子群算法 (hybrid particle swarm optimization, HPS
25、O) 对支持向量机的惩罚因子 C 和核函参数进行寻优操作。5) 返回训练集和测试集的均方误差 mse 和决定系数 R, 用于对所建立的 SVR 模型进行性能评价, 运行结果如图 2 所示。所建立的模型预测精度较高, 泛化能力强, 可以用于表征实际 SCR 脱硝系统的动态特性。5 结语燃煤电站下一步的发展目标将是在自动化、信息化、数字化电厂的基础上, 建设一种具备自学习、自组织、自趋优、自恢复等功能的智能发电运行控制与管理模式, 构建高效节能、绿色环保、安全可靠的人性化智能电厂。智能电厂的建设将是大数据技术应用的一个重要领域, 国内外许多学者和科研机构已经取得了一定的研究成果, 但现在尚处于起步
26、阶段, 仍不成体系, 在许多方面面临挑战, 一些关键技术有待解决。图 2 SCR 系统预测模型训练集测试结果 下载原图燃煤电站中的大数据有待解决的关键技术包括能够存储和处理电站大数据的平台研究和开发, 数据的集成和融合, 数据质量控制的大数据预处理方法, 高效的大数据建模算法, 以及结果的可视化技术等。研究大数据技术应用于燃煤电站需要不同层次、不同专业技术人员协同合作。推动燃煤电站大数据的研究和工程应用的发展, 需制定各个层面的发展战略, 达成共识, 共同消除存在的障碍, 这样才能保证大数据技术在燃煤电站中得到成功应用并健康发展。参考文献1SANDRA S, INES DEL C, JAVIE
27、R E, et al.Modeling and multi-objective optimization of a complex CHP processJ.Applied Energy, 2016, 161:309-319. 2刘吉臻, 刘继伟, 曾德良, 等.大数据多尺度状态检测方法在磨损检测的应用J.仪器仪表学报, 2013, 34 (1) :180-186. 3ALI A, MAHDI D.Data driven approach for fault detection and diagnosis of turbine in thermal power plant using Inde
28、pendent Component Analysis (ICA) J.Electrical Power and Energy Systems, 2012, 43:728-735. 4CHEN K Y, CHEN L S, CHEN M C, et al.Using SVM based method for equipment fault detection in a thermal power plantJ.Computers in Industry, 2011, 62 (1) :42-50. 5姜阳, 杨倩玉, 王雷.在网运行机组负荷优化分配J.沈阳工程学院学报:自然科学版, 2017, 1
29、3 (3) :229-233. 6王宁玲, 付鹏, 陈德刚, 等.大数据分析方法在厂级负荷分配中的应用J.中国电机工程学报, 2015, 35 (1) :68-73. 7付忠广, 齐敏芳.基于最大熵投影寻踪耦合的燃煤机组节能减排评价方法研究J.中国电机工程学报, 2014, 34 (26) :68-73. 8付忠广, 景源, 齐敏芳, 等.基于投影寻踪原理的机组可靠性等级评价J.动力工程学报, 2012, 32 (10) :820-824. 9刘继伟.基于大数据的多尺度状态监测方法及应用D.北京:华北电力大学, 2013. 10齐敏芳.大数据技术及其在电站机组分析中的应用D.北京:华北电力大学
30、, 2016. 11陶雪娇, 胡晓峰, 刘洋.大数据研究综述J.系统仿真学报, 2013, 25 (S1) :142-146. 12黄宜华, 苗凯翔.深入理解大数据:大数据处理与编程实践M.北京:机械工业出版社, 2014. 13张东霞, 苗新, 刘丽平, 等.智能电网大数据技术发展研究J.中国电机工程学报, 2015, 35 (1) :2-12. 14彭小圣, 邓迪元, 程时杰, 等.面向智能电网应用的电力大数据关键技术J.中国电机工程报, 2015, 35 (3) , 503-511. 15毛羽丰.基于云计算的海量电力数据分析系统设计与实现D.北京:北京交通大学, 2015. 16FUAD
31、 B, RADWA E, OMAR B, et al.Big Data 2.0 Processing Systems:Taxonomy and Open ChallengesJ.Journal of Grid Computing, 2016:27. 17ERIC P X, HO Q R, XIE P T, et al.Strategies and Principles of Distributed Machine Learning on Big DataJ.Engineering, 2016, 2:179-195. 18QI M F, FU Z G, CHEN F.Outliers detection method of multiple measuring points of parameters in power plant unitsJ.Applied Thermal Engineering, 2015, 85:297-303. 19高学伟, 付忠广, 刘炳含, 等.SCR 脱硝系统 PCAHPSO-SVR 大数据建模研究J.自动化仪表, 2017, 38 (7) :15-19.