1、基于 PCA-BP 神经网络模型的大体积混凝土最高温度预测 何伟 杨靖 三峡大学水利与环境学院 摘 要: 大体积混凝土温度控制是一项复杂的系统工程。针对大体积混凝土温度预测模型的因素太多, 本文采用 PCA 降低 BP 神经网络的输入参数的维数, 并建立一个新的 PCA-BP 神经网络预测大体积混凝土结构温度。根据溪洛渡大坝实测的数据资料, 验证了该模型的有效性和可行性。结果表明, 新模型的期望输出误差最大值仅为 0.65, 证明了新模型的有效性。关键词: 最高温度; 主成分分析; 神经网络; 预测; 降维; 对于大体积混凝土来说, 由于结构断面尺寸一般比较大, 水化热无法及时发散, 导致结构
2、内部先快速升温后缓慢降温。这种温度的变化会在结构内部产生很大的温度应力, 导致出现温度裂缝。因此, 避免产生过大的温度应力对大体积混凝土结构的安全具有重要的意义。大体积混凝土温度与许多因素有关:环境气温、浇筑块长宽和厚度、通水流量、通水时长、通水温度等。各种影响因素和大体积混凝土结构的温度之间是非常复杂的非线性映射关系。为了实现对大体积混凝土的温度控制, 就需要合理的模型去解释影响因素与温度之间的关联。近年来, 基于三维模拟仿真计算与 BP 神经网络的温度模型均具有一定的可行性, 但前者的模型建立耗时较长, 且为了简化计算往往会采用经验参数和简化约束条件, 导致一些难以计量而又对结果有重要影响
3、的因素被忽略, 后者由于影响因素过多, 神经网络的输入过多, 收敛速度慢。为此, 本文将利用主成分分析 (PCA) , 约简神经网络的输入, 降低神经网络的输入参数维度, 结合 BP 神经网络建立 PCA-BP 组合的神经网络预测模型, 并结合溪洛渡的实测温控数据进行模型验证。结果表明, 基于 PCA-BP 的神经网络模型对于大体积混凝土结构温度预测具有实用价值。1 工程概况溪洛渡水电站位于青藏高原、云贵高原向四川盆地的过渡带, 地处四川省与云南省接壤的金沙江干流峡谷段, 其挡水坝为混凝土双曲拱坝, 坝顶高程 610m, 最大坝高 285.5m。水电站枢纽由拦河坝、泄洪、引水、发电等建筑物组成
4、。大坝分为 31 个坝段, 横缝间距约为 22m, 混凝土主要为三、四级配, 混凝土浇筑采取不设纵缝的通仓浇筑方式。本工程坝址处于干热气候, 夏季气温较高, 最高温度常在 40以上, 并且阳光辐射较强, 又由于拱坝受坝体温度的影响较大的特点, 所以, 在工程中控制与预测混凝土温度是关键问题之一。2 PCA-BP 神经网络预测模型2.1 主成分分析基本原理PCA 的中心思想是数据的降维, 以排除信息共存中的相互重叠的部分。它是将原变量经过线性组合得到新的变量, 新变量互不相关, 同时, 新的变量尽可能地表征原始的数据结构特征而不丢失信息。依据新变量对于数据空间的贡献度, 选择少数主成分变量, 可
5、以达到数据简化和揭示变量之间关系的目的。设 n 个影响因素 x1, x 2, ., xn, 样本数为 N, 以形成数据集 XNn 建立统计模型。其 PCA 变量线性变换如下:式中, 即 c1, c2, .cn均为单位向量。为了尽可能地保留原有变量所具有的信息, 就要求新变量 y1是 x1, x 2, ., xn满足上式的一切线性组合中方差最大者。即求单位向量 c1使得 y1的方差 达到最大。令 设 R 的 n 个特征值 相应于 的特征向量为 Ci, 则 yi的方差为 由此可知, y i方差最大, 且最大值为 称 yi为第一主成分, 如果第一成分对于原始数据提取的信息不够充分, 可以补充第二、三
6、主成分作为新的成分变量。2.2 BP 神经网络基本原理BP 神经网络又称前馈神经网络, 由输入层、隐含层和输出层三层组成, 其核心是通过一边向后传递误差, 一边修正误差的方法来不断调节网络的权值和阈值, 以逼近所希望的输入、输出映射关系。BP 神经网络结构拓扑图见图 1:图 1 神经网络结构拓扑图 下载原图BP 神经网络按有导师学习方式进行训练, 当一对学习模式提供给网络后, 其神经元的激活值将从输入层经各个隐含层向输出层传播, 在输出层的各神经元输出对应的输出模式下的网络响应。最后, 按减少期望输出与实际输出误差的原则, 从输出层经隐含层和输入层修正各连接权值。随着这种误差逆传播训练的不断进
7、行, 网络对输入的响应值的正确率不断提高。2.3 PCA-BP 神经网络模型的建立PCA-BP 神经网络模型的实现主要分为 PCA 提取主成分和 BP 神经网络预测两个部分。PCA 主要用于降低原数据的维度, BP 神经网络则用于建立 PCA 提取的主成分与输出数据的非线性模型。设 为原始输入矩阵, x j为第 j 个输入变量, N 为样本数。PCA 提取主成分的步骤如下:(1) 将原始输入数据矩阵标准化: 其中, x ij为标准化后数据, j和 sj为第 j 个变量的样本均值和标准差。(2) 建立标准化数据的相关系数矩阵 求出相关系数矩阵的特征值并求出其对应的特征向量矩 各个特征向量即为各成
8、分荷载。(3) 确定主成分的个数 m。第 i 个主成分的贡献率定义为 前 m 个主成分的累积贡献率定义为 实际应用中, 一般选取前 m 个主变量, 使其累积贡献率达到 85%以上。(4) 计算主成分的得分。主成分得分即为 BP 神经网络输入向量。计算公式如下:由此可以看出, 原有的 n 个变量经 PCA 降维后变为 m 个主成分变量。对于 BP 神经网络结构, 主成分的个数即为 BP 神经网络的输入层神经元个数, 输出为最高温度数据, 输出层神经元个数为 1。经过多次调试, 隐含层选为 1层, 隐含层神经元个数选为 16。根据 PCA 的原理和实测的数据, 得到新的数据变量。然后, 将新的数据
9、变量作为 BP 神经网络的输入, 从而建立 PCA-BP 神经网络。PCA 与 BP 神经网络的均在 matlab 中实现。其中, PCA 的调用 princomp函数, 调用格式如下:式中, variabledata 为原变量的输入样本;pcs 为主成分;newdata 为主成分得分;var 为主成分方差;t2 为 Hotellings T2检验。在创建 BP 神经网络时调用 newff 函数, 调用格式为:式中, P 为输入样本;T 为期望输出;S i、T i分别为网络各层的神经元数目和传递函数。在神经网络激活函数选择时, 由于 S 型函数的可微性, 同时具有很好的非线性映射能力, 本文选
10、择 sigmoid 型函数作为隐含层的传递函数。经过newff 函数建立网络, 设定各网络参数后, 调用 train 函数对网络进行训练, 最后调用 sim 函数得到网络输出值, 将网络输出值与期望输出进行比较后, 若误差较小, 即可将训练好的网络加以应用, 若误差较大, 需要调整网络参数, 最后进行网络的检验与评价。3 实例分析本文以溪洛渡大坝作为研究对象, 根据大坝一期控温各浇筑块的实测温度资料和相应的施工资料, 将气温、浇筑块长度和宽度、间歇天数、浇筑块厚度、通水温度、通水时长、通水流量、冷却水管半径、出机口温度、入仓温度、浇筑温度等 12 个原始变量数据作为模型输入, 浇筑块最高温度作
11、为输出, 建立PCA-BP 模型。3.1 构造主成分变量本文利用 matlab 中的 princomp 函数对原数据进行主成分变量构造, 前 9 个主成分对应的特征值、相应的贡献率和累积贡献率见表 1。根据累计贡献率大于或等于 85%的原则, 选用前 4 个主成分。可以看出前 4 个累积主成分贡献率已高达 95.34%, 说明前 4 个主成分展示了原始数据的足够信息。因此, 经过 PCA的处理, 明显降低了自变量的维数, 而且能够涵盖原始数据的大部分信息。求得前 4 个主成分变量的载荷见表 2。3.2 PCA-BP 模型结果及分析通过 PCA 约简的四个主成分作为神经网络的输入, 建立 4-1
12、6-1 的 BP 神经网络模型, 比较模型的输出值与期望值见图 2, 输出值与期望值的误差见图 3。由图可以看出, 模型输出值与期望值吻合度较高, 两者误差较小, 最大误差分别为0.64 和-0.65。为了检验输出值与期望值的逼近程度, 调用 matlab 中 corrcoef函数计算两者的相关系数为 0.9033, 。结果表明, 预测模型精度较高, 该模型对大体积混凝土最高温度的预测有较高的可信度。表 1 前 9 个主成分的特征值和方差贡献率 下载原表 表 2 前 4 个主成分的载荷 下载原表 图 2 输出值与期望值比较图图 3 输出值与期望值误差图 4 下载原图结论本文利用 PCA 的基本
13、原理, 通过 PCA 将原数据变量进行线性组合, 得到较少的新变量。然后, 利用新变量作为 BP 神经网络的输入, 不仅减少神经网络输入的维度, 还提高了神经网络的运行效率, 降低了神经网络的复杂程度。通过验证, 结果体现了模型的有效性与可行性。参考文献1朱伯芳.大体积混凝土温度应力与温度控制M.北京:中国电力出版社, 1999. 2焦李成.神经网络理论M.西安:西安电子科技大学出版社, 1990. 3杜晓帆, 卢兴毅, 张文熙.BP 神经网络在新浇筑混凝土最高温度预测中的应用J.水电能源科学, 2013 (5) :70-72. 4徐佰林, 黄耀英, 付学奎等.基于均匀设计的混凝土浇筑仓最高温度预测模型及应用J.水电能源科学, 2014 (5) :83-85. 5付学奎, 周宜红, 黄耀英, 周绍武, 李金河等.基于 BP 神经网络的坝体混凝土二期通水冷却分析J.水利水电技术, 2012. 6周建兵, 王毅, 何小鹏, 黄耀英等.混凝土浇筑仓最高温度快速预测J.水力发电, 2013.