1、电力变压器状态监测数据处理方法 张良 张英 国网黄石供电公司 广东电网有限责任公司 摘 要: 变压器状态监测数据是设备状态的直观反映, 直接影响状态评价结果。针对变压器状态监测数据缺失、错误的问题, 提出变压器在线监测数据综合处理方法。对于没有安装温湿度传感器的变电站, 利用周边气象站信息根据空间四维插值法推算变电站的温湿度数据;对于油色谱及局部放电监测数据失真的问题, 建立基于统计分析的数据处理方法, 利用线性插值补全数组中的缺失值, 利用 3法则识别数据中的奇异值及阶跃值, 利用杨辉三角法对含噪声的数据进行平滑, 最后利用包络线对数据进行拟合凸显数据趋势。关键词: 变压器; 状态监测; 在
2、线监测; 数据质量判别; 数据预处理; 作者简介:张良 (1975-) , 男, 湖北黄梅人, 助理工程师, 研究方向:电网运行管理及客户服务。1 引言电力变压器状态监测对于变压器维护、电网安全运行有着至关重要的作用, 及时发现变压器缺陷并改变维护策略对变压器运行及维护具有重要意义1。监测信息直接反映了变压器的状态, 数据质量影响运维决策2。然而当前状态监测数据存在一些问题, 如部分站点没有安装监测传感器、部分站点监测传感器较为老旧、监测装置性能参差不齐、传感器会受到现场干扰等3问题。这就导致部分监测数据质量不高, 体现为监测数据中含有大量空值、恒定值或者数据分布规律性不明显。对于存在问题的监
3、测数据, 部分可以进行数学优化, 如油中溶解气体数据的缺失、短时噪声干扰, 各个站点的温湿度监测器缺失4。部分数据问题不能进行数学优化, 如传感器故障, 监测值淹没在现场噪声中的情况5。2 数据补缺当前电力变压器监测数据缺失情况主要分为两大类, 有监测传感器但是上传数据存在空白及遗漏 (如油色谱、局放在线数据) 6, 没有监测装置但是可收集到周边相关监测信息 (如温度、湿度数据) 7, 对这两种情况分别采用线性插值及空间四维插值进行数据补缺。2.1 线性插值受各种因素的影响, 上送的监测数据存在丢失的现象, 导致测量结果存在很大的误差, 因此有必要对监测数据进行插值处理, 还原丢失的信息。对于
4、不同测量点之间的横向可比性较差的数据, 如油中溶解气体气相色谱分析、局部放电等。这一类数据不可以用同类传感器数据来估算其丢失的数值, 因此本文采取了线性插值的方法, 这种方法相对较保守, 但对数据统计信息改变较少。选取肇庆供电局 2#主变 C 相油色谱监测传感器 2014 年 6 月 10 日到 2014 年 7月 6 日的氢气监测数据, 如图 2-1 中的实线所示。该传感器存在三处数据断档, 分别为 6 月 15-18 日、6 月 21 日、6 月 29 日-7 月 1 日数据存在断档。采取线性插值补全数据空挡, 效果如图 1 中叉状点所示, 可以看出经补全, 数据连贯性增强。图 1 线性插
5、值法进行补全案例 下载原图2.2 空间四维插值环境信息, 如温度及湿度, 是影响电力变压器运行及老化的重要因素, 收集各个站点的环境监测信息有助于评判变压器运行环境、老化情况并制定相应的维护策略。然而部分变电站缺乏环境监测装置, 考虑到对于相邻地理位置, 环境信息存在连续性, 采用空间四维插值算法对相应站点的环境情况进行推算。对于不同测量点之间的关联性较强的数据, 如温湿度数据。在测量时间与空间范围之内, 各测温点数据之间可以相互折算, 可以用基于时间与空间四个维度的拟合与插值来补缺。降雨量直接影响变电站湿度, 以降雨量计算为例说明空间四维插值算法。降雨量情况是影响套管污闪的重要方面, 并且对
6、变压器老化及锈蚀也存在一定关系, 然而当前变电站并没有安装降雨量监测装置。根据气象监测点的降雨数据, 结合三维 GIS 信息, 形成多维的降雨数据分布曲面图进行相应插值, 推算缺失参数, 推算变电站降雨量。以各变电站附近气象站数据为基础, 通过插值法建立四元函数如式 (1) , 整合变压器四维数据, 在这四个集合内求出对应的降雨量。其中, T 为降雨量, Lo 为经度, La 为纬度, H 为海拔。利用自然邻点插值法建立地理参数与气象参数的函数关系。公式如下:其中:f (x) 为自变量 x 处的插值结果, w i (x) 为插值的样本数 i (i=1, ., n) 为自变量 x 的权重, f
7、i为样本点 i 处的值。权重式如下:其中:a i为参与插值的样本点所处泰森多边形的面积, a (x) 为待插值点 x 所处泰森多边形的面积, a ia (x) 为两者相交的面积。下面以广东省各主要气象局为基础数据库, 建立了降雨量分布图如 2 所示。对潮州变电局浮岗站、东莞供电局银朗站、佛山供电局河口站、河源供电局田心站和惠州供电局东升站等五个变电站进行湿度插值, 插值结果如图 2 所示。经验证, 该插值算法对地势平坦的地区湿度插值结果较为准确。图 2 变电站湿度数据分布图 下载原图该算法利用气象站湿度数据来进行时空四维插值, 经过气象站四维坐标向变电站四维坐标的转换, 终于变电站的相应数据。
8、获取变电站气象数据的方法是单向的, 即数据始于气象站数据。这种方法可根据气象站降雨量数据推算出周边变电站降雨量数据, 并且最大可能地利用了气象站监测数据与线路监测数据。3 奇异值处理电气变压器油色谱在线监测数据系列中出现奇异值点是比较常见的问题。以肇庆供电局某变电站#2 主变 C 相油色谱监测传感器 2014 年 4 月 22 日到 2014 年6 月 19 日氢气监测数据为例, 根据图 3 可以看到, 氢气含量监测数据在绝大多数情况下, 气体含量都在 2.5L/L 附近。在 5 月 13 日左右出现极大值, 达到了 140L/L, 这里推测由变压器内部缺陷导致极大值的可能性不大, 可能是传感
9、器受到了干扰或者数据传输出现错误。但由于这些误差的影响, 其它数据在0 值附近的波动都被压缩, 再加上噪声的影响, 数据的变化规律无从体现。因此, 处理数据系列中的奇异值点是重要的一步6。在判断奇异值点时, 由于所测数据会随着变压器绝缘状态变化而变化, 如果只是简单地以历史数据为对比分析奇异值点的基准, 则会由于基准线的不断漂移而使前后数据之间没有可比性。因此, 此处采用的是信号处理中 3 法则作为奇异值判断手段。3 法则原理如下:如果一个信号序列呈正态分布, 其偏离正态分布中心过远 (超过 3, 其中 为正态分布的方差) 的数据可视为奇异值予以剔除。从概率角度来看, 即将距离数据分布中心最远
10、的 0.3%的数据视为奇异值予以剔除, 仅保留原 99.7%的数据。实际工作中往往是对采样样本进行处理, 可以用样本标准差 S 替换 。图 3 含有奇异值的氢气监测数据 下载原图在实际测量中, 所测量 (局部放电量、油中溶解气体气相色谱分析数据) 在是连续的。在实际测量时采用的是定时采样测量方法, 而且相邻两次测量的时间间隔较短, 相邻两次测量的变化 (或其变化速率) 是较小的。如果重复进行多次测量, 变化量将会形成一个以 0 为中心、呈正态分布的样本空间。当存在干扰时, 相邻两次测量值变化较大, 当干扰消失后, 被测量的变化速度又恢复到正常水平。干扰较小时对测量影响不大, 可以用数据平滑的方
11、法来滤除。如果干扰较大但存在时间很短, 我们可以将所测结果视为奇异值, 应将干扰从测量结果中剥离出来;如果干扰存在时间较长, 则不能忽略, 应视为系统实际变化而保留数据, 以利于进一步分析。3 法则运用方法如下:首先求出同一数据序列两个连续测量点之间差值的正态分布参数, 即其样本均值与样本标准差, 并验证其分布是否满足正态分布规律。再用此样本均值与样本标准差去过滤原有数据, 当数据与样本均值之间的误差比样本标准差大 3 倍以上时, 可以判断该处为干扰产生的奇异值点, 其值可由前一天的数据来代替。这样可以用统一的方法将所有数据进行过滤, 去除其中的奇异值点。对于肇庆供电局某变电站#2 主变 C
12、相油色谱进行奇异值去除, 结果如图 4 所示, 经过奇异值去后氢气监测数据特性得以凸显, 氢气监测值在 0.8L/L-4L/L间波动。图 4 奇异值去除后 下载原图4 正常数据阶跃处理实测数据中存在数据阶跃现象。即测量的物理量产生较大的跃变, 并在新的数值附近持续较长的时间, 然后又回归到正常水平, 或者再次跃变到某一新的位置。这种跃变产生的原因很多, 可能是系统性的干扰, 持续一段时间后消失, 也可能是对测量系统或被测变压器进行了相关处理, 如变压器滤油就会对油色谱产生影响, 或测量系统定期重新标定等。具体情况需要结合系统实际操作进行判断。因此在数据预处理时对这些变化进行了保留, 设计了相关
13、的阶跃识别模块, 对相关的阶跃区间进行识别与保留。阶跃信号的识别与保留原理如下:首先计算信号两相邻数据之间的变化, 按 3法则确定所有的跃变, 比较相邻两跃变之间的时间宽度。如果这两个跃变之间的时间宽度达到一定的水平 (即持续时间较长) , 则视为系统正常跃变予以保存;如果时间宽度非常窄 (即持续时间极短) , 则视为奇异值按 3 法则处理。相应的数据处理框图如图 5 所示。图 5 数据预处理程序框图解 下载原图具体步骤:(1) 自动录入需要处理的数据并计算长度;(2) 求相邻两测量数据间的数值差 y;(3) 利用 3 法则识别阶跃点, 做另外存储后, 将这些区间的数据定义为 y 的平均值;(
14、4) 自动记录当前数据的标准差 S (1) ;(5) 利用 3 法则, 进行奇异值淘汰;(6) 上述过程完成后, 奇异值已经剔除完毕, 从而可以将阶跃区间的数据进行处理后, 还原到数据中的相应位置;(7) 数据处理完毕, 进行存储。5 数据展示优化5.1 数据平滑对于测量数据中的随机噪声及白噪声, 可以采用五点平滑的方法去除, 即取其前后各两点共五点数据的加权平均值。对于阶跃点边缘位置的数据可以采用减小平滑区域的方法, 尽量保留原有数据而做到相应的平滑。本论文中采用了杨辉三角法进行数据平滑, 处理方法如下:阶跃两端端点 xi=xi;实际上, 杨辉三角数据平滑法相当于是一个低通滤波器, 能够将采
15、样频率 6%以上的高频信号有效滤除。5.2 包络线拟合对于电气变压器在线监测数据中奇异值点的处理, 还有一类比较特殊的情况, 即数据波动幅度较大 (这种情况通常是由于变压器工作不稳定引起的) , 经过奇异值去除的案例依然可能存在严重波动, 如图 4 所示, 但是数据本身存在一定规律, 对于这种情况可以用其包络线或其拟合曲线来看其分布规律。通过观察拟合线能够发现肇庆供电局 2#主变 C 相油色谱监测传感器监测数据有一定规律, 即成缓慢增长趋势, 如图 6 所示, 其中实线为实测数据, 虚线为包络线。图 6 拟合案例 下载原图仅从实测值 (实线) 来看从 2014 年 4 月 22 日到 2014
16、 年 6 月 10 日, 几乎看不到任何规律。如果考虑到数据值较小的点是由于变压器工作不稳定产生的, 对其采用包络线处理。从这个包络线上就可以看出, 其氢气含量总体呈上升趋势。6 结论本文提出了变压器油色谱、局部放电在线监测及变电站环境监测数据预处理方法:(1) 针对油色谱、局部放电类在线监测数据缺失问题, 提出基于线性插值的数据补缺方法。(2) 针对变电站环境监测设备缺失的问题, 提出基于周边气象站的四维插值算法。(3) 针对油色谱在线监测数据奇异值及数据阶跃的问题, 提出了基于 3 法则的奇异值、数据阶跃处理方法。(4) 针对油色谱在线监测数据噪声及波动的问题, 提出利用杨辉三角进行数据平
17、滑, 利用包络线凸显数据趋势。根据不同的监测数据类型建立相应的预处理方法, 上述数据预处理方法合理的补全了缺失的监测数据, 有效剔除了奇异数据, 凸显了数据变化趋势, 为运行人员进行数据分析奠定了基础, 具有一定工程应用价值。参考文献1孔杰.变压器状态监测与故障诊断系统研究D.华中科技大学, 2006. 2林德山.考虑数据预处理的电力变压器状态评估模型的研究D.华北电力大学, 2013. 3李辉, 杨增辉, 周海洋, 等.快速滤波算法用于在线监测数据预处理J.高电压技术, 2002 (7) :30-31. 4王楠, 律方成.在线监测数据预处理方法的研究J.高压电器, 2003 (3) :57-59. 5柴旭峥, 文习山, 关根志, 等.绝缘在线监测采样数据的两种预处理算法J.高电压技术, 2002 (9) :26-27. 6李晶.电力变压器绝缘在线监测数据聚合模型及其应用研究D.昆明理工大学, 2014. 7李磊.基于气象环境的电力设备状态检修策略研究D.重庆大学, 2013.