1、基于变压器故障分类的 DGA 特征提取(锡林浩特供电局,内蒙古 锡林浩特 026000) 摘 要: 文章从模式识别的角度出发,提出在应用 DGA对电力变压器进行故障诊断的过程中,若能 针对具体的分类模式,提取出能够区别不同类别模式的“选择性”的信息,将有利于提高诊 断效果;对放电与过热故障的气体特征、电路过热与磁路过热故障的气体特征进行选择和测 试,表明根据不同的分类模式进行气体特征提取对提高故障识别效果将是有益的。关键词:变压器;故障诊断;模式分类;特征提取中图分类号:TM85 文献标识码:A 文章编号:10076921(XX)17007402应用油中溶解气体分析(Dissolved Gas
2、 Analysis 简称 DGA)进行变压器故障诊断属于模式识 别中的模式分类问题;特征提取是其中的关键环节,特征提取是否得当直接关系到诊断的效 果。通常,人们在基于 DGA 样本进行变压器故障识别时,无论采用哪种故障分类方式,往往 是直接利用 DGA 样本的模式特征、四比值法或 IEC 三比值法等,并没有针对具体的分类模式, 先提取出与故障模式分类有关的特征信息进行识别,以致造成诊断效果不够好。为此,本文 提取了放电与过热故障的气体特征、电路过热与磁路过热故障的气体特征,并应用模糊模式 识别方法进行了测试,测试结果表明提取出合适的特征信息确实有利于提高变压器的故障识 别率。1 提取油中溶解气
3、体特征的必要性模式分类的过程需要通过特征提取,将模式空间映射为特征空间,再通过合适的分类器将特 征空间映射为类型空间;其中特征提取是一个关键性的环节。在基于 DGA 技术进行变压器故 障诊断的过程中,一般人们是直接利用DGA 样本的特征,如在使用 DGA 样本时,通常选用 H2 、CH4、C2H4、C2H6、C2H2、 CO、CO2 这七种气体或其中的五六种作为故 障的模式特征。这实际上是直接将模式空间映射到类型空间进行分类,因而具有一定的盲目 性。直接分类之所以无目的,是因为对分类来说,重要的不是对一个模式进行完整的描述, 而是要提取出那些导致区别不同类别模式的 “选择性”信息,即集中那些对
4、于分类来说是 重要的信息。1,2 在应用 DGA 进行分类时,所选用的气体特征应尽可能包含表征分 类的模式信息,而不再包含其他信息;由于 DGA 样本数量比较有限,且有些特征对分类的贡 献有时很小,还有些特征如 CO 和 CO2 的数据分散性又很大,其数据变化程度对某些故障识 别来说并不敏感,这些可能 的干扰对分类将是不利的。因此,很有必要通过特征的提取和选择,寻找有利于故障分类的 信息以提高分类效果。2 从 IEC 三比值看区别放电类和过热类的特征IEC 三比值虽然在比值编码和编码界限等方面还存在缺陷,但从实践效果看,仍是一种用于 识别早期潜伏性故障的相当有效的方法,且我们仍能从三比值的编码
5、上找到一些有益于故障 分类的规律。根据表 1 和表 2 的 IEC 编码情况3,暂不考虑无故障状态,作者对三比 值编码数值特征分布初步总结如下:740)this.width=740“ border=undefined2.1 从比值 C2H2/C2H4 看放电类故障和过热类故障在0.1 范围内, 也就是较小范围内有所重叠。即低能量局放的编码 0 和过热类故障的编码 0 重叠。 2.2 从比值 CH4/H2 看过热类故障的低温过热(2H4/C2H6 看放电类故障和过热类故障在 3 的整个范围和过热类故障在 3 的整个范围内多处重叠,即相对于比值 C2H2/C2H4 和 C H4/H2 而言,它在更
6、大范围内有所重叠。而从模式分类的角度看,所选特征的数据分布在不同类别之间若存在较大差异,则对分类是 有益的;反之,若特征数据分布的重叠性强、重叠范围大,则往往不利于分类。因此从以上 对三比值的总结看,假如已初步判定变压器存在故障,将首先要对放电类和过热类故障进行 识别,这时比值 C2H2/C2H4 应是一个很主要的特征,因为相对于比值 CH4/H2 和 C2H4/C2H6 而言,放电类故障中只有低能量局放和 过热类故障在 00.1 很小范围内有 所重叠。从本文后面的测试也可看出,单独用比值 C2H2/C2H4 作为特征以区别放电 类和过热类故障相对于其他特征组合具有更高的识别率。3 应用模糊模
7、式识别测试特征提取的效果3.1 模糊模式识别模糊模式识别是将模糊数学的隶属函数应用到模式识别中,将隶属度作为模式之间相似性的 测度;隶属度越大,则待识别模式与此已知模式的相似度越大,故应归入此类模式。 4其识别步骤为:3.1.1 待识别对象的特性指标即特征的选取。选取能够表征分类特征的特征信息,将待 识别对象用特征矢量=(1,2,p)表示,其中 i 代表选取的特征。3.1.2 构造模糊模式的隶属函数。这一步是识别工作的关键。3.1.3 识别判断。将隶属度作为模式之间相似测度,常按最大隶属原则确定模式类型。 3.2 选用不同的特征组合识别放电和过热故障3.2.1 特征的选取。特征选取是否得当关系
8、到故障分类的效果,由于本文旨在研究如何基 于 分类方法进行变压器故障模式特征提取,寻找变压器故障模式与 DGA 样本特征之间的关系, 故将对几种不同的特征组合进行测试,包括单独选用比值 C2H2/C2H4 进行判别;选 用比值C2H2/C2H4 和 CH4/H2 组成特征向量进行判别;选用C2H2/C2H4、CH4/H2、C2H4/C2H6 和 CO2/CO 四个 比值组成特征向量进行判别。最后将对此三种特征组合判别效果进行比较,以示特征选取的 好坏对判别效果的影响。3.2.2 隶属函数的确定。将变压器故障作为论域,放电类故障和过热类故障作为两个模糊 子集。对特征矢量的每一个分量,选用正态型隶
9、属函数作为每一个特征分量的隶属函数 5。3.2.3 识别结果。作者对收集到的 717 个故障样本根据实际的吊芯结果进行了分类,得到 41 4 个过热样本和303 个放电样本。然后分别应用上述的三种特征组合进行识别判断,得到如下 的测试结果:3.2.3.1 测试结果一:选用比值 C2H2/C2H4 进行判别。根据统计结果得到的隶 属函数对上述的 414 个过热样本和303 个放电样本进行判别,得到表 3 的结果。740)this.width=740“ border=undefined3.2.4 结果分析从以上测试结果可以看出,如仅为识别过热类和放电类故障,采用比值 C2H2/C2H4 作为识别这
10、两种故障的特征已经足够,从测试结果中也可看出单独用比值 C2H2/C2H4诊断的正判率在这三种特征组合里是最高的,这一点也正与 2.1 所述放电类和过热类故障仅 在此比值较小范围内存在重叠的分析相一致。若改用比值 C2H2/C2H4 和 CH4/H2 组成特征向量进行判别,诊断正判率并没有比单独采用比值C2H2/C2H4 进行识别有 提高,反而稍有下降。若再改用 C2H2/C2H4、CH4/H2、C2H4/C2H6 和 CO2/CO 四个比值组成特征向量进行判别,可以看出识别效果会大大下降。3.3 选用不同的特征组合识别电路过热和磁路过热故障为了便于故障大致定位,常将过热类故障进一步细分为电路
11、过热类和磁路过热类。同样采用 模糊模式识别的方法,作者对收集到的 94 个电路过热样本和 196 个磁路过热样本进行识别, 采用 C2H4/TCG(TCG 为总可燃性气体的总量)、(CH4+C2H4)/TCG 和 CO2 这三个 特征组成特征 向量,得到了表 6 所示的测试结果,可以看出,它相对于采用C2H2/C2H4、CH4/H 2、C2H4/C2H6 和 CO2/CO 四个比值组成特征向量进行判别的效果(表 7 所示)要好 些。740)this.width=740“ border=undefined由此可以看出,针对不同的故障分类方式,应选用不同的特征进行识别;且所选用的特征应 对分类有益
12、才好。4 结论特征提取作为变压器故障模式识别的关键环节,若能提取出与故障分类模式密切相关的、 有利于故障分类的特征,则故障类型之间是可分的;若仅需将故障分为过热类和放电类两 种故障时,应用模糊模式识别方法,则采用比值 C2H2/C2H4 作为特征已经足够,一 般不需要其他的特征信息已能达到很好的识别效果;对于过热类型故障,若拟进一步细分 为电路和磁路过热,则用特征C2H4/TCG、(CH4+C2H4)/TCG、CO2 组成特征向量 进行模糊模式识别将会达到较好的识别效果。参考文献1 德H.尼曼.模式分类MXX :科学出版社,1988,(7).2 J. P. Marques de s 著,吴逸飞译. 模式识别原理、方法及应用M . XX:清华大学出版社,XX.11.3 IEC Publication 599, Interpretation of the analysis of gases in tran sformers and other oil-filled electrical equipment in-service, 1978.ZK)4 张越. 模糊数学方法及其应用M.XX:煤炭工业出版社,1992.5 钱政,黄兰,严璋等. 集成模糊数学与范例推理的变压器故障诊断方法J. 电网技术 XX,25(9):2427.