收藏 分享(赏)

模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究.doc

上传人:11xg27ws 文档编号:6834377 上传时间:2019-04-23 格式:DOC 页数:11 大小:353KB
下载 相关 举报
模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究.doc_第1页
第1页 / 共11页
模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究.doc_第2页
第2页 / 共11页
模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究.doc_第3页
第3页 / 共11页
模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究.doc_第4页
第4页 / 共11页
模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、 模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究基于油中溶解气体的分析诊断董立新 1, 肖登明 1, 王俏华 1,吕干云 1, 刘奕路 2(1.上海交通大学电子信息及电气工程学院,上海 200240; 2.美国弗吉尼亚理工大学电气工程系) 摘 要:将电力变压器故障历史数据首先进行模糊化及离散化处理,然后构建故障诊断决策表,以决策表作为主要工具,即“知识库”,采用粗糙集数据挖掘方法直接从决策表中提取出潜在的诊断规则,为电力变压器提供有效的故障诊断。关键词: 模糊; 故障诊断;知识库; 粗糙集(RS)Fuzzy Rough Sets Method ApplicationResearch f

2、orFault Diagnosis of Power TransformerDONG Lixin1, XIAO Dengming1, WANG Qiaohua1, LU Ganyun1, LIU Yilu2(1.Institute of Electronic Information fault diagnosis;knowledge database; roughset(RS) 1 前言当前电力变压器色谱故障诊断中,专家系统故障诊断技术已广泛应用于实际系统,取得了良好效果。但专家系统由于其立足的符号信息处理机制的固有缺陷,导致传统专家系统 ES 存在许多问题,主要有:知识获取的瓶颈问题,知识脆

3、弱性,推理单调性等。从专家那里获取知识与表达困难,且带有定性和主观的特点,难于定量和客观的表示。粗糙集理论是一种刻画不完整性和不确定性的数学工具,能有效分析处理不精确、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。它以观察和测量所得的数据进行分类的能力为基础,把知识直接与真实或抽象世界有关的不同模式联系在一起,自身具有获取知识的能力。使用粗糙集理论获取知识的优点在于:1)知识直接从记录的历史案例中提取;2)知识的获取阶段不需要人类专家参与;3)当知识和数据随时间动态发生变化时,更新知识比较容易;4)与传统的神经网络相比,粗糙集方法以直接的方式描述发现的知识,并且非常容易转换成可

4、用的规则。其规则易于理解,较好克服了神经网络将规则知识隐含于网络的一系列连接和权值中,缺乏透明性,无法为用户理解的缺点。电力变压器的故障诊断可以看成一个模式分类问题,每一个故障对应一组特征集。本文将电力变压器历史故障数据进行模糊及离散化处理,将处理后的数据建立故障诊断决策表,形成知识库,采用粗糙集数据挖掘方法,从决策表中提取隐含、潜在的诊断规则,为电力变压器提供故障诊断。2 粗糙集粗糙集(rough set)理论是一个处理不确定性的数学工具,它无须任何先验信息,能有效地分析和处理不精确、不一致、不完整等各种不完备数据,并从中发现隐含的知识,揭示潜在规律 1 。定义 1 给定一个有限的非空集合

5、U(称为论域),R 为 U 上的一族等效关系(满足自反、对称和传递性)。则二元对 K=(U,R)构成一个近似空间。等效关系 R 将论域 U 分割成互不相交的子集 Ei(i=1,n),E i和空集称为基本集,记为 U/R=E 1,E 2,E n。由基本集 Ei的并集所组成的集合称为等效类或可定义集。设 X 是 U 中的一个子集,如果 X 不能用基本集的并集准确地表示出来,则称 X 为粗糙集。所有包含在 X 中的基本集的并集组成 X 的下逼近(lowerapproximation),记为 R*(X);所有与 X 的交集为非空的基本集的并集组成的上逼近(upper approximation),记为

6、 R*(X)。数学定义如下其中,X 是 U 中的一个对象。X R表示 U 上的按等效关系 R 划分出的包含 X的等效类。实际上 R*(X)是 U 中包含在 X 中的最大可定义集,R *(X)是 U 中包含X 的最小可定义集。粗糙集合是由上、下逼近这一对精确(crisp)集合刻画的2,3 。粗糙集理论使用决策表(也称信息表)描述论域 U 中的对象。决策表为一张二维表格,类似于关系数据库中的关系数据模型。表中每一行描述一个对象,每一列表征对象的一种属性。属性分为两种:条件属性和结论属性(也称决策属性)。对象根据条件属性被划分成不同的决策类。RS 分类规则的自动提取是通过对决策表进行简约实现的。简约

7、(reduct)定义为不含多余属性并保证分类正确的最小条件属性集。一个决策表可能存在几个简约,这些简约的交集定义为决策表的核(core),核中的属性是影响分类的重要属性。在一个决策系统中,各个条件属性之间往往存在着某些程度上的依赖或关联,简约可以理解为在不丢失信息的前提下,可以最简单地表示决策系统的结论属性对条件属性集合的依赖和关联。这样,通过一组相对简约,可以得到决策系统中最简单的规则集,其中,每个相对简约就是一条规则的前件。RS 理论可以直接从决策表中抽取分类规则,这种方法被称作“从例子中学习”。3 基于粗糙集方法的规则提取定义 2 称 S=(U,A,V a,a)为知识表示系统,其中:U

8、为非空有限集,称论域;A 为非空有限集,称属性集合;V a为属性 aA 的值域;a:UVa 为单一映射,使论域 U 中任一元素取属性 a 在 Va中的某一唯一值。如果 A 由条件属性集合 C 和结论属性集合 D 组成,C、D 满足 CD=A,CD=,则称 S 为决策系统。为了表示简单,有时用(U,Cd)表示决策系统,即结论属性集合只包含一个元素。其形式如一张二维表格,每一行描述一个对象,每一列描述对象的一种属性,属性分为条件属性和决策属性4。其形式如表 1 示。知识推理是智能决策支持系统的核心,即根据所获得的信息通过数据分析、推理,产生合理的决策规则,形成有用知识的过程。为了处理数据,需要对知

9、识进行符号表示。从另一个角度来看,决策表中每一个对象都蕴涵着一条决策规则,决策表实际上也是一组逻辑规则的集合。知识表达系统就是研究将对象的知识通过指定的对象的基本特征和特征值来描述,以便通过一定的方法从浩如烟海的数据中发现有用的知识或决策规则。采用粗糙集理论方法,提取合理的决策规则,形成有效诊断知识的具体过程见图 15 。规则挖掘过程描述如下。决策规则挖掘的目的是用最少的条件辨别每一个决策类,即将决策表中包含的决策知识精练。决策表的规则提取的方法由四步构成 2,6 :1)计算条件属性的简约即从决策表中删去一些冗余的列;2)删去重复的行即删除重复对象;3)删去多余的属性值;4)求出提取规则的可信

10、度,并将其表示为 IFTHEN 的形式。前两步是对决策表进行整体简约,第三步是对每一条决策规则进行进一步化简,使得在一行中去掉某些属性值后仍能划分到原来的决策类中。最后一步是具有一定可信度的规则形成。综上所述,粗糙集理论的基本框架可归纳为:以不可分辨关系划分所研究论域的知识,形成知识表达系统,利用上、下近似集逼近描述对象,通过知识简约,获得最简知识。4 基于模糊粗糙集方法的电力变压器诊断规则提取我们使用电力变压器色谱油气诊断案例数据库构建决策系统S=(U,Cd)。这里油气分析气体采用 H2、CH 4、C 2H6、C 2H4、C 2H2和Gsum(CH 4、C 2H6、C 2H4、C 2H2烃类

11、气体含量之和),这些气体经模糊归一化和离散化处理后作为决策系统的条件属性。决策属性为故障类型,属性值包括:正常(0),过热(1)(故障类型中将低、中、高温过热故障数据皆泛化为过热故障),低能(2),高能(3)。4.1 电力变压器数据模糊归一化处理样本数据的泛化对于数据挖掘非常重要,由于电力变压器气体含量的绝对值变动很大,通常需要将他们作模糊归一化处理,变成 01 之间的数值。模糊归一化如下式 7,8 4.2 电力变压器数据离散化处理粗糙集方法是一类符号化分析方法,所有的属性值均看成定性数据,因此对连续属性值离散化是 RS 理论应用的关键问题之一。可行的转换方法是根据定量数据的统计分布自动分段,

12、每一段作为定性数据。若定量数据的值很少,则可直接看作是定性数据进行处理。本文电力变压器气体模糊化连续值离散化的方法为4.3 基于模糊粗糙集电力变压器诊断规则挖掘通过粗糙集方法提取的有意义的规则,往往需要有可信度(confidence)指标来度量其正确程度。可信度意味着规则的可依赖程度。由于可信度小的规则(即弱关联规则)通常是没有意义的,或应用价值不高,故在挖掘规则时需设定阈值,即最小可信度(miniconfidence),对于任何一条规则必须满足隶属度函数(也称可信度) 4 。对于使用粗糙集理论方法挖掘的规则,可能存在冲突,即同样的条件属性得出不同的决策。为了解决诊断冲突,我们选择可信度大的规

13、则作为诊断规则。通过上述的过程,采用某电力实验研究提供的变压器油中溶解气体分析数据180 个样本构建知识决策表,对构建的电力变压器故障数据决策表采用粗糙集方法进行规则提取。得到如表 2 基于模糊粗糙集电力变压器诊断规则挖掘表。其中,条件属性值全相同的元素归并为一条记录,对应的元素的样本个数用 k 表示。索引号 I 表示序号。作为理论研究,这里将故障类型简化,F 表示故障类型:其值 0 表示正常,1 表示过热故障,2 表示低能放电,3 表示高能放电。u 表示对应规则的可信度。对于 u(0u1),我们取 u0.8 的规则。表中:*表示可取 0、1、0.5 中任一值。#1 表示可取 0 或 0.5。

14、#2 表示可取 0.5 或 1。表中的属性值皆为气体含量的模糊离散化值。表 2 挖掘的 37 条规则(对应 152 个挖掘样本)中可信度 u 为 1 的称为确定性规则,否则称为可能性规则。规则形式表示如下:最后我们采用 15 个数据样本作为诊断案例,分别采用表 2 的诊断规则与三比值法进行诊断,其中,低、中、高温过热故障统一用“过热故障”表示。诊断结果如表 3,表中有“*”的表示诊断结果与实际故障不一致,诊断错误。表中“诊断输出(由表 2)”表示基于模糊粗糙集电力变压器诊断规则挖掘表(表 2)进行诊断。在 15 个诊断案例中,基于表 2 规则进行诊断,样本 3 诊断错误,本应过热故障,诊断为低

15、能放电,诊断正确率为 93.3%。采用三比值法诊断,诊断错误 4 个样本,其中样本 6、8、12,三比值法无对应诊断规则,样本 3,实际为过热,三比值法诊断为正常。诊断正确率为 73.3%。 5 结语 电力变压器的故障诊断可以用一个模式分类问题来描述,很适合应用 RS 理论的决策表方法。它直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,找出该问题中的内在规律。规则知识直接从记录的历史案例中自动提取,克服了传统专家系统知识获取瓶颈的难题。与传统的神经网络相比,粗糙集方法以直接的方式描述发现的知识,并且非常容易转换成可用的规则。基于模糊粗糙集方法的电力变压器故障诊断

16、能够给出具有某种置信度的输出,具有一定的容错能力。在我们诊断的 15 个案例中,诊断正确 14 个(占 93.3%),而采用传统的三比值方法诊断,诊断正确 11 个(占73.3%)。具有一定推广价值。 参考文献 1韩祯祥,张琦,文福拴.粗糙集理论及其应用J.信息与控制,1998,27( 1):37-45 2袁保奎,郭基伟,唐国庆,等.基于粗糙集理论的变压器故障分类J.电力系 统及其自动化学报,2001,13(5):1-4 3张琦,韩祯祥,文福拴.一种基于粗糙集理论的电力系统故障诊断和报警处 理新方法J.中国电力,1998,(4):32-35 4李永敏,朱善君,陈湘辉,等.基于粗糙集理论的数据挖

17、掘模型J.清华 大学学报,1999,39(1):110-113 5郝丽娜,徐心和.基于粗糙集理论的规则修正方法J.控制与决策,2002, (5):614-616 6郝丽娜,徐心和.粗糙集理论在故障诊断规则获取中的应用J.信息与控制 ,2001,30(7):586-590 7周翔,朱学愚,文成玉,等.基于遗传学习算法和 BP 算法的神经网络在矿坑涌水 量计算中的应用J.水利学报,2000,(12):59-62 8Li Honglei,Xiao Dengming,Chen Yazhu.Wavelet ANN based tran sformer fault diagnosis using gasinoil analysisA.In:Properties and Appli cations of Dielectric Materials,Proceedings of the 6th International Conference Vol.1C.2000.147-150 9曾黄麟.粗集理论及其应用M.重庆:重庆大学出版社,1996

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报