收藏 分享(赏)

判别分析-距离判别法.ppt

上传人:精品资料 文档编号:10631038 上传时间:2019-12-10 格式:PPT 页数:35 大小:1.48MB
下载 相关 举报
判别分析-距离判别法.ppt_第1页
第1页 / 共35页
判别分析-距离判别法.ppt_第2页
第2页 / 共35页
判别分析-距离判别法.ppt_第3页
第3页 / 共35页
判别分析-距离判别法.ppt_第4页
第4页 / 共35页
判别分析-距离判别法.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

1、判别分析距离判别法,目录 / CONTENTS,01/引 言,02/距离判别法,04/距离判别法应用,03/距离判别法例题,1彭力.冶金工业出版社,2刘庆军,陈坤,刘晓光.煤与瓦斯突出预测PCA 距离判别法研究.煤矿安全,2016,42(10):97-101 3姜喜春.数据挖掘中的距离判别分析法.科技资讯,2015,(27):155-157 4罗磊,曹平.深部巷道岩爆破加权距离判别法模型的分析和应用.中南大学学报,2012,43(10):71-75 5王吉亮,陈建平,杨静.距离判别法在公路隧道岩分类中的应用.吉林大学学报.2008,38(6):999-1004,引 言,信息融合中的分析方法有三

2、种,分别是:判别分析、聚类分析、主成成分分析。,判别分析产生于20世纪30年代。近年来,在自然科学、社会学及经济管理学科中都有广泛的应用。 判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。然后,当遇到新的样品时,只要根据总结出来的判别公式和判别准则,就能判别该样品所属的类别。,例如,某医院有部分患有肺炎、肝炎、冠心病、糖尿病等病人的资料,记录了每个患者若干项症状指标数据。现在想利用现有的这些资料找出一种方法,使得对于一个新的病人,当测得这些症状指标数据时,能够判定其患有哪种病。这个问题可以应用判别分析方法予以解决。,已知n个

3、总体,其分布函数分别为:F1(x),F2(x), ,Fk(x), 每一个总体都是一个p维函数,对于给定的样品x,我们应该通过判别函数(判别准则),来决定该样品应属于这n个总体中的哪一个总体。,判别分析是在已知研究对象分成了若干类型(组别),并已取得各种类型的一批样品观测数据,在此基础上根据某些规则建立判别式(判别量),然后对未知类型的样品进行判别分类。,决定某一样品所属的类别,其实质是决定判别函数。根据样品给定的多变量数据,由判别函数来决定该样品所属的类别。,判别函数,判别分析内容很丰富,方法很多。,按判别的组数来区分,有 两组判别分析 和 多组判别分析;,按区分不同总体所用的数学模型来分,有

4、 线性判别 和 非线性判别;,按判别时所处理的变量方法不同,有 逐步判别 和 序贯判别。,判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。判别分析中主要有四种常用的判别方法,即距离判别法、Fisher(费希尔)判别法、贝叶斯判别法和逐步判别法。,距离判别法,马 氏 距 离,设总体 为m维总体(考察m个指标),样本。令=E( )(i=1,2, ,m),则总体均值向量为。总体G的协方差矩阵为:,设X,Y是从总体G中抽取的两个样本,则X与Y之间的平方马 氏距

5、离为:样本X与总体G的马氏距离的平方定义为:,1.两个总体的距离判别法:,这个判别规则的等价描述为:求新样品X到G1的距离与到G2的距离之差,如果其值为正,X属于G2;否则X属于G1。,假设均值1,2以及协方差矩阵已知,相等,我们计算:,两个总体的距离判别法,其中=(1+2)/2是两个总体均值的平均值,=-1(1-2),记W(X)=(X-) (1.2) 则判别规则(1.1)式可表示为XG1,当 W(X)0 (1.3)XG2,当 W(X)0 这里称W(X)为两总体距离判别的判别函数,由于它是X的线性函数,故又称为线性判别函数,称为判别系数。,在实际应用中,总体的均值和协方差矩阵一般是未知的,可由

6、样本均值和样本协方差矩阵分别进行估计。设X1(i),X2(i),Xn1(i)来自总体的样本,i=1,2。则1和2的无偏估计为:,两个总体的距离判别法,1.4,两个总体的距离判别法,这里我们应该注意到:,两个总体的距离判别法,(1.1),两个总体的距离判别法,2.多个总体的距离判别法:,多个总体的距离判别法,设有g个m维总体 , , ,均值向量分别为 , , 协方差矩阵分别为 , , ,则样本X到各组的平方马氏距离是:, =1,2,g 判别规则为:,若,距离判别法例题,MATLAB函数,例 人文发展指数是联合国开发计划署于1990年5月发表的第一份人类发展报告中公布的。该报告建议,目前对人文发展

7、的衡量应当以人生的三大要素为重点,衡量人生三大要素的指示分别要用出生时的预期寿命、成人识字率和实际人均GDP,将以上三个指示的数值合成为一个复合指数,即为人文发展指数(资料来源:UNDP人类发展报告1995年)。今从1995年世界各国人文发展指数(表43)的排序中,选取高发展水平、中等发展水平的国家各五个作为两组样品,另选四个国家作为待判样品作距离判别分析。,本例中变量个数p=3,;两类总体各有五个样品,即n1=n2=5,有四个待判样品,假定两总体协差矩阵相等。 (1)两组线性判别的计算过程如下:75.88 70.44(1)= 94.08 (2)= 91.745354.4 3430.4,(2)

8、计算样本协差阵,从而求出,36.228 56.022 448.74 86.812 117.682 -4895.74 S1= 56.022 344.228 -252.24 S2= 117.682 188.672 -11316.54 448.74 -252.24 12987.2 -4895.74 -11316.54 208384.8 经计算123.04 173.704 -4447 S=S1+S2= 173.704 532.9 -11568.78-4447 -11568.78 2100372,(3)求线性判断函数W(X),(4)对已知类别的样品分类 对已知类别的样品用线性判别函数进行判别分类,结果如

9、表4-4所示,全部判对。,(5)对判别效果进行检验 判别分析是假设两组样品取自不同总体,如果两个总体的均值向量在统计上差异不显著,则做判别的意义不大。所谓判别效果的检验,就是检验两个正态总体的均值向量是否相等。根据公式:,将上边的计算结果代入统计量后可得:F=12.6746F0.05(3.6)=4.76 故在=0.05检验水平下,两总体间差异显著,即判别函数有效。,(6)对待样品判别归类结果如表4-5所示:,总结:回代率为百分之百,这与统计资料的结果相符,而待判的四个样品的判别结果表明:中国、罗马尼亚为中等发展水平国家,即第二类;希腊、哥伦比亚为高发展水平国家,即为第一类。这是符合当时实际的,

10、即与当时世界各国人文发展指数的水平相吻合。,class,err=classify(sample,training,group,mahalanobis) classify函数将Sample的每一行进行判别,分到training指定的类中。 training:是用于构造判别函数的训练样本数据矩阵,他们的每一行对应一个观测,每一列对应一个变量。 sample:待判别的样本数据矩阵 group:已知的分类矩阵 err:基于training数据的误判概率的估计值,距离判别法应用,在深部巷道岩爆破中的应用,背景,在我国,当开采深度超过600m一般就认为其为深部开采,近年来,我国很多矿开采深度都达1km以上

11、。深度巷道一般处于高应力状态,当地应力超过岩体极限强度时,岩体失去了平衡而受到破坏,围岩中的应力集中使岩体特别是硬质岩体产生脆性破坏,并伴随大量能量释放,产生岩爆现象。岩爆现象轻则给矿山带来经济损失,重则会带来灾难性后果。,方法,借鉴判别法的思想引进加权马氏距离判别法对岩爆的发生以及烈度进行评判。,结论,(1)应用主成分分析法的方法处理样本参数,将得到的样本总体的相关性系数作为权阵建立加权判别模型,将其应用到实际矿山深部巷道岩爆预测中取得了较好的结果。 (2)计算过程中使用的协方差为每个整体的协方差,但不是每个整体的协方差计算都能够得到加权马氏距离,所以要求选取的样本容量尽量大,且样本的参数分布均匀。,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报