1、1,基于数据分析的模糊模式识别,关键词:模糊集概念模糊集之间的距离:贴近度模糊模式识别,2,经典集合:设 A 为论域(对象全体)上的一个集合,则 u, uA or uA ,二者必居且仅居其一具有清晰的归属性。我们使用一个函数来刻画这个特征,定义如下二值函数: A : 0,1, 1, uA u A ( u ) =0, uA 称 A 为集合A的特征函数反之,给定一个二值函数 A : 0,1, u A ( u ) 可唯一确定一个经典集合 A ,即A = u, A ( u ) = 1 经典集合跟一个定义在论域上的特征函数成一一对应。,1 模糊集,3,模糊现象:A表示集美大学学生中的美女,B表示年轻人,
2、C表示优秀学生,为了定量地刻画模糊概念和模糊现象,adeh 教授定义模糊集如下: 定义 设 为论域,则称由如下实值函数A : 0,1 , u A ( u ) 所确定的集合 A 为 上的模糊集合,而称A 为模糊集合A 的隶属函数,A ( u )称为元素 u 对于A 的隶属度。例如:U=张三(a),李四(b) ,王五(c) ,A表示优秀学生,其隶属度函数为A ( a )=1, A ( b )=0.1, A ( c )=0.9.U表示人的年龄0,200,Y表示年轻人,其隶属度函数为Y(u):,4,模糊集合 A 是一个抽象的概念,我们只能通过隶属函数A来认识和掌握 A A(u)的数值的大小反映了论域
3、中的元素 u 对于模糊集合 A 的隶属程度, A(u)的值越接近于1 ,表示u隶属于A 的程度越高;而(u)的值越接近于,表示u隶属于 A 的程度越低特别地, 若A(u) =,则认为u完全属于A ; 若A(u) =,则认为u完全不属于A用定义在论域上取值为0,1的函数来定义集合:1.统一经典集合和模糊集;2.可以刻画模糊性的集合。3.只要给定隶属度函数,模糊集就完全清楚把握,因为任给对象u,由A(u)就可以知道它隶属于集合A的程度了。,模糊集的隶属度解释:,5,4.模糊集之间的距离(6/6),定义 设U 为论域, A , B F (U)(U上模糊集全体), A与B的内积 AB=uU (A(u)
4、 B(u) A与B的外积 AB=uU (A(u) B(u) A与B的格贴近度 = (AB)(AB)例子1:设U = u1 , u2 , u3 , u4 , A , B F (U), 且 A=(0.6, 0.9, 0.4, 0.2), B=(0.4, 0.8, 0.7, 0.5) 试求 解: AB= (0.60.4)(0.90.8) (0.40.7)(0.20.5) = 0.40.80.40.2=0.8 AB= (0.60.4)(0.90.8) (0.40.7)(0.20.5)= 0.60.90.70.5=0.5= (AB)(AB)=0.8 (0.5) =0.8 (1-0.5)=0.5,2 模糊
5、集之间的距离:格贴近度,6,例子2 设U=(,), A, BF(U)且AB=0,从而得= (AB)(AB)=,7,8,模式识别: 已知事物的各种类别(标准模式), 判断对给定的或新得到的对象应归属于哪一类, 或是否成为一个新的类别的问题.已知的标准模式中, 有些是清晰的,有些是模糊的. 我们把标准模式是模糊的识别问题称为模糊模式识别问题。模糊模式识别分为两类: 一类是模式库为模糊的,而带识别对象是分明的; 另一类是模式库和待识别对象都是模糊的.,3 模糊模式识别,9,模糊模式识别的择近原则设A =A1, A2, Ap为论域U上已知的模糊模式库, BF(U)为一个待识别对象,若 (B,Ai)=m
6、ax(B, A1), (B, A2), (B, Ap) 则认为B应归属于模式Ai,其中为F(U)上的某种贴近度函数.,目 录,10,模糊模式识别一般应用步骤第一步: 抽选识别对象的特性指标;第二步: 构造模糊模式Ai(i=1,2, p)的隶属函数;第三步: 构造待识别对象B的隶属函数;第四步: 求出B与Ai的贴近度(B,Ai), (i=1,2, p);第五步: 根据择近原则识别B应归属于哪一个模式.,11,12,现将水质分为如下6类:(1)I类优质水A1;(2)II类良好水A2;(3)III类可食用级水质A3;(4)IV类一般性不可食用级水质A4;(5)V类工业用水A5;(6)V类低于工业级劣
7、质水A6;对于四川攀枝花水段水质B,试判断B的归属问题。,13,解 (1) 抽选水质的特性指标设论域U为待识别长江水质全体。对于每一具体u,选择以下4项作为其特性指标:a)溶解氧u1b)高锰酸盐指数u2c)氨氮u3d) PHu4 因此每一具体长江位段水质u的特性指标向量为u=(u1, u2, u3, u4),14,(2) 构造I类水质模式Ai的隶属函数为了计算方便,我们来确定第j个特性指标uj(j=1, 2, 3, 4)对于水质模式Ai (i=1, 2, , 6) 的隶属函数Ai (uj)。根据统计规律,可选Ai的为正态模糊集,即:,15,16,17,18,19,(4) 计算B与水质模糊模式A
8、i 的贴近度由于B和Ai (i=1,2,3,4,5,6)都是U上的正态模糊集,故选用格贴近度。,20,选取一组权值(w1,w2,w3,w4),这里wj 表示第j个特性指标uj (j=1,2,3,4)对水质分类影响的重要程度。这样我们就得到了四川攀枝花 B的模糊模式Ai (i=1,2,3,4,5,6)的加权贴近度,即,21,w1=0.33, w2=0.33, w3=0.17, w4=0.17 根据计算加权贴近度(B, Aj)的值,可知Max 0.502, 0.646, 0.823, 0.529, 0.509=(B, A3) 故由择近原则可得四川攀枝花B应归属于模式A3,即III类水质。,(5) 利用择近原则判断具体巷道围岩B的类别,