1、1,第六章 模糊聚类分析,6.1 普通分类(分类是硬性的,非此即彼)一、集合的划分对集合 X 的一个划分,是指把 X 分成若干个子集 X1,X2,Xn,使得满足下列二个条件: X1X2Xn = X,且对 ij , XiXj = ,( i,j=1,2,n )二、普通等价关系设 R( XX ),称 R 是 X 上一个等价关系,若 R 满足下列三个条件: 自反性:xX,有( x,x )R ; 对称性:x,yX,若( x,y )R,有( y,x )R ; 传递性:x,yX,若( x,y )R,( y,z )R,有( x,z )R 。例6-1 对集合(论域) X = 人 ,则关系 R = “年龄相同”
2、就是 X 上的一个普通等价关系,因为满足下列三个条件: 自反性:任何人与自己是“年龄相同”的 ; 对称性:我与你年龄相同,你与我年龄也相同; 传递性:我与你年龄相同,你与他年龄相同,我与他年龄也相同。三、普通分类一个普通等价关系决定一个普通分类。,2,一、建立 X = X1,X2,Xn 上的模糊关系矩阵 R (叫标定),其中 rij0,1 ,表示元素 Xi 与 Xj 间的相似程度,i,j=,1,2,n,,6.2 模糊聚类(分类是有弹性的,亦此亦彼),方法(一).评定打分法:请专家或有经验的专业人员组成评定小组进行打分评定获得 rij 。,例:组成一个100人的评比小组,对X=X1,X2,X3上
3、的3个元素的相似性进行评价。结果是:认为X1与X1“相似”的有100人,占100%,r11=1;认为X1与X2“相似”的有81人,占81%=1,r12=0.81;认为X1与X3“相似”的有53人,占53%,r13=0.53;认为X2与X3“相似”的有24人,占24%,r23=0.24;此时r22=1,r33=1,r21=0.81,r31=0.53,r32=0.24。从而X上的模糊关系矩阵为:,3,方法(二).统计指标法:一个模糊等价关系决定一个模糊分类 - 叫聚类。分类的集合 X = X1,X2,Xn ,由 n 个元素组成,对其中每一个元素 ,采用不同的 m 个统计指标:对元素 X1 ,采用统
4、计指标 x1 = ( x11,x12,x1m ) ;对元素 X2 ,采用统计指标 x2 = ( x21,x22,x2m ) ;对元素 Xn ,采用统计指标 xn = ( xn1,xn2,xnm ) ;( xij为第 i 个元素 Xi 的笫 j 项统计指标值 ) 将每个元素各项统计指标标准化:常用极值标准化公式,4,经过上步标准化后的 Xi 与 Xj 的各统计指标按下列方法中的任一种计算 rij 。,1. 欧氏距离法:,2. 数量积法:,其中 M 是个适当选择的常数,,3. 夹角余弦法:,5,4. 相关系数法:,5. 指数相似系数法:,其中 sk 是个适当的正常数,6. 最大最小法:,7.算术平
5、均最小法:,8.几何平均最小法:,6,9.绝对值数法:,10.绝对值倒数法:,其中 M 是个适当的正常数,使得0rij1,11.绝对值减数法:,其中 C 是个适当的正常数,使得0rij1,二、进行聚类分模糊等价关系(矩阵)与模糊相似关系(矩阵)二种情况进行。,7,6.3 模糊等价关系(矩阵)与聚类分析一、原理因为: 模糊矩阵 R 是模糊等价矩阵 对0,1,R 的 截矩阵 R 均是普通等价矩阵。所以: 可通过 R 对 X 上的元素进行聚类。二、定理若水平 1, 2 满足 0121,则按 2 分出的每一类必是按 1 分出的一类的子类。,例6-2 设论域 X = X1,X2,X3 ,X4,X5 ,经
6、过标定后得模糊关系矩阵为,易证 R 是 X 上的模糊等价矩阵,因此可从 R 出发对 X 中的元素进行模糊聚类。解:方法(一):直接分类,8, 取 0.85 0.9,得:,按该水平,r35=r53=1, 可将 X3,X5 归为一类,其余元素各自成一类, 共分成四类:X = X1 X2 X3 ,X5 X4 , 取 0.8 0.85 ,得:,按该水平, r23= r32= r25= r52= r35=r53=1, 可将 X2,X3,X5 归为一类,其余元素各自成一类, 共分成三类:X = X1 X2 ,X3,X5 X4 , 取 0.9 1,得:,可将 X1,X2,X3 ,X4,X5 各自成一类, 共
7、分成五类:X = X1 X2 X3 X4 X5 ,9, 取 0.2 0.8 ,得:,按该水平, r12= r21= r13= r31= r15= r51= r23= r32= r25= r52= r35=r53=1, 可将 X1,X2,X3,X5 归为一类,其余元素各自成一类, 共分成二类:X = X1,X2 ,X3,X5 X4 , 取 0 0.2 ,得:,按该水平, 可将 X1,X2,X3 ,X4,X5 归为一类,共分成一类:X = X1,X2,X3 ,X4,X5 ,模糊聚类过程是一个动态过程,随水平由小到大,集合 X 的分类越来越细。,10,方法(二):编网分类, 取 0.85 0.9 ,
8、得:,按该水平,可将 X3,X5 归为一类,其余元素各自成一类,共分成四类:X = X1 X2 X3 ,X5 X4 , 取 0.9 1 ,得:,按该水平,可将 X1,X2,X3 ,X4,X5 各自成一类各自成一类,共分成五类:X = X1 X2 X3 X4 X5 ,11, 取 0.8 0.85 ,得:,按该水平,可将 X2,X3,X5 归为一类,其余元素各自成一类,共分成三类:X = X1 X2 ,X3,X5 X4 , 取 0.2 0.8 ,得:,按该水平,可将 X1,X2,X3,X5 归为一类,其余元素各自成一类,共分成二类:X = X1,X2 ,X3,X5 X4 ,12, 取 0 0.2
9、,得:,按该水平,可将 X1,X2,X3 ,X4,X5 归为一类,共分成一类:X = X1,X2,X3 ,X4,X5 ,13,例6-3 设论域 X = 销售额,购销费用,零售利润 = X1,X2,X3 , 且 X1,X2,X3 相互影响的模糊矩阵为,易证 R 是 X 上的模糊等价矩阵,因此可从 R 出发对 X 中的元素进行模糊聚类。, 取 0.6 1 ,得:,可知 X = X1 X2 X3 在该水平上分类时,不十分注重商品销售额、购销费用、 零售利润之间的相互影响关系,而是各自独立研究他们。, 取 0.4 0.6 ,得:,可知 X = X1, X3 X2 在该水平上分类时,比较注重商品销售额和
10、零售利润之 间的相互影响关系,而不大注重他们和购销费用间的关系。, 取 0 0.4 ,得:,可知 X = X1, X2, X3 在该水平上分类时,对三者的相互关系之间都比较注重。,14,6.4 模糊相似关系(矩阵)与聚类分析一、原理经标定得的模糊关系(矩阵) R 不是模糊等价关系(矩阵),它只具备自反性和对称性,不具备传递性,即 R 只是模糊相似关系(矩阵)。要利用 R 对 X 中的元素进行聚类,须将 R 改造成模糊等价关系(矩阵)。二、定理设 R 是模糊相似矩阵,进行如下复合运算:R R2 = RR R4 = R2R2 R2k = RkRk 若存在正整数 k,使得: R2k = Rk,则 R
11、2k 是模糊等价矩阵,这样: 可通过 R2k 对 X 上的元素进行聚类。,例6-4 对以下五种物质进行模糊聚类,设论域 X = 白色乒乓球 X1,面包 X2,黄色排球 X3 ,白犁 X4,黄橙 X5 ,用评定打分法标定 X 上的模糊关系矩阵为:,显然 R 具备自反性和对称性,,15,因此 R 不具备传递性,即 R 只是模糊相似矩阵,不能直接利用 R 对 X 中的元素进行聚类,须对 R 进行改造,改造成模糊等价矩阵,再利用改造后的模糊等价矩阵,对 X 中的元素进行聚类:,16,由定理知 R16 是模糊等价矩阵,利用 R16 对 X 中的元素进行聚类,用编网法:,17, 取 0.8 0.9 ,得:,X = X1, X3 X2 X4 X5 , 取 0.9 1 ,得:,X = X1 X2 X3 X4 X5 ,18, 取 0.7 0.8 ,得:,X = X1 ,X3 X2,X5 X4 , 取 0.6 0.7 ,得:,X = X1 ,X3 X2,X4 ,X5 , 取 0 0.6 ,得:,X = X1 ,X2,X3,X4 ,X5 ,19,习 题 六一、标定 X = ( X1,X2,X3,X4,X5 )上的模糊相似矩阵为,试对其进行模糊聚类?,