收藏 分享(赏)

聚类分析 熵方法加权 方差越大,权重越大.doc

上传人:11xg27ws 文档编号:6963587 上传时间:2019-04-28 格式:DOC 页数:4 大小:173.50KB
下载 相关 举报
聚类分析 熵方法加权 方差越大,权重越大.doc_第1页
第1页 / 共4页
聚类分析 熵方法加权 方差越大,权重越大.doc_第2页
第2页 / 共4页
聚类分析 熵方法加权 方差越大,权重越大.doc_第3页
第3页 / 共4页
聚类分析 熵方法加权 方差越大,权重越大.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

1、数学模型作业:聚 类 分 析1一、 李 郭 0809501024 应数 081二、 实验目的:学习利用距离函数建模的方法,掌握客观性权重的变异系数以及综合评价的基本方法,熟练掌握 MATLAB 处理矩阵的各种方法。三、 实验内容及要求:问题:近年来我国淡水水质富营养化的污染日趋严重,如何对湖泊水质的富营养化进行综合评价是摆在我们面前的一项重要任务。表 1 和表 2 分别是我国 5 个湖泊实测数据和水质评价标准。 表 3.4 全国 5 个主要湖泊品和技术参数的实测数据总磷(mg/L)耗氧量(mg/L)透明度(m)总氮(mg/L)杭州西湖 130 10.30 0.35 2.76武汉东湖 105 1

2、0.70 0.40 2.0青海湖 20 1.4 4.5 0.22巢湖 30 6.26 0.25 1.67滇池 20 10.13 0.50 0.23表 3.5 湖泊水质评价标准评价指标 极贫营养 贫营养 中营养 富营养 极富营养总磷 660耗氧量 27.1透明度 37 12 2.4 0.55 4.6A. 是利用以上数据,分析总磷,耗氧量,透明度和总氮这 4 种指标对湖泊水质富营养化所起作用。B. 对上述 5 个湖泊的水质进行综合评估,确定水质等级。四、 问题的分析在进行综合评价之前,首先要对评价的指标进行分析。通常评价指标分为效益型,成本型和固定型指标(另外还有区间型指标,偏离型指标等等) 。在

3、进行综合评定之前首先对各评定指标同一属性。由生物学知识可知,本题除了透明度指标为成本型指标以外,其余指标都为效益型指标。在指标清楚之后,我们还要进行赋权和标准化。在初次建立模型的时候我们选择了:变异系数赋权法和线性比例变换法的标准化方法五、 模型的建立 根据表 3.4 和表 3.5,我们得到实测数据矩阵 X=( ) 和等级标准矩阵 Y=( )ijx4*5kty5*423.051.206763475X 60.42.1306.2737891Y 建立无量纲化实测数据矩阵:A=( )和无量纲化等级标准矩阵 B=( ) 。ijaktb指 标湖泊数学模型作业:聚 类 分 析2其中我们用线性比例变换的标准化

4、方法得到:3/minaxjijjij 3/minaxkybtkttkt利用 MATLAB 计算得B=083.5.9467.01538. 1297246A 0.1269.074.13 382.65 计算评价指标的权重 首先计算矩阵 B 的各行向量的均值与标准差 ,51jijib )4,321(4)(51ibsjiiji 然后计算变异系数 (i=1,2,3,4)iisw/利用 MATLAB 计算得:W=0.2767 0.2444 0.2347 0.2442W 表示个指标的权重。根据权重的大小,即可说明总磷,耗氧量,透明度和总氮 4 种指标对湖泊水质富营养化所起作用。由上可知个指标的作用很接近,比较

5、而言总磷所起作用最大,耗氧量,总氮次之,透明度的额作用最小。 建立个湖泊水质的综合评价模型,利用欧氏距离和绝对值距离进行建模计算 A 中各行向量到 B 中各列向量的欧氏距离 412)(kkjiij bad若 ,则第 i 个湖泊属于第 k 级(i=1,2,3,4,5) 。min51ijjikd计算 A 中各行向量到 B 中各列向量的绝对值距离 41|kkjiijbaD若 ,则第 i 个湖泊属于第 k 级(i=1,2,3,4,5) 。in51ijjijD计算结果如下表所示:表 3.6 欧氏距离判别表1d1213d1415d级别杭州西湖 1.8473 1.8312 1.7374 1.3768 0.2

6、881 5武汉东湖 1.5960 1.5798 1.4859 1.1271 0.5034 5青海湖 0.2185 0.2044 0.1367 0.3383 1.7918 3果湖 1.3201 1.3037 1.2083 0.8392 0.9591 4滇池 1.0793 1.0649 0.9867 0.7328 1.3451 4距 离湖 泊数学模型作业:聚 类 分 析3表 3.7 绝对值距离判别表1d1213d1415d级别杭州西湖 3.6632 3.6303 3.4375 2.6782 0.3231 5武汉东湖 3.1436 3.1107 2.9179 2.1586 0.8427 5青海湖 0

7、.4062 0.3733 0.2109 0.5788 3.5801 3果湖 2.4072 2.3743 2.1815 1.4222 1.5791 4滇池 1.6701 1.6372 1.4444 1.0661 2.3162 4从上面的计算可知,尽管欧氏距离与绝对值距离意义不同,但是对个湖泊水质的富营养化评价等级是一样的,表明我们给出的方法具有稳定性。六、 附录:用 MATLAB 编程X=130 10.3 0.35 2.76;105 10.7 0.4 2.0;20 1.4 4.5 0.22;30 6.26 0.25 1.67;20 10.13 0.5 0.23;%输入实测数据矩阵A1=X(:,1

8、)./max(X(:,1);A2=X(:,2)./ max(X(:,2);A3= min(X(:,3)./X(:,3);A4=X(:,4)./ max(X(:,4);A=A1,A2,A3,A4;%输出用线性比例变换的标准化的实测矩阵Y=1 4 23 110 660;0.09 0.36 1.8 7.10 27.1;37 12 2.4 0.55 0.17;0.02 0.06 0.31 1.20 4.60;%输入等级标准矩阵B1=Y(1,:)./ max(Y(1,:);B2=Y(2,:)./ max(Y(2,:);B3= min(Y(3,:)./Y(3,:);B4=Y(4,:)./ max(Y(4,

9、:);B=B1;B2;B3;B4;%输出用线性比例变换的标准化的等级标准矩阵b=B;t=std(b)./mean(b);w=t/sum(t)%计算等级标准矩阵各指标的变异系数 ,并赋权重t=dist(A,B)%计算 A 中各行向量到 B 中各列向量的欧氏距离mandist(A,B)%计算 A 中各行向量到 B 中各列向量的绝对值距离七、 模型的优化: 一.赋权法:熵值法熵值法主要是依据各指标值所包含的信息量的大小,利用指标的熵值来确定指标权重的。熵值法的一般步骤为: (1)对实测矩阵 X=( ) 和等级标准矩阵 Y=( ) 作标准化处理,并对等级标ijx4*5kty5*4准化矩阵进行行归一化处

10、理 )1,(1 njmipmiijij 结果为: 7431.09.051.97.032. 5268451.pij (2)计算第 个指标的熵值: 。其中 。j )(ln1jpkeijmijj 0,jek距 离湖 泊数学模型作业:聚 类 分 析4结果为: 7521.089.74.0563.je (3)、计算第 个指标的差异系数。对于第 个指标,指标值的差异越大,对方案评价的j作用越大,熵值越小,反之,差异越小,对方案评价的作用越小,熵值就越大。因此,定义差异系数为: 。)1(njegjj 结果为: 2479.0.25.0437.j (4)、确定指标权重。第 个指标的权重 。j )1(njgwnjj

11、j 结果为: , 表示每个指标的权重。根据权重的大2169.083.205.3786.jwj小,即可说明总磷,耗氧量,透明度和总氮 4 种指标对湖泊水质富营养化所起作用。由上可知个指标的作用很接近,比较而言总磷所起作用最大,耗氧量,总氮次之,透明度的额作用最小。其权重的顺序和上面模型一样,只是每个指标的权重略有差别。 二.用马氏距离求解:测定湖泊水质的等级(有点不懂,不懂意思)八、 附录:用 MATLAB 编程X=130 10.3 0.35 2.76;105 10.7 0.4 2.0;20 1.4 4.5 0.22;30 6.26 0.25 1.67;20 10.13 0.5 0.23;%输入

12、实测数据矩阵A1=X(:,1)./max(X(:,1);A2=X(:,2)./ max(X(:,2);A3= min(X(:,3)./X(:,3);A4=X(:,4)./ max(X(:,4);A=A1,A2,A3,A4;%输出用线性比例变换的标准化的实测矩阵Y=1 4 23 110 660;0.09 0.36 1.8 7.10 27.1;37 12 2.4 0.55 0.17;0.02 0.06 0.31 1.20 4.60;%输入等级标准矩阵B1=Y(1,:)./ max(Y(1,:);B2=Y(2,:)./ max(Y(2,:);B3= min(Y(3,:)./Y(3,:);B4=Y(4

13、,:)./ max(Y(4,:);B=B1;B2;B3;B4;%输出用线性比例变换的标准化的等级标准矩阵p1=(B(1,:)./(sum(B(1,:);p2=(B(2,:)./(sum(B(2,:);p3=(B(3,:)./(sum(B(3,:);p4=(B(4,:)./(sum(B(4,:);p=p1;p2;p3;p4;%对标准化等级标准矩阵进行行归一化处理E1=-sum(p(1,:).*log(p(1,:);E2=-sum(p(2,:).*log(p(2,:);E3=-sum(p(3,:).*log(p(3,:);E4=-sum(p(4,:).*log(p(4,:);E=E1,E2,E3,E4;%计算每个指标的熵值g=1-E;%计算每个指标的差异系数,指标值的差异越大,对方案评价的作用越大,熵值越小,%反之,差异越小,对方案评价的作用越小,熵值就越大w=g./norm(g,1)%计算等级标准矩阵的权重

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报