1、数据标准化方法问题 1:将一个人的体重和身高相加在一起有无什么意义?答:量纲(就是单位)不同的量相加是没有意义的。不加处理就将两个不同量纲的量相加这是数学建模的大忌!问题 2:如何将一个人的体重 G 和身高 H 这两个指标综合为一个指标用以评价一个人身材?答:通常考虑加法模型和乘法模型。乘法模型在这里不太适合,故考虑加法模型,一般采用加权组合的方式,即 ,这里 ,但是这样就犯了一个严重的12Pw12w错误。因此需要先对 进行预处理无量纲化,也就是数据标准化方法。,GH数据标准化方法主要有以下三种:(1)规范化方法对序列 进行变换:12,.nx1minaxijji jjjy则新序列 且无量纲。一
2、般的数据需要时都可以考虑先进行规范化12,.0,ny处理。(2)正规化方法对序列 进行变换:12,.nx,这里 ,iixys1nix21()niisx则新序列 的均值为 0,而方差为 1,且无量纲。12,.n(3)归一化方法对正项序列 进行变换:12,.nx1iinixy则新序列 且无量纲,并且显然有 。12,.0,1ny1niy归一化方法在确定权重时经常用到。针对实际情况,也可能有其他一些量化方法,或者要综合使用多种方法,总之最后的结果都是无量纲化。例 1:DVD 分发问题中满意度的量化现有 20 种 DVD 要分发给 100 个会员,规定如果要向某人发放 DVD,则一次发给 3 张,问如何
3、对这些 DVD 进行分配,才能使会员获得最大的满意度?DVD 编号 D001 D002 D003 D004 D005 D006 DVD 现有数量 8 1 22 10 8 40 C0001 0 0 2 0 0 0 C0002 1 0 9 0 0 7 C0003 0 6 0 0 0 7 C0004 0 0 0 0 4 0 C0005 5 0 0 0 0 4 会员偏好注:表中的数字越小表示会员的偏爱程度越高,数字 0 表示对应的 DVD 当前不在会员的订单中。解:我们考虑三种方法进行变换,然后对它们进行比较。(1) 利用公式 10/)()1xf(2) 利用公式 2(3) 利用模糊数学中的隶属函数的概
4、念,选取合适的函数,对满意度进行量化,这里 为待定常数10,)1ln()(3 xbaxf ba,令 代入可得 。05.,1)(3f a, 10,5.)l(428)(3 xf三种量化方法的比较:结论:方法 1 可行;方法 2 不太可取;方法 3 可行。注意:无论采用哪一种方法,对每一个会员的满度度均需要作归一化处理,使得每一个会员对选中的 DVD 的满意度之和等于 1, (算出的每人的满意度或综合满意度都应该介于 0-1 之间) 。例 2:长江水质的定量综合评价(2005 年赛题)下表是地表水环境质量标准 ,给出了水质类别的分类标准。序号分 类标准值 项 目类 类 类 类 类 劣类1 溶解氧(D
5、O) 7.5(或饱和率 90%) 6 5 3 2 02 高锰酸盐指数(CODMn) 2 4 6 10 15 3 氨氮(NH3-N 0.15 0.5 1.0 1.5 2.0 4 PH 值(无量纲) 6-9下表给出了 17 个观测点的水质情况。 主要监测项目( 单位 :mg/L) 水质类别序号 点位名称 断面情况pH* DO CODMn NH3-N 本月1 四川攀枝花 干流 7.6 6.8 0.2 0.1 II 2 重庆朱沱 干流(川-渝省界) 7.63 8.41 2.8 0.34 II 3 湖北宜昌南津关 干流(三峡水库出口)7.07 7.81 5.8 0.55 III 4 湖南岳阳城陵矶 干流
6、 7.58 6.47 2.9 0.34 II 5 江西九江河西水厂 干流(鄂-赣省界) 7.34 6.19 1.7 0.13 II 6 安徽安庆皖河口 干流 7.52 6.54 3.2 0.22 II 7 江苏南京林山 干流(皖-苏省界) 7.78 6.9 3.1 0.11 II 8 四川乐山岷江大桥 岷江(与大渡河汇合前) 7.66 4.2 5.8 0.53 IV 9 四川宜宾凉姜沟 岷江(入长江前) 8.01 7.63 2.4 0.25 II 10 四川泸州沱江二桥 沱江(入长江前) 7.63 4.02 3.6 1.06 IV 11 湖北丹江口胡家岭 丹江口水库(库体) 8.63 10.2
7、 1.8 0.1 I 12 湖南长沙新港 湘江(洞庭湖入口) 7.42 6.45 4.3 0.99 III 13 湖南岳阳岳阳楼 洞庭湖出口 7.73 6.26 1.4 0.21 II 14 湖北武汉宗关 汉江(入长江前) 8 6.43 2.4 0.17 II 15 江西南昌滁槎 赣江(鄱阳湖入口) 6.64 5.18 1.1 0.92 III 16 江西九江蛤蟆石 鄱阳湖出口 7.28 6.87 2.7 0.15 II 17 江苏扬州三江营 夹江(南水北调取水口) 7.29 6.9 1.6 0.15 II 分析水质的类别的确定可知:它是由首要污染物决定的。请根据以上数据对长江当前的水质情况做
8、出定量的综合评价。解:1、数据的标准化处理溶解氧是极大型指标(指标越大,水质越好) ,PH 值是居中型指标,其余两种是极小型指标,统一进行极小型处理。(1)溶解氧: (共有 17 个观测点)*1,2,.17iiP(2)PH 值: *4,.ii然后对 进行规范化处理,即:*1234,iiiimin,12,.71,234axijijiiPj得到规范化矩阵 ,这里 且无量纲。174()ijX0,ij2、确定四种指标的权重(变权函数的确定)原则是能有效的区分六类水。权重矩阵 174()ijWw3、综合评价指标 41,2,.iijjMx4、评价结果对比与排序5、本问评分情况标准化公式 4 分;变权函数的确定 4 分;评价综合指标 4 分;评价结果与排序 8 分;共20 分。