1、第一章 多元正态分布的参数估计一、填空题1.设 、 为两个随机向量,对一切的 、 ,有 ,则称XYuv与 相互独立。2.多 元 分 析 处 理 的 数 据 一 般 都 属 于 数 据 。3多元正态向量 的协方差阵 是 ,则 X 的各分量是相互独立pX,1 的随机变量。4一个 元函数 能作为 中某个随机向量的密度函数的主要条件是 pxf,2 pR和 。5若 个随机变量 , , , 的联合分布等于 ,则称1 p, , , 是相互独立的。1X2 pX6.多元正态分布的任何边缘分布为 。7.若 , 为 阶常数阵, 为 维常数向量,则 。,NAsdsdAX8.多元正态向量 的任何一个分量子集的分布称为
2、的 。X9.多元样本中,不同样品的观测值之间一定是 。10.多元正态总体均值向量和协差阵的极大似然估计量分别是 。11.多元正态总体均值向量 和协差阵 的估计量 、 具有 、 Sn1和 。12设 和 分别是多元正态总体 的样本均值向量和离差阵,则XS,pN, 和 。13.若 , 且相互独立,则样本离差阵,pNn,21。nX114若 , ,且相互独立,则 ,ipiWSk, 21kSS。二、判断题 1.多元分布函数 是单调不减函数,而且是右连续的。xF2.设 是 维随机向量,则 服从多元正态分布的充要条件是:它的任何组合XX都是一元正态分布。 pR3. 是一个 P 维的均值向量,当 A、B 为常数
3、矩阵时,具有如下性质:(1)E(AX)=AE(X) (2)E(AXB)=AE(X)B 4若 P 个随机变量 X1,X P 的联合分布等于各自边缘分布的乘积,则称 X1,XP 是相互独立的。5一般情况下,对任何随机向量 ,协差阵 是对称阵,也p,1 是正定阵。 6多元正态向量 的任意线性变换仍然服从多元正态分布。p,17多元正态分布的任何边缘分布为正态分布,反之一样。8多元样本中,不同样品之间的观测值一定是相互独立的。9多元正态总体参数均值 的估计量 具有无偏性、有效性和一致性。X10 是 的无偏估计。Sn111.Wishart 分布是 分布在 维正态情况下的推广。2p12若 , ,且相互独立,
4、则样本离差阵,pNXn,11 WXSn p13若 , 为奇异矩阵,则,pCcnCXp,三、简答题1.多元正态分布有哪些基本性质?2.均值向量和协差阵的最大似然估计量有哪些优良性质?3.维希特分布有哪些基本性质?4.试述多元联合分布和边缘分布之间在关系。四、证明题1.样本均值向量和离差阵也可以用样本资料 直接表示如下:X,nX1nIS1其中: ,,n 0I试分别给以证明。五、计算题1.已知随机向量 的联合分布密度函数为21,X 22121, cbacxaxxcdxf 其中, , .求:ba2(1)随机变量 和 各自的边缘密度函数、均值与方差;1(2)随机变量 和 的协方差和相关系数;X(3)判断
5、 和 是否相互独立。2第二章 多元正态分布均值向量和协差阵的检验一、填空题1.在一个正态总体均值向量的假设检验中,在 已知的情况下,构造的检验统计量为 ,服从 分布;在 未知的情况下,构造的检验统计量为 ,服从 分布。2.若 , ,且 与 相互独立,令 ,则,0pNX,nWSpXSXSnT12。12Tn3.在两个正态总体均值向量的假设检验中,假定其协差阵 相等,则在 已知的情况下,构造的统计量为 ,服从的分布为 ;在 未知的情况下,构造的检验统计量为 ,服从的分布为 。二、判断题1设 , , ,则称统计量 的分布为,pNX,nWSppXSnT12非中心 分布,记为 。2HotelingT,2T
6、2在协差阵 未知的情况下对均值向量进行检验,需要用样本协差阵 去代替 。Sn13. 分布是一元统计分布中 t 分布的推广。2HotelingT三、简答题1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。2试述多元统计分析中 分布和一元统计中 t 分布的关系。2HotelingT第三章 主成分分析一、填空题1主成分分析就是设法将原来众多 具有一定相关性的指标,重新组合成一组新的 相互无关 的综合指标来代替原来指标。2主成分分析的数学模型可简写为 ,该模型的系数要求 在诸主成分 Yi(i=1,2,m)上的载荷 aij(i=1,2,m;j=1,2,p) 。3主成分分析中,利用 方差 的
7、大小来寻找主成分。4第 k 个主成分 的贡献率为 ,前 k 个主成分的累积贡献率为 kypiik1。piikii15确定主成分个数时,累积贡献率一般应达到 85-95 ,在 spss 中,系统默认为 取特征根大于 1 的个数 。6主成分的协方差矩阵为_矩阵。7原始变量协方差矩阵的特征根的统计含义是_。8原始数据经过标准化处理,转化为均值为_ _,方差为_ _的标准值,且其_矩阵与相关系数矩阵相等。9在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为_。10SPSS 中主成分分析采用_命令过程。二、判断题1主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综
8、合指标来代替原来指标。 ( )2主成分 y 的协差阵为对角矩阵。 ( )3. 的主成分就是以 的特征向量为系数的一个组合,它们互不相关,其方差px,21 为 的特征根。 ( )4原始变量 的信息提取率 表示这 m 个主成分所能够解释第 i 个原始变量变动的程ixiV度。 ( )5在 spss 中,可以直接进行主成分分析。 ( )6主成分分析可用于筛选回归变量。 ( )7SPSS 中选取主成分的方法有两个:一种是根据特征根1 来选取; 另一种是按照累积贡献率85%来选取。 ( )8主成分方差的大小说明了该综合指标反映 p 个原始观测变量综合变动程度的能力的大小。( )9主成分表达式的系数向量是协
9、方差矩阵 的特征向量。 ( ) 10主成分 与原始变量 的相关系数 反映了第 k 个公共因子对第 i 个原始变kyixikxy,量的解释程度。 ( )三、简答题1简述主成分的概念及几何意义。2主成分分析的基本思想是什么?3.简述主成分分析的计算步骤。4主成分有哪些性质?5主成分主要应用在哪些方面?四、计算题1假设 3 个变量 、 和 的协方差矩阵为:1x2305要求用此协差阵和相应的相关阵对这 3 个变量进行主成分分析,根据计算结果说明应选取多少个主成分以代表原来的 3 个变量,并说明理由。2在一项研究中,测量了 376 只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1 Y2 Y3
10、Y4 Y5 Y6头长 x1头宽 x2肱骨 x3尺骨 x4股骨 x5胫骨 x60.350.330.440.440.430.440.530.700.190.250.280.220.76-0.64-0.05-0.02-0.06-0.05-0.050.000.530.480.510.48-0.040.000.190.150.670.700.000.040.590.630.480.15特征值 4.57 0.71 0.41 0.17 0.08 0.06(1)解释 6 个主成分的实际意义。(2)计算前三个主成分各自的贡献率和累积贡献率。(3)对于 y4,y5,y6 的方差很小这一点,你怎样对实际情况作出推断
11、。3假设某商场棉鞋 、凉鞋 、布鞋 三种商品销售量的协方差矩阵如下:1x23x05试求各主成分,并对各主成分的贡献率和各个原始观测变量的信息提取率进行讨论。4对某市 15 个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取 7 个指标作分析,即固定资产产值率(X1),固定资产利税率(X2) ,资金利润率(X3),资金利税率(X4) ,流动资金周转天数 (X5),销售收入利税率 (X6)和全员劳动生产率(X7)。数据资料如下: 企业及编号固定资产产值率 X1固定资产利税率(X2)资金利润率(X3)资金利税率(X4)流动资金周转天数(X5)销售收入利税率(X6)全员劳动生产率(
12、X7)康佳电子1茂名石化2华空空调3三星集团4数源科技5中华电子6南方制药7中国长城8白云制药9五羊自行1053. 2559.8246.7834.3975.3266.4668.1856.1359.2552.4755.7661.1950.4167.9551.0716.6819.7015.207.2929.4532.9325.3915.0519.8221.1316.7515.8316.5322.2412.9218.419.216.244.7643.6833.8727.5614.2120.1726.5219.2317.4320.6337.0012.5426.7527.5623.408.9756.49
13、42.7837.8519.4928.7835.2028.7228.0329.7354.5920.8255556562695063767162586169636631.8432.9432.9821.3040.7447.9833.7627.2133.4139.4129.6226.4032.4931.0525.121.752.871.531.632.142.602.431.751.831.731.521.601.311.571.83广发卷烟11岭南通信12华南冰箱13潮州二轻14稀土高科15根据下面 SPSS 软件的输出信息,回答:(1)这个数据的 7 个变量可以用几个综合变量(主成分)来表示?(2
14、)这几个综合变量(主成分)包含有多少原来的信息?(3)写出这几个综合变量(主成分)的模型。(4)构造综合评价函数为。Total Variance ExplainedInitial Eigenvalues Extraction Sums of Squared LoadingsComponent Total% of Variance Cumulative % Total% of Variance Cumulative %1 4.635 66.219 66.219 4.635 66.219 66.2192 1.285 18.358 84.577 1.285 18.358 84.5773 .587 8
15、.389 92.966 4 .390 5.576 98.542 5 .087 1.243 99.785 6 .013 .182 99.967 7 .002 .033 100.000 Extraction Method: Principal Component Analysis.Component Matrix(a)Component1 2固定资产率 .888 .213固定资产利税率 .984 -.028资金利润率 .943 .272资金利税率 .909 .315流动资金周转天数 -.284 .833销售收入利税率 .860 -.139全员劳动生产率 .585 -.594Extraction M
16、ethod: Principal Component Analysis.a 2 components extracted.(1)这个数据的 7 个变量可以用二个综合变量来表示(2) 前二个成分特征值对应的方差累计占了总方差的 84.577%,它们已经代表了原来7 个变量绝大部分的信息 。(3)由 Component1、2 的系数除以 635.4、 28.1,得到: 7653.4/8.06534/90/98.0653.4/8.0211 xxxxY 7.2 (4)利用选取得二个主成分,以各主成分的方差贡献率作为权数,构造综合评价函数为: 21%358.9.6YYF五、证明题主成分有三个重要性质:
17、的协差阵为对角阵 ;F ;11ppii ;,kikiuFX试分别加以证明。第四章 因子分析一、填空题1.因子分析常用的两种类型为 和 。2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_与_之间的相互关系。3因子分析就是通过寻找众多变量的 来简化变量中存在的复杂关系的一种方法。4因子分析是把每个原始变量分解成两个部分即 、 。5变量共同度是指因子载荷矩阵中_。6公共因子方差与特殊因子方差之和为_。7求解因子载荷矩阵常用的方法有 和 。8常用的因子旋转方法有 和 。9Spss 中因子分析采用 命令过程。10变量 的方差由两部分组成,一部分为 ,另一部分为 。iX二
18、、判断题1在因子分析中,因子载荷阵不是唯一的。 ( )2因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。 ( )3因子分析和主成分分析的核心思想都是降维。 ( )4因子分析有两大类,R 型因子分析和 Q 型因子分析;其中 R 型因子分析是从变量的相似矩阵出发,而 Q 型因子分析是从样品的相关矩阵出发。 ( )5特殊因子与公共因子之间是相互独立的。 ( )6变量共同度是因子载荷矩阵列元素的平方和。 ( )7公共因子的方差贡献是衡量公共因子相对重要性指标。 ( )8对因子载荷阵进行旋转的目的是使结构简化。 ( )三、简答题$ 1 因子分析的基本思想是什么,它与主成分分析有什
19、么区别和联系? $ 2因子模型的矩阵形式 ,其中:UFuijmpPmF,11 请解释式中 F、 、U 的统计意义。Fl,F 2,F m叫做公共因子,它们是在各个变量中共同出现的因子。 i(i=1,2,p)表示影响 Xi 的独特因子。u ij做因子载荷,它是第 i 个变量在第 j个主因子上的负荷,或者叫做第 i 个变量在第 j 个主因子上的权,它反映了第 i 个变量在第 j 主因子上的相对重要性。 i为独特因子的载荷。因子分析的基本问题就是要确定因子载荷。$ 3因子旋转的意义何在?如何进行最大方差因子旋转?因子旋转的目的是通过改变坐标轴的位置,重新分配各个因子所解释的方差的比例,使因子结构更简单
20、,更易于解释,以期找到意义更为明确,实际意义更明显的公因子。对公共因子作正交旋转就是对载荷矩阵 U 作一正交变换,右乘正交矩阵 T,使得UT 有更明显的实际意义。旋转以后的公共因子向量为 ,它的各个分量FT*也是互不相关的因子。根据正交矩阵 T 的不同选取方式,将构造不同的正交*2*1,mF旋转的方法。4因子分析主要应用在哪几个方面?四、计算题$ 4假设某地固定资产投资率 , 通货膨胀率 和失业率 的约相关矩阵为:1x2x35251*R并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为:93.01657.0.369.01872 2123要求求解因子分析模型,计算各变量的共同度和
21、各公共因子的方差贡献并解释它们的统计意义。解:由题中数据可得因子载荷矩阵为:07.628.5.3. 087.9123.6.07.9121U 因子分析模型为: (3 分) 121150Fx23307.68. 变量的共同度为: (4 分)2.076.124.05.2.21 jjuh439.7.68.022 jj.06.4.022133jjuh它分别反映了公因子对 的影响作用大小。ix 公共因子的方差贡献为:(5 分)912.034.9.0124. 68.5223iuS8.676. 7.223 i它分别反映了第 个公因子 对 的各个分量 的方差贡献之和。jjyXix2设变量 x1,x2和 x3已标准
22、化,其样本相关系数矩阵为: 5.046.R(1)对变量进行因子分析。(2)取 q=2 进行正交因子旋转。3已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题: (1)什么是方差贡献率? 计算方差贡献率的目的何在? (2) 如何利用因子分析结果进行综合评价? 结合本例写出计算综合评价结果的公式。(非原题 )表 1 表 2 表 3 表 4 表 5(1)13 个指标可以用三个公因子来表示。而且前 3 个因子的累积方差贡献率为84.916%,应该选取前 4 个公因子。第一个公因子在指标 X1、X2、X3 上有较大载荷
23、,说明这 3 个指标有较强的相关性,可以归为一类;第二个公因子在指标 X4、X5 上有较大载荷,同样可以归为一类;同理,第三个公因子在指标 X6、X7 上有较大载荷,可以归为一类.(2)根据旋转前的因子载荷阵,写出每个原始变量的因子表达式: X1=0.921F1-0.171F2+0.117F3+1X2=0.787F1+0.462F2+0.307F3+2X7-8.26E-02F1+0.782F2+0.444F3+7(3)旋转后的因子得分函数 F1=0.480X1+0.351X2-0.032X3-0215X4+0.315X5-0.018X6+0.137X7F2=-0.272X1+0.140X2+0
24、.212X3+0.508X4+0.043X5+0.407X6+0.031X7F3=-0.087X1-0.290X2+0.553X3+0.082X4+0.052X5+0.143X6-0.572X7五、操作题110 名初中男生身高、胸围、体重的数据资料如下:身高x1(cm)胸围x2(cm)体重x3(kg)149.5162.5162.7162.2156.5156.169.577.078.587.574.574.538.555.550.865.549.045.5172.0173.2159.5157.776.581.574.579.051.059.543.553.5(1)利用因子法、方差最大旋转法计算因
25、子载荷阵 A(2)分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原始信息的大部分,为什么?(3)写出方差最大正交旋转因子模型,并分析各因子的实际含义(4)计算各个样本点的因子得分2对某市 15 个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取 7 个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。数据资料如下:企业及编号固定资产率 X1固定资产利税率(X2)资金利润率(X3)资金利税率(X4)流动资金周转天数(X5)销售收入利税率
26、(X6)全员劳动生产率(X7)康佳电子 1茂名石化 2华空空调 3三星集团 4数源科技 5中华电子 6南方制药 7中国长城 8白云制药 9五羊自行10广发卷烟11岭南通信12华南冰箱13潮州二轻14稀土高科15532559.8246.7834.3975.3266.4668.1856.1359.2552.4755.7661.1950.4167.9551.0716.6819.7015.207.2929.4532.9325.3915.0519.8221.1316.7515.8316,5322.2412.9218.419.216.244.7643.6833.8727.5614.2120.1726.52
27、19.2317.4320.6337.0012.5426.7527.5623.408.9756.4942.7837.8519.4928.7835.2028.7228.0329.7354.5920.8255556562695063767162586169636631.8432.9432.9821.3040.7447.9833.7627.2133.4139.4129.6226.4032.4931.0525.121.752.871.531.632.142.602.431.751.831.731.521.601.311.571.第一、对数据资料进行主成分分析:(1)前两个最大特征根为_、_,其对应的特征
28、向量为_,_。(2)第一主成分的表达式为_ _,该主成分包含了原始信息的_%,第二主成分的表达式为_,该主成分的方差贡献率为_。(3)如果舍弃第二主成分,则哪个原始变量的损失信息最大:_(4)第一个主成分与第二个变量间的相关系数为_(5)第一个主成分主要反映盈利能力,现对第一主成分计算得分为_,对得分进行排序(降序),各企业的得分排名顺序依次为:_(依企业顺序写出排名)。若利用第一、二主成分构造综合评价函数,则两主成分的权数分别为_、_。第二、对原数据资料进行因子分析:(6)利用主成分法求解因子载荷,现提取两个因子进行分析,因子模型表示为:(7)前三个变量(X1,X2,X3)的公共因子方差为_
29、、_、_,特殊因子方差为_、_、_。(8)对以上模型进行方差最大正交旋转,得出旋转后的因子载荷矩阵为:第五章 聚类分析一、填空题1.在进行聚类分析时,根据变量取值的不同,变量特性的测量尺度有以下三种类型: 、 和 。2Q 型聚类法是按_进行聚类,R 型聚类法是按_进行聚类。3Q 型聚类统计量是_,而 R 型聚类统计量通常采用_。4在聚类分析中,为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对原始数据进行变换处理。常用的变换方法有以下几种:_、_、_ _、_ _。5距离 一般应满足以下四个条件: 、 、ijd、 。6.相似系数一般应满足的条件为: 、 和。7.常用的相似系数有
30、和 两种。8.常用的系统聚类方法主要有以下八种: 、 、 、 、 、 、 。9快速聚类在 SPSS 中由_过程实现。10.常用的明氏距离公式为: ,当 时,它表示 qpkjkiij xqd11;当 时,它表示 ;当 趋于无穷时,它表示 。2q11聚类分析是将一批 或 ,按照它们在性质上 的 进行分类。二、判断题1.在对数据行进中心化变换之后,数据的均值为 0,而协差阵不变,且变换后后的数据与变量的量纲无关。 ( )2根据分类的原理,我们可以把聚类分为样品聚类和变量聚类。 ( )3兰氏距离不仅克服了明氏距离与各指标的量纲有关的缺点,而且也考虑了变量间的相关性。 ( ) 4.当各变量之间相互独立时
31、,马氏距离就退化为欧氏距离。 ( )5在几种系统聚类法中,最短(长)距离法、 (可边)类平均法、重心法和离差平方和法都具有单调性,只有中间距离法不具有单调性。 ( )6.重心法比离差平方和法使空间扩张。 ( )7.离差平方和法的思想来源于方差分析.如果类分得比较合理,同类样品之间的离差平方和应当较大,类与类之间的离差平方和应当较小. ( )8.使用离差平方和法时,计算样品间的距离必须采用欧氏距离. ( )9.快速聚类法又称为动态聚类法,是一种非谱系聚类法,它可以应用于比系统聚类法大得多的数据组. ( )三、简答题1简述聚类分析的基本思想和基本步骤?2.系统聚类法的基本思想是什么?3.系统聚类法
32、的基本步骤是什么?4简述最长聚类法的聚类步骤。5.简述快速聚类的基本思想及主要步骤。6.简述最优分割法的步骤7.简述 Ward 离差平方和法的基本思想.8.在数据处理时,为什么通常要进行标准化处理? 四、计算题1.假设有一个二维正态总体,它的分布为: ,并且还已知有两点19.0,2N和 , 1,AB要求分别用马氏距离和欧氏距离计算这两点 A 和 B 各自到总体均值点 的距0,离.2.设有 5 个样品,已知各样品之间的距离矩阵为: 54321GG065.32741.05432G试分别用最短距离法和最长距离法聚类。3为研究全国 31 个省区城镇居民生活消费的分布规律,根据 2003 年统计资料利用
33、SPSS 软件中的系统聚类法做类型划分,其谱系图如下,你认为从全国各省区的消费情况看,分为几类较合适,结合我国区域社会及经济发展情况,对分类结果作简要分析。* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *Dendrogram using Average Linkage (Between Groups)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25Label Num +-+-+-+-+-+青海 29 宁夏 30 河南 16 甘
34、肃 28 河北 3 四川 23 陕西 27 湖北 17 湖南 18 内蒙古 5 新疆 31 吉林 7 黑龙江 8 山西 4 辽宁 6 云南 25 安徽 12 贵州 24 江西 14 江苏 10 重庆 22 山东 15 福建 13 广西 20 海南 21 天津 2 西藏 26 浙江 11 广东 19 上海 9 北京 1 4下面给出了八个样品的两个指标数据1 2 3 4 5 6 7 8X1X2244701311239511214316试用中间距离法进行聚类,样品间的距离采用欧氏距离。第四章 判别分析一、填空题1进行判别分析时,通常指定一种判别准则,用来判定新样本的归属,按照判别准则的不同,又有多种
35、判别方法,其中常用的方法有_ _ _ 、_ _、 、和 。2.判别分析按判别的组数来区分,有 和 ;按区分不同总体的所用的数学模型来分,有 和 。3Fisher 判别是借助于 的思想,来导出 和建立判别准则。4判别分析是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立 和 。5在进行距离判别时,通常采用的距离是 ,它的基本公式为:。二、判断题1在正态等协差阵的条件下,Bayes 线性判别函数等价于距离判别准则。 ( )2费歇判别和距离判别都对判别变量的分布类型没有要求。 ( )3只有当两个总体的均值有显著差异时,做判别分析才有意义。 ( )4如果 是费歇判别准
36、则的判别函数,则对于任何 与任意常数 来说,x也都是它的线性函数。 ( )5Bayes 判别不仅考虑了各个总体出现的先验概率,而且也考虑到了错判所造成的损失。( )6.在进行两类判别时,两总体的协差阵如果相等,那么费歇判别与距离判别是等价的。 ( )7逐步判别法中筛选变量的过程实质上就是作假设检验,通过检验找出显著变量,剔除不显著变量。 ( )8在进行距离判别时,通常采用的是马氏距离。 ( )9设 为 维空间 上的 个子集,而且要求互不相交,它们的和集为 ,则kR,1 ppk pR样指标指标品称 为 的一个划分。而 Bayes 判别实质上就是找这个划分。kR,1 p( )三、简答题1. 判别分
37、析和聚类分析有何区别与联系?2距离判别分析的基本思想是什么?假设有两个总体 G1 和 G2, 如果能够定义样品 x 到它们的距离 D(x,G1)和 D(x,G2), 那么判别规则是怎样的?请描述这个准则的数学模型。3简述逐步判别法的基本思想。4距离判别、贝叶斯判别和费歇判别有何异同?5进行聚类分析往往要先对数据进行标准化变换,进行判别分析是否也需要先进行标准化变换?为什么?四、计算题*1已知观测向量 在两类上的均值向量分别为 和321,x35,10,两类的共同协差阵为:30,926104试用距离判别法建立判别函数和判别规则。现有一样品 ,问此样品应属于31,905x哪一类?(1)求出共同协方差
38、矩阵的逆矩阵和两类均值向量的离差向量分别为: 017.0357.2.35.186.2830281456240805684211 5130961(2)求出判别系数向量为: 03927.5.1407.0357.2.3.186.2a(3)两类均值向量的平均数向量为: 5.32980516221(4)线性判别函数为: 158.03927.25.0539. .329.11 xxxxaw(5)相应的判别规则为: 0,2xwGx待 判 , 若若若(6)该样品的判别函数值为: 192.0 158.30927.5.35由此可以判断,该样品应属于第一类。2例:某种产品的生产厂商有很多个,有些厂商的产品在市场上比较
39、受欢迎,而有些厂商的产品在市场上不大受欢迎,批发商店现有 12 家厂商的产品,其中 7 家是受欢迎的,5 家属于不太受欢迎的。该商店对这 12 家厂商的产品就其式样、包装和耐久性进行了评估,评分采用 10 分制,评估结果如下表所示。某种产品各品牌的各项评分畅销的产品 滞销的产品产品特性 产品特性厂家式样 x1 包装 x2 耐久性 x3厂家式样 x1 包装 x2 耐久性 x3123456797889878675995768537612345436214634246352合计 56 49 42 合计 16 19 20同时已知两类的共同协差阵的逆矩阵为:试用费歇判别准则建立判别函数和判别规则。现有一
40、新厂商推销其产品,产品特性评分为式样 6 分,包装 4 分,耐久性 5 分,问该厂商的产品是否受消费者欢迎?3某地市场上销售的收录机有多种牌号,该地某商场从市场上随机抽取了 13 种牌号的收录机,其中有 4 种畅销,有 5 种销售一般,有 4 种滞销。所调查的各种收录机的质量评分、功能评分和销售价格资料如下表所示:某地各种收录机的销售状况销售状态 产品序号 质量评分 功能评分 销售价格(元)畅 销AB8.39.537290680 027.16.0189.0167896.1SCD8.07.446390540平 销EFGHI9.28.07.66.47.387965820670900530480滞
41、销JKLM6.06.46.85.22453200390480290试根据该资料建立贝叶斯判别函数和判别准则。假设有一新厂商来推销其产品,其产品的质量评分为 7.0,功能评分为 7.0,销售价格为 660 元,问该厂产品的销售前景如何?4下图是 SPSS 统计分析软件的一个对话框,请问是什么分析过程?解释“Grouping Variable“、“Independents:“、 “Enter independent together ”、 “Use Stepwise method”等按纽的含义。五、证明题1.在两总体判别分析时,当两总体协差阵相等并且判别变量服从正态分布时,试证明距离判别与贝叶斯判别是等价的。2.设 、 为两个总体,其密度分别为 , ,已知 、1G2 ,1pN,2p01、 时,试证明 Bayes 判别准则为:2dxvx若待 判 若若21其中: ,fv211/2Cq