1、1一、填空题1、多元统计分析研究的内容是多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。2、若 且相互独立,则样本均值向量 服从的分布为 。),21(),)( nNXp X)1,(nNp3、Fisher 判别法中系数 PC,21 确定的原则是使两组间的区别最大,而使每个组内部离差最小。4、对一个样本来说,他的轮廓图是多角折线。5、 型聚类是指对_样品_ 进 行聚类, 型聚类是指对_指标(变量)_进行聚类。QR6、因子分析中因子载荷系数 的统计意义是_第 i 个变量与第 j 个公因子的相关系数。ija7、 0。),(21FCov8、对应分析是将 R 型因子分析和 Q 型因子分析结合
2、起来进行的统计分析方法。9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。2、判断题1、多元统计分析的含义。2、协差阵是非负定矩阵,是一个对称矩阵(对角阵)。3、均值检验时采用的检验统计量是不唯一的。4、一个多元数据画出来的图形不是唯一的(包括轮廓图、雷达图和调和曲线图)。5、系统聚类的原则是把距离短的样品归在相同类,距离长的样品归在不同类。6、Bayes 判别法的基本思想是假定对研究的对象有一定的认识,常用先验概率来描述这种认识。27、主成分的协差阵是对角阵。8、因子分析是主成分分析两种方法的出发点都是变量的相关系数矩阵,在损失较少信息的前提下,把多个变量(这些变量之间要求存在较
3、强的相关性,以保证能从原始变量中提取主成分)综合成少数几个综合变量来研究总体各方面信息的多元统计方法,且这少数几个综合变量所代表的信息不能重叠,即变量间不相关。9、对应分析可分析的三个方面 Q 型因子分析、R 型因子分析和样本和变量之间的分析。3、计算题1、设随机向量 的联合密度函数为:21,X其 他,010,8),( 212121 xxxf求 的均值向量。X解: 212221),()(dxfxED2、设抽了五个样品,每个样品只测了一个指标,它们分别是 1 ,2 ,4.5 ,6 ,8。若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。解:样品与样品之间的明氏距离为: 025.3
4、6714.054321 5432)0(xxxD样品最短距离是 1,故把 合并为一类,计算类与类之间距离(最长距离法)得距离阵 21X与3025.371.0,54321 54321)(xxxD类与类的最短距离是 1.5,故把 合并为一类,计算类与类之间距离(最长距离法)得距离阵4X与 05.37),0,54321 5321)2(xxD类与类的最短距离是 3.5,故把 合并为一类,计算类与类之间距离(最长距离法)得距离543,X与阵 07,5432121)(xxD分类与聚类图(略)3、设变量 的相关阵为 的特征值和单位化特征向量分别为123,X1.0.6345,0RR11.96,0.,59.1;T
5、l2824,083.7,3.,6.Tl(1) 取公共因子个数为 2,求因子载荷阵 。A(2) 计算变量共同度 及公共因子 的方差贡献,并说明其统计意义。ihjF解:因子载荷阵 68.049.150.2.63A变量共同度: = 2221 )()63.(h= 2 .=223 )6804()9.50(4公共因子 的方差贡献:jF2221 )96.150()96.150()96.30( S2 84848统计意义(略)4、设三元总体 的协方差阵为 ,从 出发,求总体主成分 ,并求前两个主成X6031123,F分的累积贡献率。解:特征方程 ,得特征根:|E1,3,21的特征方程: ,得特征向量610035
6、321x10u的特征方程: ,得特征向量31 321x02的特征方程: ,得特征向量1050321x13u31xF213F前两个主成分的累积贡献率 9.04、证明题1、设三维随机向量 ,其中 ,问 与 是否独立? 和 是),(3NX203141X2),(21X3否独立?为什么?解: 因为 ,所以 与 不独立。1),cov(211X2把协差矩阵写成分块矩阵 , 的协差矩阵为 因为21),(211,而 ,所以 和 是不相关的,而正态分布不相关与相互独12321),cov(X02,213X5立是等价的,所以 和 是独立的。),(21X32、设 ,其中 , ,,),21NxX2112试证明 和 相互独立。2121X证明:记 Y),(212利用性质 2 可知 , 为正态随机变量,又01),1()1,(, 22 YCov即 和 相互独立。21X21五、应用题