1、定义 2.1 将 个随机变量 的整体称为 维随机向量,p12,pX p记为 。12(,)X定义 2.2 设 是 维随机向量,它的多元分布函12(,)p数定义为(2.2)1212),(,)p pFxPxXx 记为 ,其中 , 表示 维欧氏空间。()pxR多维随机向量的统计特性可用它的分布函数来完整地描述。定义 2.3 设 是 维随机向量,若存在有限个或12,pX可列个 维数向量 ,记 , 且满足px()kPXxp(1,2),则称 为离散型随机向量,称 ,21 kPXxp为 的概率分布。(,)k设 ,若存在一个非负函数 ,使12(,)pFxxX ),(21pf得对一切 有,R(2.3)112121
2、(),)(,)pxpppfttdt 则称 为连续型随机变量,称 为分布密度函数,简X),(2xf称为密度函数或分布密度。一个 元函数 能作为 中某个随机向量的密度函数p),(21pxf pR的主要条件是:(1) , ;0),(21pxf px),(21(2) ,pdf离散型随机向量的统计性质可由它的概率分布完全确定,连续型随机向量的统计性质可由它的分布密度完全确定。定义 2.4 设 是 维随机向量,称由它的12(,)pX个分量组成的子向量 的分布为 的边缘)(pq12(),)qiiiX X(或边际)分布,相对地把 的分布称为联合分布。当 的分布函数是 时, 的分布函数即边缘分布函X12(,)q
3、Fx (1)数为: 121(,)(,)qqFxPXx 11(,)qqpPXxX 12,qF 当 有分布密度 时(亦称联合分布密度函数) ,则)(pxf也有分布密度,即边缘密度函数为:(1)Xpqpq dxfxf ,),(), 112 定义 2.5 若 个随机变量 的联合分布等于各自的边p2,X缘分布的乘积,则称 是相互独立的。12,p定义 2.6 设 ,若 存在且有限,则()X()1,)iEp称 为 的均值(向量)或数学期望,12(),(pE有时也把 和 分别记为 和 ,即 ,容易iEi12(,)p推得均值(向量)具有以下性质:(1) ()()A(2) XB(3) ()YBY其中, 、 为随机
4、向量, 、 为大小适合运算的常数矩阵。A定义 2.7 设 , ,称12,)pX 12(,)pY()()()DEE(2.4)1122 212,(,)(,)(,)(,pppCovXovCovXX 为 的方差或协差阵,有时把 简记为 , 简记为)D(,)ijCovX,从而有 ;称随机向量 和 的协差阵为ijijpY()()()CovEE,XYY(2.5)11212 212,(,),(,)(,)(,)ppppCovCovXXovYY 当 时,即为 。=XD若 ,则称 和 不相关,由 和 相C,0互独立易推得 ,即 和 不相关;但反过()ov,0X来,当 和 不相关时,一般不能推知它们独立。XY当 、
5、为常数矩阵时,由定义可以推出协方差阵有如下性质:AB(1)对于常数向量 ,有a()(DXa(2) ()()DA(3) ,CovCovXYB(4)设 为 维随机向量,期望和协方差存在,记 ,n ()EX, 为 常数阵,则()EtrA这里我们应该注意到,对于任何的随机向量 来12(,)p说,其协差阵 都是对称阵,同时总是非负定(半正定)的。大多数情况是正定的。若 的协差阵存在,且每个分量的方差大于零,12(,)pX则称随机向量 的相关阵为 ,其中()ijpCorRX,()ijijijCovDi,1,(2.6)为 与 的相关系数。iXj在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响
6、,往往在使用各种统计分析之前,常需要将每个指标“标准化” ,即进行如下变换 , *()jjjXED1,jp(2.7)那么由(2.7)构成的随机向量 。令,*12(,)p,有:12(,)pdiagC*EX那么,标准化后的随机向量 均值和协差阵分别为*X*11()()()0EC1111DD CCR即标准化数据的协差阵正好是原指标的相关阵。定理 2.1 设 ,则有 ,(,)PNX()EX()D多元正态分布的性质 1若 , 是对角阵,则 相互独12(,)(,)pXN 1,pX立。2若 , 为 阶常数阵, 为 维常数向量,则,pNAsds(,)dA即正态随机向量的线性函数还是正态的。3若 ,将 , ,
7、作如下剖分(,)pXX1)2qp( (1)2qp12qpqpq则 , 。(1)(1),qNX()(2)-,NX这里需要指出的是:第一,多元正态分布的任何边缘分布为正态分布,但反之不真。第二,由于 ,故 表(1)2)12,CovX120示 和 不相关,因此可知,对于多元正态变量而言, 和(1)(2) ()X的不相关与独立是等价的。2一、填空题:1.多元统计分析是运用 方法来研究解决 问题的理论和方法。2. 回归参数显著性检验是检验 对 的影响是否显著。3聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 聚类和 聚类。4相应分析的主要目的是寻求列联表 和 的基本分析特征和它
8、们的最优联立表示。5因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 。6.若 =1,2,3.n 且相互独立,则样本均值向量 服(),)PxN: x从的分布为_。二、名词解释1. 随机向量 2.相似数据 3.马氏距离(总体内两点间)三、简答1. 简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。2. 简述相应分析的基本思想。3. 简述求度量 MDS 古典解的一般步骤。4. 简述费希尔判别法的基本思想。5. 简述多元统计分析中协差阵检验的步骤6. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。7. 比较主成分分析与因子分析的异同点。8. 简述相应分
9、析的基本思想。9. 进行相应分析时在对因素A和因素B 进行相应分析之前没有必要进行独立性检验?为什么?四、计算:1.给出标准化变量X1,X 2, X3的协差阵(即相关阵)R ,同时给出R的特征值和相应的正交化特征向量。要求:1)计算因子载荷矩阵A ,并建立因子模型; 2)计算公因子的方差贡献,并说明其统计意义。2.下表是进行因子分析的结果,试根据下列信息计算变量共同度hi2 及公共因子 Fj 的方差贡献,并说明其统计意义.Component MatrixComponent 1 23 X1.969 -1.084E-02.205 X2.911 .321-.102 X3.847 -.120.323
10、X4.941 .281-2.693E-02 Extraction Method: Principal Component Analysis. a 3 components extracted.3.会用最短距离法和最长距离法进行聚类分析,并画谱系图。4.根据给定信息,会进行判别分析。5.给出资料阵,会求均向量,协差阵、相关阵。6. 会求矩阵的逆阵,特征根与特征向量。7. 给出总体资料的协差阵,会求主成分。8. 给出两组资料的相关阵,会计算典型相关系数。X5.899 .215-1.963E-02 X6-.313 .839.305 X7-.666 6.280E-02.679 X8.575 -.580.367