1、多元统计分析简介,多元统计分析:通过对多个随机变量观测数据的分析,来研究变量之间的相互关系以及解释这些变量内在的变化规律。,一元统计分析一个随机变量的统计规律 多元统计分析多个随机变量之间的相互依赖关系及内在统计规律性,多元统计分析应用:经济学、工业、农业、医学、教育学、生态学、地质学、社会学、考古学、环境学、气象、文学等许多领域,多元统计分析主要内容:1、多元正态总体的参数估计和假设检验 2、常用的处理多元数据的统计方法:1)聚类分析2)判别分析3)主成分分析4)因子分析5)多重多元回归分析等等,第一章 多元统计中的基本概念,第一节 基本概念第二节 多元正态分布第三节 多元统计中的常用分布,
2、第一节 基本概念,1.随机向量Def1:将p个随机变量 的整体称为p维随机向量,记作 。,分布函数,离散型:分布律 连续型:密度函数,分布密度函数,满足,分布密度函数应满足的两个条件?,Def2:设 是p维随机向量,称由它的q(qp)个分量组成的子向量 的分布为 的边缘分布,相对的把 的分布称为联合分布。,边缘分布函数和边缘分布密度可由联合分布和联合密度确定。,Def3:若p个随机变量 的联合分布等于各自的边缘分布的乘积,则称 是相互独立的。,2.随机向量的数字特征,(1)数学期望,其中,,均值向量具有如下性质:,(2)协方差矩阵设 称,为X的协差阵。,若X的协差阵存在,且每个分量的方差大于0
3、,则称随机变量X的相关阵为 ,其中为相关系数。,设标准离差阵为则有,称X和Y的协差阵为:,协差阵具有如下性质:(试证之),多元分析的任务分析各变量之间的关系,推断总体的性质,为一维随机变量为多维随机变量 (随机向量),3.多元总体多元分析研究具有多个(如p个)属性(指标)的对象组成的总体-多元总体。从总体中任意抽出一个对象(总体单元),其p个属性的值为,多元总体多维随机变量(随机向量)可能取值的全体。,观测矩阵(随机) (样本资料阵),4.多元样本的相关概念,从多元总体中随机抽取n个个体。,i.i.d. 简单随机样本,多元分析的研究对象,(1) 样本平均值,样本平均值是n个 样本点的重心,(2
4、) 样本离差阵,样本均值和样本离差阵的矩阵表示:,(3) 样本协差阵,(4) 样本相关阵,-样本相关系数,非负定矩阵,第二节 多元正态分布,1. 多元正态分布,若随机向量 的分布密度函数为,则称 服从p维正态分布。记作:其数学期望与协方差矩阵分别为:,其中,为对称正定矩阵,,特例1(一元正态分布),则,特例2 (二元正态分布),设,则,2. 多元正态分布的常用性质,分布?,第三节 多元统计中的常用分布,在一元统计中,卡方分布、t分布和F分布在参数估计和假设检验中起着非常重要的作用。在多元统计中,他们分别发展为Wishart分布、Hotelling-T2分布和Wilks分布,在多元参数估计和假设检验中占有非常重要的地位。,1、Wishart分布(1) Wishart分布由Wishart在1928年推导出来。,(2) Wishart分布的性质,2、Hotelling-T2分布,(2) Hotelling-T2分布的性质,3、Wilks分布,多元正态总体下的假设检验问题。,