1、2019/4/14,第三章 多元正态分布,2019/4/14,第一节 多元正态分布的定义,一、一元正态分布回顾,一个游戏:高尔顿钉板游戏,考察某一学科考试成绩的分布,考察人类身高的分布情况,思考:以上分布具有什么样的特点?,2019/4/14,1、一元正态分布的定义,2019/4/14,2、标准正态分布,3、标准正态分布与一般正态分布之间的关系,记 u N (0 ,1 ),则 x=+ u N ( , 2 ),2019/4/14,二、多元正态分布的定义,定义3.2 设p 维随机向量 则 u 的密度函数为,u的均值和协方差矩阵分别为,u的分布称为均值为0,协方差矩阵为I 的p 元正态分布,记作,2
2、019/4/14,设p 维随机向量 u Np (0, I ) ,下面考虑 u 的一个非退化变换 x = m + A u 的分布,这里,x 的均值和协方差矩阵分别为,2019/4/14,x的分布称为非退化的p 元正态分布,记作,2019/4/14,解,x的概率密度为,2019/4/14,2019/4/14,2019/4/14,1. 设x是一个p 维随机向量,则x服从多元正态分布,当且 仅当它的任何线性组合 ax( a 为p 维常数向量 )均服从一元正态分布。,第二节 多元正态分布的性质,2019/4/14,解,解,试写出x1x2的分布。,2019/4/14,注意:性质3说明了多元正态分布的任何边
3、际分布仍为多元正态分布,但反之不成立。,2019/4/14,则,2019/4/14,2019/4/14,注意:性质7说明了多元正态变量的子向量之间互不相关和独立是等价的。,2019/4/14,则,2019/4/14,第三节 极大似然估计及估计量的性质,一、总体、样本、样本数据矩阵,1. 总体,3. 样本数据矩阵,2019/4/14,二、多元样本的数字特征,1. 样本均值向量,2. 样本离差矩阵,3. 样本协方差矩阵,?,其中,其中,2019/4/14,2019/4/14,三、样本 的联合概率密度,由于,?,?,2019/4/14,所以,这里,?,2019/4/14,四、m 和S 的极大似然估计
4、,1. 似然函数,求解极值问题: 可得m 和S 的极大似然估计,,先固定S 考虑,2019/4/14,?,?,于是,2019/4/14,由此引理可知,当n p 时,A 正定,m 和S 的极大似然估计分别为,此时似然函数最大值为,2019/4/14,思考:当m 已知时,S 的极大似然估计如何表示?,答:,2019/4/14,五、相关系数的极大似然估计,1. 极大似然估计的不变性,设参数 的极大似然估计是 ,变换 是一一对应的,则 的极大似然估计就是,2. 简单相关系数的极大似然估计,2019/4/14,称 为样本相关系数, 为样本相关矩阵?,2019/4/14,3. 偏相关系数的极大似然估计,2
5、019/4/14,对于p 元总体,将样本协方差矩阵S 作如下剖分,则,其中,2019/4/14,4. 复相关系数的极大似然估计,2019/4/14,为了对未知参数作出估计, 首先应通过好的统计思想产生合理的估计量,而这样的估计量往往不止一个.,问题,(1) 对于同一个参数究竟采用哪一个估计量好?,(2) 评价估计量的标准是什么?,下面介绍几个常用标准(无偏、有效、相合性和充分性).,六、估计量的性质,2019/4/14,无偏估计的实际意义: 无系统误差.,以买水果为例加以说明,1. 无偏性,2019/4/14,解,无偏,有偏,2019/4/14,由于方差是随机变量取值与其数学期望的偏离程度,所
6、以无偏估计以方差小者为好.,2. 有效性,2019/4/14,3. 相合性(一致性),4. 充分性,2019/4/14,第四节 抽样分布,一、随机矩阵的分布,2019/4/14,二、Wishart(威沙特)分布,1. 定义,2019/4/14,2. 性质,2019/4/14,3. 一个结论,4. Wishart分布与 c2 分布之间的关系,2019/4/14,三、T 2 分布,1. 定义,T 2 分布是Hotelling 于1931年由一元推广而来的,又称为Hotelling 分布.,2019/4/14,2. 性质,2019/4/14,3. 几个结论,证明:,2019/4/14,2019/4/14,4. T 2分布与 t 分布之间的关系,2019/4/14,四、Wilks L分布,1. 定义,2019/4/14,2. 分布与 F 分布之间的关系,2019/4/14,