收藏 分享(赏)

3_4_2协方差与相关系数.ppt

上传人:pw17869 文档编号:6859406 上传时间:2019-04-25 格式:PPT 页数:35 大小:1.09MB
下载 相关 举报
3_4_2协方差与相关系数.ppt_第1页
第1页 / 共35页
3_4_2协方差与相关系数.ppt_第2页
第2页 / 共35页
3_4_2协方差与相关系数.ppt_第3页
第3页 / 共35页
3_4_2协方差与相关系数.ppt_第4页
第4页 / 共35页
3_4_2协方差与相关系数.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

1、前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是现在要讨论的,协方差和相关系数,上页 下页 返回 结束,在讨论这个问题之前,我们先看一个例子。,在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系.,上页 下页 返回 结束,这里有两个变量,一个是父亲的身高,一个是成年儿子身高. 为了研究二者关系. 英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图.,上页 下页 返回 结束,那么要问:父亲及其成年儿子身高是一种什么关系呢?,类似的问题有:,吸烟和患肺癌有什么关系?,受教育程度和失业有什么关

2、系?,上页 下页 返回 结束,高考入学分数和大学学习成绩有什么关系?,为了研究诸如此类的两变量的相互关系问题,我们需要从理论上对两变量的相互关系加以研究.,上页 下页 返回 结束,这一讲就来讨论这个问题.,上页 下页 返回 结束,任意两个随机变量和的协方差,记为Cov(,), 定义为, Cov(+,)= Cov(,) + Cov(,), Cov(,)= Cov(,),(一)、协方差,2.简单性质, Cov(a,b) = ab Cov(,) a,b是常数,Cov(,)=E(-E) (-E),1.定义3.5,上页 下页 返回 结束,Cov(,)=E() -EE,可见,若与独立, Cov(,)= 0

3、 .,3. 计算协方差的一个简单公式,由协方差的定义及期望的性质,可得,=E()-EE-EE+EE,=E()-EE,即,Cov(,)=E(-E) (-E),上页 下页 返回 结束,若1,2, ,n两两独立,,上式化为,D(+)= D+D+ 2Cov(,),4. 随机变量和的方差与协方差的关系,常用上式计算相依随机变量和的方差.,上页 下页 返回 结束,协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受与本身度量单位的影响. 例如:,Cov(k, k)=k2Cov(,),为了克服这一缺点,对协方差进行标准化:,这就引入了相关系数 .,上页 下页 返回 结束,二、相关系数,为随机变量和的相

4、关系数 .,在不致引起混淆时,记 为 .,上页 下页 返回 结束,相关系数的性质:,证: 由方差的性质和协方差的定义知,对任意实数b,有,0D(-b)= b2D+D-2b Cov(,),令,,则上式为,D(-b)=,上页 下页 返回 结束,2. 和独立时, =0,但其逆不真.,由于当和独立时,Cov(,)= 0.,故,= 0,请看下例.,上页 下页 返回 结束,例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X,(请课下自行验证),因而 =0,,即X和Y不相关 .,但Y与X有严格的函数关系,,即X和Y不独立 .,上页 下页 返回 结束,存在常数a,b(b0),,使PY=a+b

5、X=1,,即X和Y以概率1线性相关.,上页 下页 返回 结束,考虑以X的线性函数a+bX来近似表示Y,,以均方误差,e =EY-(a+bX)2,来衡量以a+bX近似表示Y的好坏程度,e值越小表示 a+bX与Y的近似程度越好.,用微积分中求极值的方法,求出使e 达到最小时的a,b .,相关系数刻划了X和Y间“线性相关”的程度.,上页 下页 返回 结束,=E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y),e =EY-(a+bX)2 ,解得,这样求出的最佳逼近为 L(X)=a0+b0X,上页 下页 返回 结束,这样求出的最佳逼近为L(X)=a0+b0X,这一逼近的

6、剩余是,若 =0, Y与X无线性关系;,若0| |1,| |的值越接近于1, Y与X的线性相关程度越高;,| |的值越接近于0, Y与X的线性相关程度越弱.,E(Y-L(X)2= D(Y)(1- ),上页 下页 返回 结束,当 0时,L(X)中X的系数大于0,即Y 的最佳逼近 a+ bX 随X增加而增加, 这就是正向相关;反之, 0表示负向相关,此时Y的最佳逼近a+ bX随X增加而减小.,E(Y-L(X)2= D(Y)(1- ),上页 下页 返回 结束,若(X,Y)具有二维正态。 是Y与X的相关系数. 以下画出 取几个不同值时(X,Y)的密度函数图.,上页 下页 返回 结束,相关系数度量的是两

7、变量间的相互关系(“线性相关”的程度).但相互关系并不等于因果关系.,上页 下页 返回 结束,若某地区18-74岁男子身高与体重的相关系数约为0.40. 下面的结论正确还是错误,并说明理由.,错误,相互关系并不等于因果关系.,上页 下页 返回 结束,但对下述情形,独立与不相关等价,前面,我们已经看到:,若X与Y独立,则X与Y不相关,,但由X与Y不相关,不一定能推出X与Y独立.,上页 下页 返回 结束,矩、协方差矩阵,在数学期望一讲中,我们已经介绍了矩和中心矩的概念.,这里再给出混合矩、混合中心矩的概念.,上页 下页 返回 结束,协方差Cov(X,Y)是X和Y的 二阶混合中心矩.,称它为X和Y的

8、k+L阶混合(原点)矩.,称它为X和Y的k+L阶混合中心矩.,可见,,上页 下页 返回 结束,协方差矩阵的定义,将二维随机变量(X1,X2)的四个二阶中心矩,排成矩阵的形式:,称此矩阵为(X1,X2)的协方差矩阵.,上页 下页 返回 结束,类似定义n维随机变量(X1,X2, ,Xn) 的协方差矩阵.,下面给出n元正态分布的概率密度的定义.,为(X1,X2, ,Xn) 的协方差矩阵,称矩阵,上页 下页 返回 结束,f (x1,x2, ,xn),则称X服从n元正态分布.,其中C是(X1,X2, ,Xn) 的协方差矩阵.,|C|是它的行列式, 表示C的逆矩阵,,X和 是n维列向量, 表示X的转置.,

9、设 =(X1,X2, ,Xn)是一个n维随机向量, 若它的概率密度为,上页 下页 返回 结束,n元正态分布的几条重要性质,1. X=(X1,X2, ,Xn)服从n元正态分布,上页 下页 返回 结束,n元正态分布的几条重要性质,2. 若 X=(X1,X2, ,Xn)服从n元正态分布,,Y1,Y2, ,Yk是Xj(j=1,2,n)的线性函数,,则(Y1,Y2, ,Yk)也服从多元正态分布.,这一性质称为正态变量的线性变换不变性.,上页 下页 返回 结束,n元正态分布的几条重要性质,3. 设(X1,X2, ,Xn)服从n元正态分布,则,“X1,X2, ,Xn相互独立”,等价于,“X1,X2, ,Xn

10、两两不相关”,上页 下页 返回 结束,例2 设随机变量X和Y相互独立且XN(1,2), YN(0,1). 试求Z=2X-Y+3的概率密度.,故X和Y的联合分布为正态分布,X和Y的 任意线性组合是正态分布.,解: XN(1,2),YN(0,1),且X与Y独立,D(Z)=4D(X)+D(Y)=8+1=9,E(Z)=2E(X)-E(Y)+3=2+3=5,即 ZN(E(Z), D(Z),ZN(5, 32),上页 下页 返回 结束,故Z的概率密度是,ZN(5, 32),上页 下页 返回 结束,这一讲我们介绍了协方差和相关系数,相关系数是刻划两个变量间线性相关程度 的一个重要的数字特征.,它取值在-1到1之间.,如果两个变量之间存在强相关,则已知一个变量的值对预测另一个变量的值将很有帮助.,如果两个变量之间只有很弱的相关,则关于一个变量的信息对猜测另一个变量的值没有多大帮助.,上页 下页 返回 结束,注意独立与不相关并不是等价的.,当(X,Y)服从二维正态分布时,有,上页 下页 返回 结束,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报