1、一、协方差 二、相关系数,4.3 协方差和相关系数,对于随机变量(X,Y)而言:E(X)、E(Y)反映分量X、Y各自的 平均值D(X)、D(Y)反映分量X、Y各自的 平均偏离程度,并未反映X、Y之间的相互关系,定义:,一、协方差,称EXE(X)YE(Y)为X与Y 的 协方差,记为Cov(X,Y) ,即,Cov(X,Y)=EXE(X)YE(Y),若X取值比较大(XE(X),Y也较大 (YE(Y),若X取值比较小(XE(X),Y也较小 (YE(Y),若X取值较小,Y取值较大或若X取 值较大,Y取值较小,这时Cov(X,Y)0,这时Cov(X,Y)0,则Cov(X,Y)0,协方差可了解两个变量之间之
2、间 的关系(变化趋势在平均意义上而言):,正的协方差表示两个随机变量倾 向于同时取较大值或同时取较小值,负 的协方差反映两个随机变量有相反方 向变化的趋势,Cov(X,Y),连续型随机变量的协方差:,Cov(X,Y),离散型随机变量的协方差:,协方差的性质:,1. Cov(X,X)=D(X); Cov(Y,Y)=D(Y),2. Cov(X,Y)=Cov(Y,X),3. Cov(a1X+b1,a2Y+b2)=a1a2Cov(X,Y)其中a1,a2,b1,b2为常数,4. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y),5. Cov(X, Y)=E(XY)E(X)E(Y),若X与
3、Y独立,则Cov(X,Y)=0,还可推得:,D(XY)=D(X)+D(Y)2Cov(X,Y),6. Cov(X, Y)2D(X)D(Y),(用下述定理证明),9,定理2 (柯西许瓦兹不等式)设(X,Y)是一个二维随机变量,又,则有,证:考虑一个二次函数,10,证明: 性质6 Cov(X, Y)2D(X)D(Y),证:,由柯西许瓦兹不等式可得:,即 Cov(X, Y)2D(X)D(Y),二、相关系数,定义:,若D(X)0,D(Y)0,则称,为X,Y的相关系数或标准协方差,记为 XY ,即,2.相关系数就是标准化的随机变量,相关系数的性质:,当且仅当X与Y之间有线性关系时, 等号成立,即 | XY |=1a,b,使PY=aX+b=1,说明: XY刻划X,Y之间的线性相关程度,|XY|1,则X,Y越接近线性关系,|XY|=1,则X,Y存在线性关系,|XY|1,当XY=0时,称X与Y不相关,则X,Y没 有线性关系,注: 不相关与相互独立:,X与Y独立,Cov(X,Y)=0,XY=0, X与Y不相关,但反之不成立,若(X,Y)正态分布,则X与Y不相关 等价于X,Y相互独立 XY= ,例1 设(X,Y)的概率密度为,求Cov(X,Y)、XY,解:,同理,得:,有: Cov(X, Y)=E(XY)E(X)E(Y),同理,得:,D(X)=E(X2)E2(X),同理,得:,有:,