1、,第四章 随机变量的数字特征,数学期望,4.1,若统计100天,例1 某车间对工人的生产情况进行考察. 车工小张每天生产的废品数X是一个随机变量. 如何定义X的平均值呢?,32天没有出废品; 30天每天出一件废品; 17天每天出两件废品; 21天每天出三件废品;,可以得到这100天中每天的平均废品数为,设X是离散型随机变量,它的分布律是:,一.离散型随机变量的数学期望,为X的数学期望.,例2. 某射手连续向一目标射击,直到命中为止,设他每发命中的概率是p,求平均射击次数。,解:,例3. 设X的概率分布为:,若已知E(X)=a,求常数A,B.,解:,例4 某人的一串钥匙上有n把钥匙,其中只有一把
2、能打开自己的家门,他随意地试用这串钥匙中的某一把去开门. 若每把钥匙试开一次后除去,求打开门时试开次数的数学期望.,解: 设试开次数为X,P(X=k)= 1/n , k=1,2,n,E(X),于是,设X是连续型随机变量,其密度函数为 f (x),如果,绝对收敛,则定义X的数学期望为,二.连续型随机变量的数学期望,例6. 设X的概率密度如下,求E(X).,解:,设Y是随机变量X的连续函数,Y=g(X),则,当X为离散型时,P(X= xk)=pk ; 当X为连续型时,X的密度函数为f (x).,三.随机变量函数的数学期望,例7. 已知风速XU(0,a),又设飞机机翼所受的正压力Y是X的函数Y=kX
3、2(k0),求E(Y).,解:,例8. 设XN(0,1),求E(|X|).,解:,设(X,Y)是二维随机变量,Z=g(X,Y),则,四.二维随机变量函数的数学期望,Y,例9. 设(X,Y)联合概率分布为:,求E(X2Y).,解:,例10. 若XN(0,1),YN(0,1),X与Y独立。,解:,五.数学期望的性质,1. E(aX+b)=aE(X)+b;,2. E(X+Y) = E(X)+E(Y);,3. 设X、Y相互独立,则 E(XY)=E(X)E(Y);,E(aX)=aE(X),E(b)=b,例.设X,Y相互独立,其概率密度为,例.设X的概率密度为,求E(2X+1),六.几种常见分布的数学期望
4、,若X 0-1分布,那么E(X)=p;,若X B(n,p), 那么E(X)=np;,若X P(), 那么E(X)=;,若X E(), 那么E(X)=1/;,若X Ua,b, 那么E(X)=(a+b)/2;,若X N(,2),那么E(X) =.,例9. 将n个球放入M个盒子中,设每个球落入各个盒子是等可能的,求有球的盒子数X的数学期望。,解:,方差,4.2,例如,某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图:,若让你就上述结果评价一下两台仪器的优劣,你认为哪台仪器好一些呢?,测量结果的均值都是 a,因为乙仪器的测量结果集中在均值附近,又如,甲、乙两门炮同
5、时向一目标射击10发炮弹,其落点距目标的位置如图:,你认为哪门炮射击效果好一些呢?,甲炮射击结果,乙炮射击结果,因为乙炮的弹着点较集中在中心附近 .,为此需要引进另一个数字特征,用它来度量随机变量取值在其中心附近的离散程度.,这个数字特征就是我们这一讲要介绍的,方差,方 差,D(X) =,标准差,一.方差的定义,若X的取值比较分散,则方差较大 .,方差刻划了随机变量的取值对于其数学期望的离散程度 .,若X的取值比较集中,则方差较小;,D(X)=EX-E(X)2,D(X)=E(X2)-E(X)2,二.方差的计算,计算方差的一个简化公式,D(X)=E(X2)-E(X)2,展开,证:D(X)=EX-
6、E(X)2,=EX2-2XE(X)+E(X)2,=E(X2)-2E(X)2+E(X)2,=E(X2)-E(X)2,利用期望 性质,请自己用此公式计算常见分布的方差.,例1. 已知随机变量X的分布列为,求X的方差和标准差。,解:,例2. 设随机变量X的概率密度为,求D(X),例3. 已知随机变量X的分布函数如下,求D(X)。,三.方差的性质,1. D(aX+b)=a2D(X) ;,D(aX)=a2D(X),D(b)=0,D(-X)= D(X),方差的性质,2. 若X、Y相互独立,D(X+Y) = D(X)+D(Y);,一般地, D(X+Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y),例4
7、. 设(X,Y)的联合概率密度为,(1) 试求X、Y的边缘密度,并问X与Y 是否相互独立? (2) 求E(2X+3Y), D(2X+3Y).,例5.设X的概率密度为,3. 切比雪夫不等式,设随机变量X有数学期望和方差2,则对于任给0,有,方差的性质,证:,例7. 设X为随机变量,已知E(X)=,D(X)=2 ,试用切比雪夫不等式估计P(|X-|3).,解:,例8. 已知某种股票每股价格X的平均值为1元,标准差为0.1元,求a,使股价超过1+a元或低于1-a元的概率小于10%。,解:由切比雪夫不等式,令,例9. 已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700 . 利用切比
8、雪夫不等式估计每毫升白细胞数在52009400之间的概率 .,解:设每毫升白细胞数为X,依题意,E(X)=7300,D(X)=7002,所求为 P(5200 X 9400),P(5200 X 9400),=P(5200-7300 X-7300 9400-7300),= P(-2100 X-E(X) 2100),= P |X-E(X)| 2100,由切比雪夫不等式,P |X-E(X)| 2100,即估计每毫升白细胞数在52009400之间的概率不小于8/9 .,例10. 若X G(p),求D(X).,解:,E(X)=1/p,若X 0-1分布,那么D(X)=p(1-p);,若X B(n,p), 那
9、么D(X)= np(1-p);,若X P(), 那么D(X)=;,若X G(p), 那么D(X)=(1-p)/p2.,若X E(), 那么D(X)=1/2;,若X Ua,b, 那么D(X)=(b-a)2/12;,若X N(,2),那么D(X) =2.,X的标准化随机变量,E(X*)=0, D(X*)=1,E(Xk)X的k阶原点矩,E(X-E(X)kX的k阶中心矩,E(X)X的1阶原点矩,D(X) X的2阶中心矩,协方差与相关系数,4.3,数学期望,方 差,单个变量的数字特征,多个变量间联系的数字特征,相关系数,设(X,Y)为二维随机变量,若,E X-E(X)Y-E(Y) ,存在,则称其为X和Y
10、的协方差,记为cov(X,Y)。,协方差,cov(X,Y)=0,cov(X,Y)=E X-E(X)Y-E(Y) =E(XY) -E(X)E(Y),D(X+Y)=D(X)+D(Y)+2cov(X,Y),cov(X,Y)=0,X与Y相互独立,cov(X,Y)= 0, cov(X1+X2,Y)= cov(X1,Y) + cov(X2,Y), cov(X,Y)= cov(Y,X), cov(aX,bY) = ab cov(X,Y) a,b是常数,协方差的性质,例 设随机变量XB(12,0.5),Y N(0,1), COV(X,Y)=-1,求V=4X+3Y与W=-2X+4Y 的方差与协方差,协方差的大小
11、在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响. 例如:,Cov(kX, kY)=k2Cov(X,Y),为了克服这一缺点,对协方差进行标准化,这就引入了相关系数 .,为随机变量X和Y的相关系数,设D(X)0, D(Y)0,称,相关系数,例 设(X,Y)服从区域D:0x1,0yx上的均匀分布,求X与Y的相关系数,D,1,x=y,解,相关系数的性质,例1.,相关系数XY 是刻划X和Y间线性关系程度的数字特征,| XY|越大, X和Y间线性关系越明显。当XY 0时, Y有随着X增加而增大的趋势;当XY 0时, Y有随着X增加而减小的趋势.,随机变量不相关只说明两个随机变量之间
12、没有线性关系,但还可能有某种别的函数关系; 随机变量相互独立说明两个随机变量之间没有任何关系,既无线性关系,也无非线性关系。 所以相互独立必然不相关,反之不一定成立。,相互独立和不相关,例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X,(请课下自行验证),因而 =0,,即X和Y不相关 .,但Y与X有严格的函数关系,,即X和Y不独立 .,例2. (X,Y) N(1 ,2,12,22,) ,,对二维正态分布而言,X、Y相互独立与互不相关是等价的。,(1)求E(X)和D(X). (2)求cov(X,|X|),并判断X与|X|是否相关. (3)判断X与|X|是否独立.,例3. 设随机变量X的概率密度为,(1)求E(Z)和D(Z). (2) 求XY,判断X与Z是否不相关. (3)判断X与Z是否独立.,例4. 设XN(1,9),YN(1,16),,例5. 将一枚均匀硬币重复掷n次,以X和Y分别表示正面向上和反面向上的次数,求X和Y的相关系数XY。,对于任意两事件A和B, 若0P(A)1,0P(B)1,则称,为事件A和B的相关系数。,例6.证明:(1)事件A和B独立的充要条件是=0;(2) |1.,