1、第四章 随机变量的数字特征与特征函数,前面讨论了随机变量及其分布. 如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.,在实际问题中,概率分布是较难确定的. 在实际应用中,有时并不需要知道随机变量的所有性质,只要知道它的某些数字特征就够了.更重要的是一些分布可以由它的某些数字特征完全刻画.,因此,在对随机变量的研究中,确定随机变量的某些数字特征是非常重要的.,最常用的数字特征是数学期望和方差。,4.1数学期望,二、连续型随机变量的数学期望,设X是连续型随机变量,其密度函数为f(x), 在数轴上取很密的点x0x1x2, 则X落在小区间xi, xi+1)的概率是,在小区间 xi, x
2、i+1)上,受此启发,定义,定义 设X是连续型随机变量,其密度函数为 f (x), 如果,收敛,则称,为随机变量X的数学期望或均值,记为E(X)或 EX,即,函数的数学期望,可见,XN(,2),则其数学期望为。后面例题的计算使用了这一结论。,(3)设(X,Y)的分布律为,四、数学期望的性质,性质5,6为不等式,注:性质3和4可推广到任意有限个随机变量的场合。,P144例12,利用性质求 XB(n,p), E(X)=?,柯西-许瓦兹不不等式,方差和矩,二、方差性质,性质可推广到n个独立随机变量的情况。,矩,契比雪夫不等式,性质4可由契比雪夫不等式推出,见p151,三、矩,随机变量的矩是常见的数字
3、特征。数学期望和方差是它的特例。,定义:设X为随机变量,对任意正整数k,分别称,K阶原点矩,K阶原点绝对矩,K阶中心矩,K阶中心绝对矩,N维随机变量也可以定义其数学期望和方差。以二维为例,有协方差、相关系数。,4.3 协方差与相关系数,N维随机变量也可以定义其数学期望和方差。以二维为例。,问题1 二维随机变量的数学期望、方差分别反映了它的各分量的平均值和相对于各自数学期望的分散程度。如何反映各分量之间的相互联系呢?,问题2 另外,在实际问题中,常考虑用一个随机变量X的线性函数来近似表示另一个随机变量Y,那么,何时能而何时不能?如果能,如何衡量与描述近似程度的优劣?,下面根据独立性来寻求反映X和
4、Y相关程度的量,分析:对于相互独立的随机变量X,Y,有E(XY)=E(X)E(Y),从而,反之则说明,当EX-E(X)Y-E(Y)0时,X与Y一定不相互独立,这说明EX-E(X)Y-E(Y)在一定程度上反映了X和Y的相关程度。,通过例子说明EX-E(X)Y-E(Y)在一定程度上反映了X和Y的相关程度,讨论:设后者能用前者的线性变换表示,其形式为,其中t为常数,用所产生的均方差来衡量近似程度。所产生的均方差为,例:设X,Y的数学期望、方差均存在,则以下两个随机变量为标准化(无量纲化)的,,问:后者能用前者的线性函数表示吗?近似程度如何?,显然,当 时,均方差最小,其值为,既决定了反映近似程度的均
5、方差的最小值,又同时与X、Y有关,故其本身就能反映X、Y的近似程度,于是作如下定义,一、协方差,定义 对二维随机变量(X,Y),若E(X),E(Y),EX-E(X)Y-E(Y) 都存在,则称EX-E(X)Y-E(Y)为X与Y的协方差或相关矩,记作cov(X,Y),即,显然,协方差也可以表达为,P155例1,P155例2,协方差的大小与使用的度量单位有关,如何避免度量单位的影响?,二、相关系数,用协方差描述随机变量之间的相关程度有一个明显的不足,就是协方差的大小与使用的度量单位有关,例如kX和kY之间的统计关系与X和Y之间的统计关系应该是一样的,但其协方差却扩大了k2倍,即Cov(kX,kY)=
6、k2cov(X,Y).为了避免随机变量本身因本身度量单位不同而影响它们相互关系的度量,可将每个随机变量进行标准化,即无量纲化,随机变量的标准化(无量纲化):令,衡量X*,Y*之间相互关系的协方差为:,显见,cov(X*,Y*)与cov(X,Y)构成线性关系,也能反映X和Y间的相互关系,且因其无量纲,从而不会因单位不同而影响对相互关系的度量。,定义相关系数,定义:设(X,Y)为二维随机变量,D(X)0,D(Y)0,称,为随机变量X和Y的相关系数,有时也记为,相关系数的性质:,二维r.v.是协方差,那,n维r.v.呢?,三、协差阵,n维随机变量的重要数字特征是协差阵。,定义:设(X1,X2, ,X
7、n)为n维随机变量,且,则称矩阵,为n维随机变量(X1,X2, ,Xn)的协差阵。,4.5 特征函数,一、特征函数的定义,1.复随机变量,如果随机变量X和Y都是实值随机变量,则称E=X+iY为复(值)随机变量,其中i为虚单位。,2.特征函数的定义,设X是(实值)随机变量,则对任意实数t,,称为随机 变量X的特征函数,其中i为虚单位。,离散型r.v.和连续型r.v.的特征函数,3.离散型随机变量的特征函数,设离散型随机变量X的分布律为,则X 的特征函数为,4.连续型随机变量的特征函数,设连续型随机变量X的概率密度f (x),则X的特征函数为,XB(n,p), 特征函数=?,X服从泊松分布, 特征
8、函数=?,X服从均匀分布, 特征函数=?,特征函数的性质,二、特征函数的性质,性质5:特征函数与矩的关系,或,用特征函数计算矩求导数比较简便。,用定义计算矩求级数或积分比较繁琐。,P171例6,特征函数与分布函数的关系,四、特征函数与分布函数的关系,则对f(x)的连续点x1, x2,有,有定理可见,随机变量的分布函数与特征函数是以一对应的,因此特征函数同样可以完整地描述一个随机变量。Z在概率论中,概率分布于特征函数的一一对应性,是特征函数应用的理论基础。,定理4.5.2:设随机变量X的分布函数为 ,特征函数为,定理4.5.2:随机变量X的分布函数被它的特征函数唯一地确定。,例1:一盒晶体管10
9、0支,其直流放大倍数值与相应的个数如下:,的平均值:,一般,若随机变量X的分布律为,则X的平均值为,例,某种产品每件表面上的疵点数服从参数,的泊松分布,若规定疵点数不超过 1 个为一等品,值 10 元;,疵点数大于 1 个不多于 4 个为二等品,价值 8 元;,疵点数超过 4 个为废品,求:,(1) 产品的废品率;,(2) 产品价值的平均值.,解,由题意知,价,价,因为,所以产品的废品率为,所以产品价值的平均值为,例4(p139):设XB(n,p),求E(X).,解:,如果求和中没有k,则求和结果为1(概率的归一性)。希望把k取掉。先具体化组合数,求和结果为1(概率归一性),也可用另一法求得此
10、结果,见p150例6,例2(p138):设X(),试求E(X).,解:X的分布律,后面还可利用特征函数的性质来求得此EX,见p171例6.,解:,解:,用分部积分法,例10 假设市场上每年对我国某种出口商品的需求量是随机变量X(单位为吨),它在2000,4000内服从均匀分布,又设每售出这种商品1吨可为国家挣得外汇3万元,但若销售部出去而囤积于仓库,则每吨需浪费保养费1万元。问应组织多少货源才能使国家平均收益最大?,解:以代表某年准备出口此种产品的数量,Y为国家收益,则,X的概率密度为:,在准备货源为X吨时,国家平均收益为:,可见,当组织货源=3500吨时,国家平均收益E(Y)最大。,解:由于
11、X,Y独立同分布服从N(0,1),所以X,Y的联合概率密度为,例12 将不同地址的N封信随机地装入写有相应的N个不同地址的信封中去,求碰对地址信件数的数学期望。,解:令X为碰对地址的信件数。又令,第i封信碰对信封的概率为,可见,平均来说,N封信里只有1封信能碰对地址。,例: 设XB(n,p),求E(X).,解:题中的 X是n此试验中A(出现概率为p)出现的次数。令,显然,,独立同分布于参数为p的二点分布,即Xi的分布律为,契比雪夫不等式,此不等式称为契比雪夫不等式。,契比雪夫不等式是概率论诸多不等式中基本和重要的一个,从它可以看出,方差越小,随机变量的取值就以越大的概率集中在数学期望的附近,方
12、差的大小确实刻画了随机变量取值相对于数学期望的分散程度。,契比雪夫不等式的证明,例1(p155):X和Y的联合分布律及边缘分布律如下表,求cov(X,Y).,解:根据协方差的公式,答案,例2(p155):设(X,Y)在三角形区域,内服从均匀分布,试求cov(X,Y).,解:由题作出D如图。显然,D的面积为1/2,故(X,Y)的概率密度为,例4(p169):设X服从区间a,b上的均匀分布,即X的概率密度为,则X的特征函数为,例6(p171):设X(),利用特征函数求EX,EX2,DX.,解:已知X()下X的特征函数为,再结合特征函数的性质5,可见,求得的EX与当初用数学期望定义所得的结果一致,但当初涉及积分,现只需求导。,