1、不仅要考察分量随机变量的概率信息,还要考察分量随机变量之间的联系 完全描述 五种概率函数 边界概率函数和联合概率函数之间的关系 矩描述 均值向量 相关矩阵,协相关矩阵 相关矩、协相关矩、相关系数条件分布、条件期望是难点。,2.3 随机向量,样本空间标准化为高维欧氏空间 试验结果为一向量分类: 离散型随机向量 连续型随机向量 混合型随机向量,联合概率质量函数,联合概率分布函数,联合概率密度函数,以上为广义函数导数。,边界概率函数,分类 边界概率质量函数 边界概率分布函数 边界概率密度函数 边界概率特征(生成)函数 定义 低维随机变量的概率函数被称为边界概率函数 可以由高维随机变量的概率函数得到
2、概率质量:对其他维数的随机变量求和 概率分布:令其他维数的随机参数为无穷大 概率密度:对其他维数的随机变量积分 概率特征:令其他维数的随机参数为0,F(x,y)是变量x和y的不减函数, 即 对于任意固定的y, 当 x2x1时F(x2,y)F(x1,y); 对于任意固定的x, 当 y2y1时F(x,y2)F(x,y1). 2. 0F(x,y)1, 且 对于任意固定的y, F(-,y)=0, 对于任意固定的x, F(x,-)=0, 3. F(-,-)=0, F(+, +)=1. 4. FX(x)=F(x, + ), FY(y)=F(+,y )5. F(x,y)关于x和关于y都右连续. 6. 任给(
3、x1,y1),(x2,y2), x1x2, y1y2, Px1Xx2, y1Yy2= F(x2,y2)-F(x2,y1)+F(x1,y1)-F(x1,y2)0,二维分布函数性质2.6,练习:证明性质2.6(6),x1X x2, y1Y y2的概率为 Px1X x2, y1Y y2 =F(x2,y2)-F(x2,y1)+F(x1,y1)-F(x1,y2).,3. 设G是xOy平面上的区域, 点(X,Y)落在G内的概率为,按定义, 概率密度 f(x,y) 具有以下性质2.7: 1. f(x,y)0.,(1)求分布函数F(x,y); (2)求概率PYX. 解 (1),类似例 设二维随机变量(X,Y)
4、具有概率密度,(2) 将(X,Y)看作是平面上随机点的坐标, 即有 YX=(X,Y)G, 其中G为xOy平面上直线y=x及其下方的部分,于是,x,y,O,G,其中:D为可度量的平面区域,SD为区域D的面积.,则称(X,Y)服从区域D上的均匀分布.,(1) 均匀分布 若二维随机向量(X,Y)的联合概率密度为,对于D中任意可度量子区域G有,其中:SG为区域G的面积.,常见的二维连续型随机向量,例设随机向量(X,Y)服从区域D上的均匀分布, 其中 D=(x,y),x2+y21,求X,Y的边缘密度函数f1(x)和f2(y).,解 (1)由题意得:,-1,1,当|x|1时,f(x,y)=0,所以,f1(
5、x)=0,当|x|1时,同理,均匀分布的边缘密度不再是一维均匀分布,则称(X,Y)服从参数为 的二维正态分布,简记为,二维正态分布,则X,Y的边缘概率密度分别为XN(1,12), Y N(2,22);,可以证明 若,即 二维正态分布(X,Y)的边缘概率密度是一维正态分布. 由此可知随机向量的联合概率密度完全决定了它的边缘概率密度,反之不一定成立.,例2,其中m1,m2,s1,s2,r都是常数,且s10,s20, |r|1.称(X,Y)为服从参数m1,m2,s1,s2,r的二维正态分布, 记为(X,Y)N(m1,m2,s12,s22,r). 试求二维正态随机变量的边缘概率密度.,2.44 P96
6、二维随机变量(X,Y)的概率密度为,现要将上式用矩阵形式表示, 引入下面列矩阵:,二维正态随机变量(X1,X2)的概率密度为,(X1,X2)的协方差矩阵为,它的行列式det C=s12s22(1-r2), C的逆阵为,可以证明,于是(X1,X2)的概率密度可写成,det C=s12s22(1-r2),N维正态随机变量,n 维正态随机变量(X1,X2,.,Xn)的概率密度为,n 维正态随机变量(X1,X2,.,Xn)的特征函数为,概率特征函数,相当于多元F变换再反转。多元F变换相当于多次一元F变换。 由F变换的性质,概率生成函数与概率质量函数互相唯一确定-完全信息,特征函数的性质,证明,例3,复
7、习,复习,例4,练习 2. 45 P96,例设二维随机向量(X,Y)的联合概率密度为,求(X,Y)关于X,Y的边缘概率密度.,解,同理可得,X,Y的边缘概率密度为一维正态分布.,所以,边缘概率密度为一维正态分布的二维随机向量不一定是二维正态分布.,后者被积函数是奇函数,-例 设(X,Y),试求:(1)常数 A ;(2)P X2, Y1;,(4),解 (1),所以, A=6,=A/6,=1,(3)P(X,Y)D,其中D为 2x+3y6.,所以,P X2,Y1=,2,1,X2, Y1,(3)P(X,Y)D,其中D为 2x+3y6.,3,2,2x+3y=6,(4),x,y,所以, 当x0,y0时,即
8、:,随机向量和随机变量的关系,随机向量包含了单个分量随机变量的完全信息-边缘分布可由联合分布求出。 随机向量还包含单个分量随机变量之间的相关信息,随机变量间的关系,独立性定义 条件概率分布函数条件概率密度函数条件期望,独立性,定理:若X与Y相互独立,则它们的连续函数g(X )与h(Y)也相互独立。特别有 aX+b与cY+d相互独立。,例 设(X,Y)服从区域D上的均匀分布,判断X,Y的独立性,其中(1)D=(x,y),|x|1,|y|1;(2)D=(x,y),x2+y21,fX(x)=,|x|1,|x|1,0,fY(y)=,解 (1),同理,所以,X,Y独立.,(2),X,Y不独立.,-例 已
9、知随机向量(X,Y)的联合密度为,(1)问X与Y是否独立?(2)求概率PXY.,解 (1),(2)P(XY)=,所以,X,Y独立.,2.3.2 数字特征,8. 设(X,Y)服从0,a0,a上的均匀分布,求E|X-Y|.,解 由题意得,得,根据,a,a,y=x,x-y0,x-y0,S1,S2,例. 设,求 Z= 1/Y 的数学期望EZ.,解 EZ=E(1/Y)=,EZ,联合矩,Schwartz不等式,相关系数,性质,XY是一个可以用来表征X,Y之间线性关系紧密程度的量. 当|XY |较大时, 通常说X,Y线性相关的程度较好; 当|XY |较小时, 说X,Y线性相关的程度较差. 当 XY =0时,
10、 称X和Y不相关. 如X,Y相互独立, 则必不相关. 但X,Y不相关, 却不一定相互独立.若(X,Y)服从二维正态分布,则X,Y独立X,Y不相关.,例 5,n维向量,两个向量,例 2. 50 P56,例 7,2.3.3 条件概率函数,取A=Y=y, 设fY(y)0, 给定y, 对于一固定的非常小的正数0, 如 Py0,复习,例 设二维随机变量(X,Y)在圆域x2+y21上服从均匀分布, 求条件概率密度fX|Y(x|y).,解 由假设随机变量(X,Y)具有概率密度,于是当 -1y1 时有,对任意给定的值x(0x1), 在X=x条件下, Y的条件概率密度为,例8 设数 X 在区间(0,1)上均匀地
11、取值, 当观察到 X=x (0x1) 时, 数 Y 在区间 (x,1) 上均匀地取值. 求 Y 的概率密度 fY(y). 解: 按题意 X 具有概率密度,于是得关于Y 的边缘概率密度为,X和Y的联合概率密度为,条件数字特征,条件数字性质,证明2,例9: 一矿工困在矿井中,要到达安全地带,有三个通道可选择,他从第一个通道出去要走3个小时可到达安全地带,从第二个通道出去要走5个小时又返回原处,从第三个通道出去要走7个小时也返回原处。设任一时刻都等可能地选中其中一个通道,试问他到达安全地点平均要花多长时间。,解:设X表示矿工到达安全地点所需时间,Y表示他选定的通道,则由全期望公式可知,例 设在某一天
12、内走进一个商店的人数是数学期望等于100的随机变量,又设这些顾客所花的钱都为数学期望是10元的相互独立的随机变量,再设一个顾客化钱时和进入该商店的总人数独立,试问在给定的一天内,顾客们在该店所化钱的期望值为多少?,解:设N 表示进入该店的顾客人数,Xi 表示第i个顾客所花的钱数,则N 个顾客所花钱的总数为,则一天内顾客们在该店所化钱的期望值是,它说明顾客们花费在该店钱数的期望值为1000元。,通常当我们观察到 X=x 时,E(Y |X=x) 是一切对Y的估值中均方误差最小的一个(最佳近似),我们称之为Y关于X的回归。,两边利用X的密度取数学期望,由全期望公式即得证。,通常当我们观察到 X=x
13、时,E(Y |X=x) 是一切对Y的估值中均方误差最小的一个(最佳近似),我们称之为Y关于X的回归。,例10: 设身高为x(cm)的男子,其成年儿子的身高服从均值为 x+3,方差为10的正态分布,问身高为175cm的男子,其成年儿子的身高的最佳预测值是多少?,解:令X表示父亲身高,Y 表示儿子身高,则,N(0,10),与X独立,Y的最佳预测是,即其成年儿子的身高的最佳预测值是178cm。,求条件数学期望的一般步骤,先写出固定条件(如Y=yj)的情况下X的条件分布律或条件密度函数; 根据条件数学期望的定义,通过求和或积分得到条件下的数学期望; 将条件(Y=yj)替换成一般情况下的随机变量(Y),例,将x替换成X,11,作业,