1、2.1 随机变量及其分布 2.2 随机变量的数学期望 2.3 随机变量的方差与标准差 2.4 常用离散分布 2.5 常用连续分布 2.6 随机变量函数的分布 2.7 分布的其他特征数,第二章 随机变量及其分布,2.1 随机变量及其分布,(1) 掷一颗骰子, 出现的点数 X 1,2,6.(2) n个产品中的不合格品个数 Y 0,1,2,n(3) 某商场一天内来的顾客数 Z 0,1,2,(4) 某种型号电视机的寿命 T : 0, +),2.1.1 随机变量的定义,定义2.1.1设 =为某随机现象的样本空间,称定义在上的实值函数X=X()为随机变量.,注 意 点 (1),(1) 随机变量X()是样本
2、点的函数,,其定义域为 ,其值域为R=(,),若 X 表示掷一颗骰子出现的点数, 则 X=1.5 是不可能事件.,(2) 若 X 为随机变量,则X = k 、 a X b 、均为随机事件.,即 a X b =;a X() b ,注 意 点 (2),(3) 注意以下一些表达式:,X = k= X kX k;,a X b = X bX a;, X b = X b.,(4) 同一样本空间可以定义不同的随机变量.,若随机变量 X 可能取值的个数为有限个或可列个,则称 X 为离散随机变量. 若随机变量 X 的可能取值充满某个区间a, b,则称 X 为连续随机变量. 前例中的 X, Y, Z 为离散随机变
3、量;而 T 为连续随机变量.,两类随机变量,定义2.1.2 设X为一个随机变量,对任意实数 x, 称 F(x)=P( X x) 为 X 的分布函数. 基本性质:(1) F(x) 单调不降;(2) 有界:0F(x)1,F()=0,F(+)=1;(3) 右连续.,2.1.2 随机变量的分布函数,2.1.3 离散随机变量的分布列,设离散随机变量 X 的可能取值为: x1,x2,xn,称 pi=P(X=xi), i =1, 2, 为 X 的分布列. 分布列也可用表格形式表示:,X x1 x2 xn ,P p1 p2 pn ,分布列的基本性质,(1) pi 0,(2),(正则性),(非负性),注 意 点
4、 (1),求离散随机变量的分布列应注意:,(1) 确定随机变量的所有可能取值;,(2) 计算每个取值点的概率.,注 意 点 (2),对离散随机变量的分布函数应注意:,(1) F(x)是递增的阶梯函数;,(2) 其间断点均为右连续的;,(3) 其间断点即为X的可能取值点;,(4) 其间断点的跳跃高度是对应的概率值.,例2.1.1,已知 X 的分布列如下:,X 0 1 2,P 1/3 1/6 1/2,求 X 的分布函数.,解:,X 0 1 2,P 0.4 0.4 0.2,解:,例2.1.2,已知 X 的分布函数如下,求 X 的分布列.,2.1.4 连续随机变量的密度函数,连续随机变量X的可能取值充
5、满某个区间 (a, b). 因为对连续随机变量X,有P(X=x)=0,所以无法仿离散随机变量用 P(X=x) 来描述连续随机变量X的分布. 注意离散随机变量与连续随机变量的差别.,定义2.1.4,设随机变量X 的分布函数为F(x),则称 X 为连续随机变量,,若存在非负可积函数 p(x) ,满足:,称 p(x)为概率密度函数,简称密度函数.,密度函数的基本性质,满足(1) (2)的函数都可以看成某个连续随机变量的概率密度函数.,(非负性),(正则性),注意点(1),(1),(2) F(x) 是 (, +) 上的连续函数;(3) P(X=x) = F(x)F(x0) = 0;,(4) PaXb
6、= PaXb= PaXb= PaXb= F(b)F(a).,注意点(2),(5) 当F(x) 在x点可导时, p(x) =,当F(x) 在x点不可导时, 可令p(x) =0.,连续型,密度函数 X p(x)( 不唯一 ),2.,4. P(X=a) = 0,离散型,分布列: pn = P(X=xn) ( 唯一 ),2. F(x) =,3. F(a+0) = F(a); P(aXb) = F(b)F(a).,4. 点点计较,5. F(x)为阶梯函数。,5. F(x)为连续函数。,F(a0) = F(a).,F(a0) F(a).,例2.1.3,设 X ,求 (1) 常数 k. (2) F(x).,
7、(1) k =3.,(2),解:,例2.1.4,设 X ,求 F(x).,解:,设X与Y同分布,X的密度为,已知事件 A = X a 和 B = Y a 独立,,解: 因为 P(A) = P(B),P(AB) = P(A)+P(B)P(A)P(B),从中解得,且 P(AB)=3/4,求常数 a .,且由A、B 独立,得,= 2P(A) P(A)2 = 3/4,从中解得: P(A)=1/2,由此得 0a 2 ,因此 1/2 = P(A) = P( X a ),例2.1.5,设 X p(x),且 p(x) = p(x),F(x)是 X 的分布函数, 则对任意实数 a0,有( ) F(a) =1 F
8、(a)= F(a) = F(a) F(a) = 2F(a) 1,课堂练习,2.2 随机变量的数学期望,分赌本问题(17世纪) 甲乙两赌徒赌技相同,各出赌注50元. 无平局,谁先赢3局,则获全部赌注. 当甲赢2局、乙赢1局时,中止了赌博. 问如何分赌本?,两种分法,1. 按已赌局数分: 则甲分总赌本的2/3、乙分总赌本的1/32. 按已赌局数和再赌下去的“期望” 分: 因为再赌两局必分胜负,共四种情况: 甲甲、甲乙、乙甲、乙乙 所以甲分总赌本的3/4、乙分总赌本的1/4,2.2.1 数学期望的概念,若按已赌局数和再赌下去的“期望” 分, 则甲的所得 X 是一个可能取值为0 或100的随机变量,其
9、分布列为:,X 0 100,P 1/4 3/4,甲的“期望” 所得是:01/4 +100 3/4 = 75.,2.2.2 数学期望的定义,定义2.2.1 设离散随机变量X的分布列为 P(X=xn) = pn, n = 1, 2, .若级数,绝对收敛,则称该级数为X 的,数学期望,记为,连续随机变量的数学期望,定义2.2.2 设连续随机变量X的密度函数为p(x), 若积分,绝对收敛,则称该积分为X 的,数学期望,记为,例2.2.1,则,E(X) =,10.2+00.1+10.4+20.3 = 0.8.,X 1 0 1 2,P 0.2 0.1 0.4 0.3,数学期望简称为期望. 数学期望又称为均
10、值. 数学期望是一种加权平均.,注 意 点,2.2.3 数学期望的性质,定理2.2.1 设 Y=g(X) 是随机变量X的函数,若 E(g(X) 存在,则,例2.2.2 设随机变量 X 的概率分布为,求 E(X2+2).,= (02+2)1/2+(12+2)1/4+(22+2)1/4,= 1+3/4+6/4 = 13/4,解: E(X2+2),X 0 1 2,P 1/2 1/4 1/4,数学期望的性质,(1) E(c) = c,(2) E(aX) = aE(X),(3) E(g1(X)+g2(X) = E(g1(X)+E(g2(X),例2.2.3,设 X ,求下列 X 的函数的数学期望.,(1)
11、 2X1, (2) (X 2)2,解: (1) E(2X 1) = 1/3,(2) E(X 2)2 = 11/6.,2.3 随机变量的方差与标准差,数学期望反映了X 取值的中心. 方差反映了X 取值的离散程度.,2.3.1 方差与标准差的定义,定义2.3.1 若 E(XE(X)2 存在,则称 E(XE(X)2 为 X 的方差,记为,Var(X)=D(X)= E(XE(X)2,(2) 称,注 意 点,X = (X)=,(1) 方差反映了随机变量相对其均值的偏离程度.方差越大, 则随机变量的取值越分散.,为X 的标准差.,标准差的量纲与随机变量的量纲相同.,2.3.2 方差的性质,(1) Var(
12、c)=0. 性质 2.3.2,(2) Var(aX+b) = a2 Var(X). 性质 2.3.3,(3) Var(X)=E(X2)E(X)2. 性质 2.3.1,例2.3.1 设 X , 求 E(X), Var(X).,解: (1) E(X)=,= 1,(2) E(X2) =,= 7/6,所以,Var(X) = E(X2)E(X)2,= 7/6 1 = 1/6,课堂练习,问题:Var(X) = 1/6, 为什么?,随机变量的标准化,设 Var(X)0, 令,则有 E(Y)=0, Var(Y)=1.,称 Y 为 X 的标准化.,2.3.3 切比雪夫不等式,设随机变量X的方差存在(这时均值也存
13、在),则 对任意正数,有下面不等式成立,例2.3.2 设 X,证明,证明:,E(X) =,= n+1,E(X2) =,= (n+1)(n+2),所以,Var(X) = E(X2)(EX)2 = n+1,(这里, = n+1),由此得,定理 2.3.2,Var(X)=0,P(X=a)=1,2.4 常用离散分布,2.4.1 二项分布 记为 X b(n, p). X为n重伯努里试验中“成功”的次数,当n=1时,称 b(1, p) 为 0-1分布.,试验次数为 n=4,“成功”即取得合格品的概率为 p=0.8,所以, X b(4, 0.8),思考: 若 Y 为不合格品件数,Y ?,Y b(4, 0.2
14、),一批产品的合格率为0.8, 有放回地抽取4次, 每次一件, 则取得合格品件数 X 服从二项分布.,例2.4.1 设X b(2, p), Y b(4, p),已知 P(X1) = 8/9, 求 P(Y1).,解: 由 P(X1) = 8/9 ,知 P(X=0) = 1/9.,由此得: P(Y1) = 1 P(Y=0),所以 1/ 9 = P(X=0) =(1p)2,,从而解得: p = 2/3.,= 1- (1p)4 = 80/81.,若随机变量 X 的概率分布为,则称 X 服从参数为 的泊松分布,记为 X P().,2.4.2 泊松分布,泊松定理,定理2.4.1,(二项分布的泊松近似),在
15、n重伯努里试验中,记 pn 为一次试验中 成功的概率.,若 npn ,则,记为 X h(n, N, M).,超几何分布对应于不返回抽样模型 :,N 个产品中有 M 个不合格品,,从中抽取n个,不合格品的个数为X .,2.4.3 超几何分布,记为 X Ge(p),X 为独立重复的伯努里试验中,“首次成功”时的试验次数.,几何分布具有无记忆性,即:,P( X m+n | X m ) = P( X n ),2.4.4 几何分布,负二项分布(巴斯卡分布),记为X Nb(r, p).,X 为独立重复的伯努里试验中,“第 r 次成功”时的试验次数.,注 意 点,(1) 二项随机变量是独立 0-1 随机变量
16、之和.,(2) 负二项随机变量是独立几何随机变量之和.,常用离散分布的数学期望,几何分布Ge(p) 的数学期望 = 1/p,0-1 分布的数学期望 = p,二项分布 b(n, p)的数学期望 = np,泊松分布 P() 的数学期望 = ,常用离散分布的方差,0-1 分布的方差 = p(1p),二项分布 b(n, p)的方差 = np(1p),泊松分布 P() 的方差= ,几何分布Ge(p) 的方差 = (1p)/p2,2.5 常用连续分布,正态分布、均匀分布、指数分布、 伽玛分布、贝塔分布。,记为X N(, 2),其中 0, 是任意实数., 是位置参数., 是尺度参数.,2.5.1 正态分布,
17、y,x,O,正态分布的性质,(1) p(x) 关于 是对称的.,p(x),x,0,在 点 p(x) 取得最大值.,(2) 若 固定, 改变,(3) 若 固定, 改变,大,p(x)左右移动,形状保持不变., 越大曲线越平坦;, 越小曲线越陡峭.,p(x),x,0,x,x,标准正态分布N(0, 1),密度函数记为 (x),分布函数记为 (x).,(x) 的计算,(1) x 0 时, 查标准正态分布函数表.,(2) x 0时, 用,若 X N(0, 1), 则 (1) P(X a) = (a);(2) P(Xa) =1(a);(3) P(aXb) = (b)(a);(4) 若a 0, 则P(|X|a
18、) = P(aXa) = (a)(a)= (a) 1 (a) = 2(a)1,例2.5.1 设 X N(0, 1), 求P(X1.96) , P(|X|1.96),= 1 (1.96),= 1(1 (1.96),= 0.975 (查表得),= 2 (1.96)1,= 0.95,= (1.96),解: P(X1.96),P(|X|1.96),= 2 0.9751,设 X N(0, 1), P(X b) = 0.9515,P(X a) = 0.04947, 求 a, b.,解: (b) = 0.9515 1/2,所以 b 0,反查表得:(1.66) = 0.9515,故 b = 1.66,而 (a
19、) = 0.0495 1/2, 所以 a 0,(a) = 0.9505, 反查表得:(1.65) = 0.9505,故 a = 1.65,例2.5.2,一般正态分布的标准化,定理2.5.1 设 X N(, 2),则 Y N(0, 1).,推论:,若 X N(, 2), 则,若 X N(, 2), 则P(Xa) =,设 X N(10, 4), 求 P(10X13), P(|X10|2).,解: P(10X13) = (1.5)(0),= 0.9332 0.5,P(|X10|2) =,P(8X12),= 2(1)1,= 0.6826,= 0.4332,例2.5.3,设 X N(, 2), P(X
20、5) = 0.045, P(X 3) = 0.618, 求 及 .,例2.5.4, = 1.76 =4,解:,已知 X N(3, 22), 且 PXk = PXk, 则 k = ( ).,3,课堂练习(1),设 X N(, 42), Y N(, 52), 记 p1 = PX 4,p2 = PY +5, 则( ) 对任意的 ,都有 p1 = p2 对任意的 ,都有 p1 p2,课堂练习(2),设 X N( , 2), 则随 的增大,概率 P| X | ( ) 单调增大 单调减少 保持不变 增减不定,课堂练习(3),正态分布的 3 原则,设 X N(, 2), 则,P( | X | ) = 0.6
21、828.,P( | X | 2 ) = 0.9545.,P( | X | 3 ) = 0.9973.,记为X U(a, b),2.5.2 均匀分布,X U(2, 5). 现在对 X 进行三次独立观测,试求至少有两次观测值大于 3 的概率.,解:,记 A = X 3 ,则 P(A) = P( X 3) = 2/3,设 Y 表示三次独立观测中 A 出现的次数,则 Y b(3, 2/3),所求概率为,P(Y2) =,P(Y=2)+P(Y=3),=20/27,例2.5.5,2.5.3 指数分布,记为 X Exp(),其中 0.,特别:指数分布具有无忆性,即:,P( X s+t | X s )=P( X
22、 t ),2.5.4 伽玛分布,记为 X Ga(, ),其中 0, 0.,为伽玛函数.,称,注意点,(1),(1) = 1, (1/2) =,(n+1) = n!,(2),Ga(1, ) = Exp(),Ga(n/2, 1/2) = 2(n),2.5.5 贝塔分布,记为 X Be(a, b),其中a 0,b 0.,称,为贝塔函数.,注意点,(1),(2),B(a, b) =B(b, a),B(a, b) =(a)(b) /(a+b),(3),Be(1, 1) = U(0, 1),常用连续分布的数学期望,均匀分布 U(a, b) : E(X) = (a+b)/2,指数分布 Exp() : E(X
23、) = 1/,正态分布 N(, 2) : E(X) = ,伽玛分布 Ga(, ) : E(X) = /,贝塔分布 Be(a, b) : E(X) = a/(a+b),常用连续分布的方差,均匀分布 U(a, b) 的方差 = (b a)2/12,指数分布 Exp() 的方差= 1/2,正态分布 N(, 2) 的方差= 2,例2.5.6 已知随机变量 X 服从二项分布,且 E(X)= 2.4, Var(X)=1.44, 则参数 n, p 的值为多少?,例2.5.7 设 X 表示 10 次独立重复射击命中目标 的次数,每 次射中目标的概率为0.4, 则 E(X2)的值为多少?,解:从 2.4= np
24、, 1.44 = np(1p) 中解得,解:因为 E(X) = np = 4, Var(X)= 2.4, 所以,n=6, p=0.4.,E(X2) = Var(X)+(E(X)2= 2.4+16=18.4,设 E(X)=,Var(X)=2,则对任意常 数 C, 必有( ).,课堂练习,2.6 随机变量函数的分布,问题:已知 X 的分布,求 Y = g(X) 的分布。,例如: Y1 = 4X +3; Y2 = |X|; Y3 = X2 .,当 X 为离散随机变量时, Y = g(X) 为离散随机变量.,将g(xi) 一一列出, 再将相等的值合并即可.,2.6.1 离散随机变量函数的分布,2.6.
25、2 连续随机变量函数的分布,定理2.6.1 设 X pX(x),y = g(x) 是 x 的严格 单调函数,记 x = h(y) 为 y = g(x) 的反函数, 且h(y)连续可导,则Y = g(X)的密度函数为:,例2.6.1 设 X ,求 Y =eX 的分布.,y = ex 单调可导,反函数 x = h(y) = lny,所以当 y 0 时,由此得,解:,正态变量的线性不变性,定理2.6.2 设 X N (, 2),则当a 0 时,Y = aX+b N (a +b, a22).,由此得: 若 X N (, 2),则 Y = (X )/ N(0, 1).,对数正态分布,定理2.6.3 设
26、X N (, 2),则 Y = e X 的服从,伽玛分布的有用结论,定理2.6.4 设 X Ga (, ),则当k 0 时, Y = kX Ga (, /k).,均匀分布的有用结论,定理2.6.5 设 X FX (x),若FX (x)为严格单调增的连 续函数,则Y = FX (X) U(0, 1).,2.7 分布的其它特征数,矩、变异系数、分位数、中位数,2.7.1 k 阶原点矩和中心矩,k 阶原点矩:k = E(Xk) , k = 1, 2, .,注意: 1 = E(X).,k 阶中心矩:k = EXE(X)k , k = 1, 2, .,注意: 2 = Var(X).,定义2.7.1,2.
27、7.2 变异系数,定义2.7.2,为 X 的变异系数.,作用:,称,CV 是无量纲的量, 用于比较量纲不同的两个随机变量的波动大小.,2.7.3 分位数,P( X xp ) = F(xp) = p,定义2.7.3,设 0 p 1,,若 xp 满足,则称 xp 为此分布 p - 分位数,,亦称 xp 为下侧 p - 分位数.,注 意 点,(1) 因为 X 小于等于 xp 的可能性为 p ,所以 X 大于 xp 的可能性为 1 p .,(2) 对离散分布不一定存在 p - 分位数.,(3),上侧 p - 分位数,若记 xp 为上侧 p - 分位数,即,则,P(X xp) = p,2.7.4 中位数,定义2.7.4,称 p = 0.5 时的p 分位数 x0.5 为中位数.,中位数与均值,相同点:都是反映随机变量的位置特征.,不同点:,含义不同.,统计中常用的 p - 分位数,(1) N(0, 1): Z , U,(2) 2(n):,(3) t (n):,(4) F (n, m):,