1、第二章 随机变量及其分布教学目的与教学要求:理解随机变量的概念;掌握离散和连续随机变量的描述方法;理解分布函数、概率分布列和概率密度函数的概念和性质;会利用概率分布计算有关事件的概率;掌握二项分布、泊松分布、正态分布、指数分布、均匀分布等;会求简单随机变量函数的概率分布及特征数。教学重点:不同类型的随机变量的概率分布的概念和性质、常用的离散和连续分布、随机变量的数学期望与方差的概念和性质、随机变量函数的分布。教学难点:概率分布和数学期望以及方差性质的应用、随机变量函数的分布。教学措施:理论部分的教学多采用讲授法,注意思想方法的训练,计算类问题采用习题与讨论的方法进行教学。教学时数:20 学时教
2、学过程:2.1 随机变量及其分布例 2.1.1 (1) 掷一颗骰子,出现的点数 :1、2、6;X(2) 个产品中的不合格品个数 :0、1、2、 ;nYn(3) 某商场一天内来的顾客数 :0、1、2、;Z(4) 某种型号电视机的寿命 : 。T,)2.1.1 随机变量的概念定义 2.1.1 定义在样本空间 上的实值函数称为随机变量,常用大写 、X、 等表示;随机变量的取值用小写字母 、 、 等表示。YZxyz注意:(1) 随机变量 是样本点 的函数,其定义域为 ,其值域为()X,若 表示掷一颗骰子出现的点数,则 是不可能事件;(,)R 1.5X(2) 若 为随机变量,则 、 、均为随机事件,即:X
3、kab;:()abab(3) 注意以下一些表达式: kkaXbXa(4) 同一样本空间可以定义不同的随机变量。两类随机变量:若随机变量 可能取值的个数为有限个或可列个,则称 为离散随机变量;XX若随机变量 的可能取值充满某个区间 ,则称 为连续随机变量,其中X(,)abX可以是 , 可以是 。前例 2.1.1 中的 、 、 为离散随机变量;而abYZ为连续随机变量。T2.1.2 随机变量的分布函数定义 2.1.2 设 是一个随机变量,对任意实数 ,称Xx()Fxp为随机变量 的分布函数,且称 服从 ,记为 ,有时也可用()F()XF表明是 的分布函数。()Xx定理 2.1.1 任一个分布函数
4、都有如下三条基本性质:()x(1) 单调性: 是定义在整个实数轴 上的单调非减函数,即对()Fx(,)任意的 ,有 ;12x12(2) 有界性: ,有 ,且x0()1x()lim()xF(3) 右连续性: 是 的右连续函数,即对任意的 ,有()Fx 0x00li()x即: 。()x注:(1) 上述三条可以作为判断一个函数是否为分布函数的充要条件;(2) 有了分布函数的定义,可以计算:()()paXbFa0等。()1()2.1.3 离散随机变量的概率分布列定义 2.1.3 设 是一个离散随机变量,如果 的所有可能取值是 、XX1x、 、,则称 取 的概率2xnix()iiipxXx(1,2,)i
5、n 为 的概率分布列或简称为分布列,记为 。XiXp分布列也可用下列形式表示: 1x2x nxp()()p ()p分布列的基本性质:(1) 非负性: ()0ix(1,2)i(2) 正则性: 。1iip注:(1) 上述两条可以作为判断一个数列是否为分布列的充要条件;(2) 离散随机变量的分布函数为: 。()()iixFp求离散随机变量的分布列应注意:(1) 确定随机变量的所有可能取值;(2) 计算每个取值点的概率。对离散随机变量的分布函数应注意:(1) 是递增的阶梯函数;()Fx(2) 其间断点均为右连续的;(3) 其间断点即为 的可能取值点;X(4) 其间断点的跳跃高度是对应的概率值。例 2.
6、1.2 已知 的分布列如下:0 1 2p136求 的分布函数?X解:。0131()22xFx例 2.1.3 已知 的分布函数如下,求 的分布列?XX00.41()821xFx解: 的分布列如下:X0 1 2p0.4 0.4 0.22.1.4 连续随机变量的概率密度函数因为连续随机变量 的可能取值充满某个区间 ,所以对连续随机变量X(,)ab,有 ,从而无法仿离散随机变量用 来描述连续随机变X()0pcpXc量 的分布;定义 2.1.4 设随机变量 的分布函数为 ,如果存在实数轴上的一个()Fx非负可积函数 ,使得对任意实数 ,有()pxx()Ftd则称 为连续随机变量,称 为 的概率密度函数,
7、简称为密度函数。X()pxX密度函数的基本性质:(1) 非负性: ;()0(2) 正则性: 。1pxd注:(1) 上述两条可以作为判断一个函数是否为密度函数的充要条件;(2) ;()()bapaX(3) 是 上的连续函数;Fx,(4) ;()(0)xF(5) ;()()()paXbpabpaXbpabFa(6) 当 在 点可导时, ,当 在 点不可导时,()xxFx。()0x离散随机变量与连续随机变量对比:离散随机变量 连续随机变量分布列: (唯一)()iipXx密度函数: (不唯一)()Xpx)iixFFtd且(0)a()()paba点点计较 ()0pXa为阶梯函数,即:()Fx(0)a为连
8、续函数,即:)Fx()例 2.1.4 设 ,求(1) 常数 ;(2) ?30xkeXpk(Fx解:(1) ;3k(2) 。1()00xeF例 2.1.5 设 ,求 ?()101pxxX其 它 ()Fx解: 。2010() 11xxFx例 2.1.6 设 与 同分布, 的密度为XYX2302()8xxp其 它已知事件 和 独立,且 ,求常数 ?AXaBYa3()4pABa解:因为 ,且 、 独立,得()pA2()2()p再由 解得:3)4AB1由此得 02a因此321()8aapXxd从中解得 。34a2.2 随机变量的数学期望2.2.1 数学期望的概念例 2.2.1(分赌本问题)若甲乙两赌徒赌
9、技相同,各出赌注 50 元,无平局,谁先赢 3 局,则获全部赌注,当甲赢 2 局、乙赢 1 局时,中止了赌博,问如何分赌本?赌本有两种分法:(1) 按已赌局数分:则甲分总赌本的 、乙分总赌本的 ;33(2) 按已赌局数和再赌下去的“期望”分:设再赌下去,则再赌两局必分胜负,共四种情况:甲甲、甲乙、乙甲、乙乙。于是,甲的所得 是一个可能X取值为 0 或 100 的随机变量,其分布列为: X0 100p1434甲的“期望”所得是: 。130754这就是数学期望的由来,又称期望或均值,数学期望是一种加权平均。2.2.2 数学期望的定义定义 2.2.1 设离散随机变量 的分布列为X()(iipXx(1
10、,2,)in 若 ,则称 为随机变量 的数学期望,简称期1|iii1)(iiExpX望或均值。若级数 不收敛,则称 的数学期望不存在。1|()iiixp定义 2.2.2 设连续随机变量 的密度函数为 ,若 ,X()px|()xpd则称 为随机变量 的数学期望,简称期望或均值。若级数()()EXxpd不收敛,则称 的数学期望不存在。|x例 2.2.2 设随机变量 的分布列如下:X10 1 2p0.2 0.1 0.4 0.3求 ?()EX解: 。10.2.10.42.3082.2.3 数学期望的性质定理 2.2.1 设随机变量 的分布用分布列 或用密度函数 表示,X()ipx()px若 的某一函数
11、 的数学期望 存在,则X()g()Eg。1()()iiixpEd例 2.2.3 设随机变量 的概率分布为:X0 1 2p1244求 ?2()EX解: 2221(0)(1)()。3614数学期望的性质:(1) 若 是常数,则 ;c()Ec(2) 对任意的常数 ,有 ;a()Xa(3) 对任意的两个函数 、 ,有1()gx212()()()EgXE例 2.2.4 设 ,求下列 的函数的数学期望01xp其 它 X(1) ;(2) ?21X2()解:(1) ;3E(2) 。2()62.3 随机变量的方差与标准差数学期望只能反映平均值即 取值的中心,有很大的局限性,在一些情况X下,仅知道平均值是不够的,
12、还要讨论随机变量与其平均值的偏离程度,用什么量去表示随机变量 与其数学期望的偏离程度呢?显然,可用随机变量的平均值 来表示 与 的偏离程度,但为了数字|()|XE(|)|E()EX上处理的方便,通常用 来表示 与 的偏离程度。2()EXX()E2.3.1 方差与标准差的定义定义 2.3.1 若随机变量 的数学期望 存在,则称偏差平方22()的数学期望 为随机变量 (或相应分布)的方差,记2()XE()EXX为 221()()()i iixEpxVar Xd在 离 散 场 合在 连 续 场 合称方差的正平方根 为 (或相应分布)的标准差,记为 或 。()VarX()X注意:(1) 方差反映了随机
13、变量相对其均值的偏离程度。方差越大,则随机变量的取值越分散。(2) 标准差的量纲与随机变量的量纲相同。2.3.2 方差的性质性质 2.3.1 。22()()VarXEX性质 2.3.2 若 为常数,则 。c0Varc性质 2.3.3 若 、 为常数,则 。b2()()baVrX例 2.3.1 设 ,求 和 ?()120pxxX其 它 ()E()解: 121()()()Edxdx;3123201|xx;23017()()()6Xpxx 。2276VarEX随机变量的标准化:设 ,令()0()XYVar则有 、 ,称 为 的标准化。()0EY()1VarYX2.3.3 切比雪夫不等式定理 2.3.
14、1(切比雪夫不等式)设随机变量 的数学期望和方差都存在,则对任意的常数 ,有0或 。2()(|)|VarXpXE2()(|)|1VarXpEX定理 2.3.2 若随机变量 的方差存在,则 的充要条件是 几乎(0处处为某个常数,即 。()1pa2.4 常用离散分布2.4.1 二项分布定义 如果随机变量 的分布列为X()(1)knknpXCp(0,1.)n则称这个分布为二项分布,记为 。,bp当 时,称 为二点分布或 分布。(,)b例 2.4.1 设 、 ,已知 ,求 ?2Xp(4,)Y8(1)9X(1)pY解:由 知 ,于是8(1)9p109022C从而解得 ,所以3。044(1)()1(23)
15、801pYpC二项分布的数学期望与方差:设 ,令 ,则(,)Xbnq011!()nnk knk kEpppq nk nqk1 )()!()!(nkknkqpC1)1(1n)(又因 2211!()()nk knnkEXpqkpq nkknnk 11 )!()!() pqpnkpn knk 2 )2(2)!()2(!)(qCnkk2)()1( npppn2)1()(于是 。22 2()VarXEXnpq2.4.2 泊松分布定义 如果随机变量 的分布列为()!kpXe(0,1.)其中参数 ,则称这个分布为泊松分布,记为 。0()XP泊松分布的数学期望与方差:设 ,则()XP100!()!kkkEpe
16、e 又因 2200()()!k kkkX 2210()!()!kkkee22于是 。22()()VarXEX二项分布的泊松近似:在二项分布中,当 较大时,直接计算是很麻烦的,下面我们给出一个当nn 很大而 p 很小时的近似计算公式。定理 2.4.1(泊松定理)在 重贝努里试验中,事件 在一次试验中出现的A概率为 (与试验总数 有关) , ( 为常数) ,则对任意确定n nplim0的非负整数 ,有k。ekCpbnknnn !)1(li),;(lim证明:设 ,则 ,于是nnknknknknn kpCpkb )1()!()1)1(),;( 2()()()!k nkn对任意确定的 k,当 时 、n
17、1i )1,2(i、1knen所以。ekpnbn!),;(lim在实际计算中,当 , 时,上式的近似值效果颇佳,而205.p且 时,效果更好。10p2.4.3 超几何分布定义 如果随机变量 的分布列为X()knMNCpX(0,1.)kr其中 、 、 且 、 、 均为整数,则称这个分布为mi,rnNM超几何分布,记为 。(,)hn超几何分布对应于无放回抽样模型:个产品中有 个不合格品,从中无放回地抽取 个,不合格品的个数为NMn。X2.4.4 几何分布与负二项分布定义 如果随机变量 的分布列为X1()(kpp(,2.)则称这个分布为几何分布,记为 。(Gep几何分布对应于抽样模型:为独立重复的伯
18、努里试验中, “首次成功”时的试验次数。X几何分布的数学期望与方差:设 ,令 ,则()Gep1qp111kkkk dEqpq20()()kddpqpq又因 2221111()()()kkkkkkEXpq2221 1 0() ()kkk kddpqqp2 321()()dqpp于是 。222()()pVarXEX定理 2.4.2(几何分布具有无记忆性)设 ,则对任意的正整数XGe与 ,有mn。(|)pXmn定义 如果随机变量 的分布列为X1()()rkrkCp(,1.)r则称这个分布为负二项分布(巴斯卡分布) ,记为 。(,)XNbrp负二项分布对应于抽样模型:为独立重复的伯努里试验中, “第
19、次成功”时的试验次数。Xr注:(1) 二项随机变量是独立 随机变量之和;01(2) 负二项随机变量是独立几何随机变量之和。2.5 常用连续分布2.5.1 正态分布定义 若随机变量 的概率密度函数为X2()1()xpxe)(x其中 和 为常数,且 ,则称随机变量 服从参数为 和 的正态分布,0X或高斯(Gauss)分布,称 为正态变量,记为 ,正态分布X2(,)N的密度函数 所表示的曲线称为正态曲线。),(2N2()1()xpxe正态分布的性质:(1) 正态曲线以 为对称轴;(2) 当 时取最大值 ;x21(3) 以 轴为水平渐近线,即 离 越远, 的值越小,且 时,x()pxx。()0px相应
20、的分布函数为: 2()1()2txFed和 的图形分别如下图所示:px当 固定,改变 的值, 的图形沿 轴平移而不改变形状,因而()ypxx又称为位置参数;其图如下:当 固定,改变 的值,则 的图形的形状随着 的增大而变得平()ypx坦,故 称为形状参数。其图如下:称参数 、 的正态分布称为标准正态分布,记为 ,其01 (0,1)XN密度函数记为2()xxe)(x相应的分布函数为 21()txed其图如下:标准正态分布的计算:当 时, 的函数值可查表得到;0x)(x当 时,由 的对称性即 知,先查 ,再由y)(x)(x来得到 的函数值。)(1)(xx)(x例 2.5.1 若 ,求下列事件的概率
21、: (1) ;(2) 0,1XN(1.52)pX;(3) ;(4) ;(5) ?(.52)pX(.52)p(.751.2)pX|解:略。非标准正态分布的计算:定理 2.5.1 若 ,则 。2(,)XN(0,1)XYN利用定理 2.5.1,将非标准正态分布化为标准正态分布计算,即若 ,则令 ,于是2(,)。122112xxxxpxXpY例 2.5.2 若 ,求(1) ;(2) 若2(08,3)N(07)pX,求常数 ?()0.95paa解:(1) 118(127)( )33pXp7808)()(2)(2130.995(2) 由 10108()()().9533aapa反查表得: ,于是.64.。
22、108512953a正态分布的数学期望与方差:设 ,则2(,)XN2 2()11) ()x tEeded tt22 2 2()2221()()()x tVarXExeded 。22222|)(dtete正态分布的 原则:3设 ,则2(,)XN0.6821(|)(|)()954.73kXpXkpkk 可见在一次试验中, 几乎必然落在区间 内,或者说,在),(一般情形下, 在一次试验中落在区间 以外的概率可以忽略不X,3计,这就是通常所说的 原则。32.5.2 均匀分布定义 若随机变量 具有概率密度函数1()0axbpxb其 它则称 在区间 上服从均匀分布,记为 。X(,) (,)XUab相应的分
23、布函数为: 0()1xaxFbb和 的图形分别如下图所示:()px例 2.5.3 若 ,现对 进行 4 次独立观测,试求至少有 3 次观(0,1)XUX测值大于 5 的概率?解:设随机变量 是 4 次独立观测中观测值大于 5 的次数,则 ,Y (4,)Ybp其中 ()p由 得0,1XU05().dx于是,所求概率为。3444 5()(1)0.16pYCpp均匀分布的数学期望与方差:设 ,则(,)XUab12bExd222()3baa于是 。2222 2()()()()1abbaVrXEX2.5.3 指数分布定义 若随机变量 具有概率密度函数 0()xepx其中参数 ,则称 服从参数为 的指数分
24、布,记为 。0X()XExp相应的分布函数为: 10()xeF指数分布的数学期望与方差:设 ,则()XExp0 00 1( | |xxxxedede222 202) | xd于是 。2()()()VarXEX定理 2.5.2(指数分布的无记忆性)如果 ,则对任意的 、()XExp0s,有 。0t(|)()pstpt证明:由 知(XEx()se又因 ,于是t。()()(|) ()sttpXstepXst pXt例 2.5.4 若某设备在任何长为 的时间 内发生故障的次数 服从t0,t ()Nt,则相继两次故障之间的间隔时间 。()Pt()TExp证明:由 ,则()NtPt(!ktpte(0,1.
25、)又因两次故障之间的间隔时间 是非负的随机变量,且事件 表明此TTt设备在 没有发生故障,即 ,于是0,t()0tNt当 时,有()TFtp当 时,有t1()1()01ttpTtpte于是 的概率密度函数为 0()tTept即: 。()Ex2.5.4 伽玛分布函数 称为伽玛函数,其中参数 。10()xed 0伽玛函数具有如下性质:(1) 、 ;(1)(2)(2) ,当 为自然数 时,有n()(!nn定义 若随机变量 具有概率密度函数X10()0xepx其中 为形状参数, 为尺度参数,则称 服从伽玛分布,记为X。(,)XGa伽玛分布的数学期望与方差:设 ,则(,)XGa0(1)(xEed2122
26、0()(1)(xX于是 。222)()()VarEX定义 若随机变量 具有概率密度函数 21210()()0xnnepx则称 服从自由度为 的 分布,记为 。X22()Xn伽玛分布的两个特例:(1) ;(1,)()GaExp(2) 2n若 ,则2()X、 。En2Varn2.5.5 贝塔分布函数 称为贝塔函数,其中参数 、 。110(,)()abBbxdx 0ab贝塔函数具有如下性质:(1) ;(,)(,)(2) 。,()abB定义 若随机变量 具有概率密度函数X11()()0()0abxxbpx其 它其中 、 都是形状参数,则称 服从贝塔分布,记为 。0aX(,)XBeab贝塔分布的数学期望
27、与方差:设 ,则(,)XBeab110()(1)()()ababbaExdx110)()()abbX2()()()aa于是 22 2(1)( ()aVrXEXbb。2()1)ab贝塔分布的特例:。(1,)0,)BeU2.6 随机变量函数的分布在实际问题中,我们常要讨论随机变量函数的分布。例如分子运动的速度是随机变量,分子的动能 也是随机变量,它是 的函数。设 是X21YmXX随机变量, 是一个单值函数,则称 为随机变量 的函数。()gx()g2.6.1 离散随机变量函数的分布设 是离散随机变量, 的分布列为:XX1x2x nxp()()p ()p则 也是离散随机变量,其分布列为:()YgX1(
28、)gx2()x ()ngxpp p当 、 、 、中有某些值相等时,则将它们合并,将对应的1()gx2()ngx概率相加即可。例 2.6.1 设随机变量 的分布列如下,试求随机变量 的分布列?X2YXX210 1 2p0.2 0.1 0.1 0.3 0.3解:由题意得: Y2 0 0 2 60.2 0.1 0.1 0.3 0.3再将相同值合并得 的分布列为2YX0 2 6p0.2 0.5 0.32.6.2 连续随机变量函数的分布对连续随机变量 ,分情况讨论 的分布:X()YgX当 严格单调时:()gx定理 2.6.1 设 是连续随机变量,其密度函数为 , 严格单()Xpx()yg调,其反函数 有
29、连续导函数,则 也是连续型随机变量,且其密度()hy()Yg函数为 ()|(|()0XYpayb其 它其中 、 。min),(agmx(),g证明:为求 的密度函数,先求其分布函数。当 为严格单调增函数时,它的反函数 也是严格单调增函数,()yx ()hy且 ,由于当 取值于 时, 取值于 ,所以0h),()(,当 时, ;ya()0YFyp当 时, ;b)1当 时y ()()()(hyY XFpgXyppxd于是, 的密度函数为;()()0XYphyayby其 它当 为严格单调减函数时,可以类似证明。gx定理 2.6.2 若 ,则当 时,有2(,)N0a。YaXba推论 若 ,则2(,)。0
30、1N例 2.6.2 设 ,试求 的分布?2(,)XYX解:由题意知: 仍是正态变量,且Y()()0EYE2VarVar所以 。2(0,)N注:分布相同与随机变量相等是两个完全不同的概念。定理 2.6.3(对数正态分布)若 ,则 的概率密度函数为2(,)XNXYe。2(ln)10()20yYepy定理 2.6.4 设 ,则当 时,有(,)XGa0k。(,Ykk定理 2.6.5 设 ,若 为严格单调增的连续函数,则()XFx()X。()0,1)XFU当 为其它形式时:gx若 对应的函数 不满足条件时,则可用定义来求,与定理()Y()ygx的证明类似。例 2.6.3 设 ,试求随机变量 的密度函数?
31、(0,1)XN2YX解:因为 在 上不是单调函数,所以用定义来求2xy),(由于当 取值于 时, 取值于 ,所以y),0当 时,有 ;0y()YFyp当 时,有2()()()2()1YypXyXy于是, 的密度函数为 120()0yYey即 。2(1)2.7 分布的其它特征数2.7.1 阶矩k定义 2.7.1 设 为随机变量, 为正整数,若 存在,则Xk|kEX),21(称 ()kkE为 的 阶原点矩。X若 存在,则称|()|k),21kvX为 的 阶中心矩。显然, 的数学期望 是 的一阶原点矩, 的方差 是 的二()EXX()VarX阶中心矩。2.7.2 变异系数定义 2.7.2 设随机变量
32、 的二阶矩存在,则称比值()()vVarXCE为 的变异系数。X作用: 是无量纲的量,用于比较量纲不同的两个随机变量的波动大()vCX小。2.7.3 分位数定义 2.7.3 设连续随机变量 的分布函数为 ,密度函数为 ,对X()Fx()px任意的 ,称满足(0,1)ppxFd的 为此分布的 分位数,又称下侧 分位数;px p称满足1()()pxd的 为此分布的上侧 分位数。px分位数与上侧分位数之间的关系:、 。1p1px注:(1) 因为 小于等于 的可能性为 ,所以 大于 的可能性为 ;XpxpXpx1p(2) 对离散分布不一定存在 分位数。2.7.4 中位数定义 2.7.4 设连续随机变量 的分布函数为 ,密度函数为 ,称X()Fx()px时的 分位数 为此分布的中位数,即 满足0.5p0.5x0.5。0.5.()()xFpd中位数与均值比较:相同点:都是反映随机变量的位置特征;不同点:含义不同。2.7.5 偏度系数定义 2.7.5 设随机变量 的三阶矩存在,则称比值X33122()()vEX为 的分布的偏度系数,简称偏度。2.7.6 峰度系数定义 2.7.6 设随机变量 的四阶矩存在,则称比值X44222()3()vEX为 的分布的峰度系数,简称峰度。