1、应用概率统计,主讲:刘剑平,定义 若事件A与B满足 P(AB)=P(A)P(B),则称A与B相互独立,简称A与B独立。,推论1 A.B为两个事件,若P(A)0,则A与B独立等价于P(B|A)=P(B).若P(B)0,则A与B独立等价于P(A|B)=P(A).,第1.5节 独立性及其应用,推论2 在 A 与 B, 与 B,A 与 , 与 这四对事件中,若有一对独立,则另外三对也相互独立。,性质 若n个事件相互独立,则,巴斯卡概率公式 在n重贝努里试验中,如果第r次“成功” 出现在第n 次试验中,则,几何概率公式 在n重贝努里试验中,如果第1次“成功” 出现在第n 次试验中,则,二项概率公式 在n
2、重贝努里试验中,如果“成功”在每次试验中出现的概率为p,令Bk=“在n 次试验中“成功”出现k 次”,则,第2章 随机变量及分布,第2.1节 随机变量的概念,第2.3节 随即变量的分布,第2.4节 连续型随机变量,第2.5节 随机变量函数的分布,第2.2节 离散型随机变量,品质数据的分类整理:,数量数据分组:,组距分组:,单变量分组:,条形图、,饼图,直方图、,折线图,组数:,组距:,排序计数,频率与直方图,分组的原则:穷尽原则,互斥原则,例:某商店连续40天的商品销售额(单位:万元)如下:,根据上面的数据进行适当分组,编制频数 分布表,并画出直方图。,41 25 29 47 38 34 30
3、 38 43 40 46 36 45 37 37 36 45 43 33 4442 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35,数据分布特征的测度,1、,分布的集中趋势:,(1)众数:,出现频率最高的值,,用,记之。,算法(1),例,1,2,4,4,5,6,则,1,2,3,3,4,5,6,6,7,则,(2)中位数:,中间位置的数,,用,记之。,算法(1),例,1,2,3,4,5,6,7,则,1,2,3,4,5,6,则,(4)均值:,1)简单平均,2)加权平均,3)调和平均,4)加权调和平均,5)几何平均,其中,众数、中位数、均
4、值的比较,对称分布,左偏分布,右偏分布,2、,分布的离散程度:,(1),(2),平均离差,样本方差,(3),样本标准差,(4)极差,例:求1,2,3,4,5的样本均值,样本方差。,解:,一、随机变量(random variables)概念,记为,是一个随机事件。,第2.1节 离散型随机变量及其分布,例如 (1)随机地掷一颗骰子,表示所有的样本点,: 出现1点 出现2点 出现3点 出现4点 出现5点 出现6点,X(): 1 2 3 4 5 6,(2)某人接连不断地对同一目标进行射击,直至射中为止,表示射击次数,则, 射击1次 射击2次 射击n次 ,X() 1 2 n ,(3) 某车站每隔10分钟
5、开出一辆公共汽车,旅客在任意时间到达车站,表示该旅客的候车时间, 候车时间,X() 0, 10,1.随机变量,(4)掷一枚硬币,表示正反面,则,X(): 1 0,特别,离散型,连续型,定义 设E为随机试验,它的样本空间记为=,如果对于每一个都有实数X()与之对应,则称这个定义在上的实单值函数X()为随机变量.随机变量一般用X,Y,Z,或,等表示.,取值为有限个和至多可列个的随机变量.,可以取区间内一切值的随机变量.,例如 S=R2中,其中R为测量中的随机变量,S为随机变量R的函数.,此外,若X是一个随机变量,则以X为自变量的函数Y=f(X)称为随机变量X的函数.随机变量函数也是随机变量.,2.
6、离散型随机变量的概率分布,定义 设随机变量X的一切可能取值为x1,x2,.,xn,.,且pn=P(X=xn),n=1,2,.,称此公式为X的概率分布或分布列.,或者,性质 (1)pn0,n=1,2,. ; (2)p1+p2+.+pn+=1;计算 对ab 有 P(aXb)=,例如 在掷一颗骰子的试验中,X表示出现的点数,则,X的概率分布为,设A表示出现奇数点,则P(A)=P(x=1)+P(x=3)+P(x=5)=1/2,注意,离散型随机变量的概率分布分以下几步来求:(1)确定随机变量的所有可能取值;(2)设法(如利用古典概率)计算取每个值的概率.(3)列出随机变量的概率分布表(或写出概率函数).
7、,例1 某试验出现“成功”的概率为p(0p1),出现“失败”的概率为1-p,现进行一次试验,求成功次数的概率分布.,解 设随机变量X表示成功次数, 则X=0表示试验出现“失败”,X=1表示试验出现“成功”P(X=1)=p, P(X=0)=1-p,所以,X的概率分布为:,两点分布,注 两点分布用于描述只有两种对立结果的随机试验.,常见的离散型随机变量的概率分布,(1) 两点分布(0-1分布),注 二项分布的试验背景是n重Bernoulli试验模型;其中n是试验独立重复的次数,p是每一次基本试验“成功”的概率.随机变量X指n次试验中“成功”出现的次数.,例2 一批产品的合格率为0.8,有放回地抽取
8、4次,每次一件,取得不合格品件数为X,则,(2) 二项分布 若随机变量X的概率分布为,XB(4,0.2),一般地:设射击次数为n,每次射击击中目标的概率 为p,则:当(n+1)p为整数时,概率最大的击中目标次数为(n+1)p和(n+1)p-1;当(n+1)p不为整数时,概率最大的击中目标次数为(n+1)p的整数部分.,巴斯卡分布 在n重贝努里试验中,如果第r次“成功” 出现在第n 次试验中,则,几何分布 在n重贝努里试验中,如果第1次“成功” 出现在第n 次试验中,则,(3) 泊松分布,定义 若随机变量X的概率分布为,则称X服从参数为(0)的Possion分布,记为XP().,可以证明 当n很
9、大, p很小,=np是一个不太大的常数时,可以用泊松分布作为二项分布的近似.即,即 Poisson 分布可作为二项分布的近似。实际应 用中,当 p 0.25,n 20,np 5时,近似效果良好。,例3 在一部篇幅很大的书籍中,发现只有 13.5%的页数没有印刷错误,如果我们假定每页 的错字数是服从 Poisson 分布的,求正好有一个 错字的页数的百分比.,解 设 为每页的错字个数,由已知得,又已知,解 1月1日公司收入 (元),设一年中死亡人数为 (人),则,例4 在保险公司里有2500个同一年龄和同社会 阶层的人参加了人寿保险。在一年里每个人死亡的概 率为0.002,每个参加保险的人在 1
10、月1日付 12 元保险 费,而在死亡时家属可从保险公司领取2000元,问下 列事件的概率各为多少?(1)保险公司亏本(2)保险公司获利不少于10000元(3)保险公司获利不少于20000元,(2)保险公司获利不少于10000元 =,(3)保险公司获利不少于20000元 =,例5 设一试验成功的概率为p(0p1),接连重复进行试验,直到首次成功出现为止,求试验次数的概率分布.,解 设X表示试验次数,X取值为1,2,.,n,.,P(X=1)=p, P(X=2)=(1-p)p, ., P(X=n)=(1-p)n-1p,.,记 q=1-p, 则X的概率分布为:,几何分布,P(X=n)=qn-1p, (
11、n=1,2,.),例6 一批产品共100只,其中有10只次品. 求任意取出的5只产品中次品数的概率分布。,解 设任意取出的5只产品中次品数为,可能取值为:,0, 1, 2, 3, 4, 5.,一般地,若一集合成员分A、B两类,总成员有 N个,其中A类有M个,现从中任取 n个,则其中所含 的 A 类个数 的分布为:,例7 袋内有5个黑球3个白球,每次抽取一个不放回,直到取得黑球为至。记X为取到白球的数目,Y为抽取次数,求X、Y的概率分布及至少抽取3次的概率。,解 (1)X的可能取值为0,1,2,3, P(X=0)=5/8, P(X=1)=(35)/(87)=15/56,类似有 P(X=2)=(3
12、25)/(8 7 6)=5/56, P(X=3)=1/56, 所以,X的概率分布为,(2) Y的可能取值为1,2,3,4,P(Y=1)=5/8, P(Y=2)=P(X=1)=15/56, 类似有P(Y=3)=P(X=2)=5/56, P(Y=4)=P(X=3)=1/56,所以Y的概率分布为,(3) P(Y3)=P(Y=3)+P(Y=4)=6/56,例8 某车间有5台同类型的机床,每台机床配备的电动机功率为10千瓦.每台机床工作时平均每小时实际开动 20分钟,且每台开动与否相互独立.因电力供应紧张,电力部门仅提供30千瓦的电力给这5台机床.问5台机床正常工作的概率有多大?,解 设A为“机床实际在
13、开动”,X为“同时开动的机床数”,则,P(A)=1/3,XB(n,p),其中n=5,p=1/3,所求概率为,P(X3),=1-P(X=4)-P(X=5),0.95,或P(X3),随机变量的分布函数,定义 设X是任意一个随机变量,称函数F(x)=P(Xx), x为随机变量X的分布函数.,(1) 0F(x)1, x,(2)F(x)是x的单调不减函数;(3),(4)F(x)在每一点处均是右连续的,即:F(x+0)=F(x),1. 分布函数,性质,(1) F(x)=,(3) 对任意ab有P(aXb)=P(Xb)-P(Xa)=F(b)-F(a); P(a Xb)=P(Xb)-P(Xa)=F(b-0)-F
14、(a-0);P(Xa)=F(a-0);P(Xa)=1-P(Xa)=1-F(a-0).,对于离散型随机变量X的分布函数有,例9 设随机变量X服从参数为0.7的0-1分布,即:,求X的分布函数.,解 (1) 当x0时,F(x)=P(Xx)=,=0,(2)当0x1时,F(x)=P(Xx)=,=P(X=0)=0.3,(3)当1x时,F(x)=P(Xx)=,=P(X=0)+P(X=1)=1,分布函数图形如下,x,F(x),1,1,0.3,0,所以,对应概率值为 P 0.4 0.4 0.2,(1)离散型随机变量的分布函数是分段函数,分段区间是由X的取值点划分成的左闭右开区间;(2) 图形上表现为阶梯形跳跃
15、递增; (3)函数值跳跃高度是X取值区间中新增加点的对应概率值.,例10 设X的分布函数为,求X的概率分布.,解 X的取值为 X 0 1 2,由此可见,例如 设某厂生产某产品的规定尺寸为25.40cm,已知某批产品的最小尺寸为25.20cm,最大尺寸为25.60cm.现从这批产品中任取100件,得到100个测量值.计算得如下数据表:,2.2 连续型随机变量的概率密度函数,建立频率柱形图如下:,当n无限增大,组距无限减小时,频率分布直方图就会无限接近一条光滑曲线,此即为随机变量X的概率密度曲线,以该曲线为图形的函数称为X的概率密度函数.记为Xf(x).,f(x)0, x;,显然,连续型随机变量的
16、概率密度曲线具有以下性质,对于连续型随机变量X的分布函数有,(1),(3) F(x)是(-,+)上的连续函数;(4) P(X=x)=F(x)-F(x-0)=0;,(2) f(x)=,(5) 对任意aa) =1-P(Xa)=1-F(a).,例11 设随机变量X,求(1)A;(2)P(-1/2X1/2); (3)P(-3X2),解 (1),即,所以 A=1/,A=1,(2)P(-1/2X1/2)=,=1/(/6+/6)=1/3,(3)P(-3X2)=,=1,例12 设连续型随机变量X满足,解 密度函数曲线如图,S1,S2=2/3,表示k点右侧的面积值.,由f(x)的几何意义知,又由S2=2/3可知
17、,例13 设随机变量X,求(1)A;(2)P(-1/2X1/2); (3)F(x),例14 设连续型随机变量X的分布函数为,求:(1)A; (2)P(0.3X0.7);(3)X的概率密度f(x).,解 (1)F(x)在x=1点连续,由左连续性得:,即:,所以,A=1,(2) P(0.3X0.7)=F(0.7)-F(0.3)=,0.72-0.32=0.4,(3) f(x)=,=,0 x 0 2x 0x1 0 1x,即:,例15 设连续型随机变量X的分布函数为,求:(1)A,B; (2)P(-1X1); (3)X的概率密度f(x).,常见的连续型随机变量的概率密度,(1) 均匀分布,称X服从a,b
18、上的均匀分布.记为XU(a,b).,例16 设随机变量X服从-1,2区间上的均匀分布,求X的分布函数.,解,如图:,-1,2,分析,F(-2)=,=0,-2,1,3,F(1)=,=2/3,F(3)=,=1,F(1),x,f(x),F(3),(1)x-1时,F(x)=,=0,=1,(2)-1x2时,F(x)=,(3)2x时,F(x)=,所求分布函数为,x,F(x),-1,1,2,1,0,可见 (1)连续型随机变量X的分布函数F(x)为单调递增的连续函数;(2)F(x)为分段函数,例17 设随机变量XU(1,5),求,例18 设随机变量X服从2 ,5上的均匀分布.对 X进行三次独立观测,试求至少有
19、两次观测值大于3的概率。,解 由题意得:,记A=X3,则P(A)=P(X3)=,2/3,设Y表示三次独立观测中A出现的次数,则YB(3,2/3),所求为P(Y2)=,P(Y=2)+P(Y=3),=20/27,(2) 指数分布,则称 X服从参数为的指数分布,记为XE() (0).,定义,若随机变量X的概率密度函数为,概率密度曲线如图:,注 指数分布常用作各种“寿命”分布的近似.,注 指数分布具有“永远年青”性。即,例19 设随机变量XE(0.0001),求x2000的概率。,称 随机变量 X服从参数为 ,2的正态分布, 0, 是任意实数,记为,(3) 正态分布,定义 若随机变量X的概率密度函数为
20、,注 (1) 概率密度曲线是以x=为对称轴,以y=0为渐近线的R上的连续函数;,f(x),x,0,(2)在x=点f(x)取得最大值:,X N(,2),(3) 曲线f(x)与x轴之间的面积是1.,特别,若=0,2=1,即,则称X服从标准正态分布. 记为,XN(0,1),x,0,注 标准正态分布的概率密度曲线以y轴为对称轴.,x,0,注 (1),x,-x,标准正态分布的分布函数,2. 正态分布的分布函数及其计算,(2) P(|X|a)= (a) - (-a) = (a) 1-(a),= 2 (a)-1.,正态分布的分布函数,若XN(,2),则,所以,若XN(,2),则对任意的ab有,例20 设XN
21、(10,4),求P(10X13), P(|X-10|2).,解 P(10X13)=,=(1.5)-(0)=,0.4332,P(|X-10|2)=,P(8X12),=2(1)-1,=0.6826,=(1)- (-1),=(1)- 1-(1),例21 设XN(,2),P(X-1.6)=0.036,P(X5.9)=0.758, 求及.,解 P(X-1.6)=,所以:,又P(X5.9)=,所以:,联立解方程组得:,=3,=3.8,特别 (0)=0.5 ;(1.28)=0.90 ; (1.64)=0.95 ;(1.96)=0.975 ;(2.33)=0.99 .,例22 某地抽样结果表明,考生的外语成绩
22、(百分制)近似 服从 正态分布,平均成绩为 72分,96分以上的占考生总数的 2.3%,试求考生的外语成绩在 60分至84分之间的概率。,解 设X为考生的外语成绩,则,XN(72,2),由题意得:,P(X96)=0.023,=1-(96-72)/=,1-(24/),所以 ,(24/)=1-0.023=0.977,24/=2,故:,=12,所求P(60X84)=,=0.6826,1. 已知XN(3,22),且 PXC=PXC 则C=( ),2. 设XN(,42),YN(,52), 记 p1=PX-4,p2=PY+5则( )对任意实数,都有p1=p2 对任意实数,都有p1p2,3,课堂练习,f(x
23、),x,0,P(X),P(X),设XN(,2),则随的增大,概率P|X-| ( )单调增大 单调减少保持不变 增减不定,设X N(2,2),且P2X4=0.3,则 PX0 =( ).,0.2,离散型随机变量的概率分布,定义 设随机变量X的一切可能取值为x1,x2,.,xn,.,且pn=P(X=xn),n=1,2,.,称此公式为X的概率分布或分布律.,或者,性质 (1)pn0,n=1,2,. ; (2)p1+p2+.+pn+=1;计算 对ab 有 P(aXb)=,两点分布,常见的离散型随机变量的概率分布,(1) 两点分布(0-1分布),(2) 二项分布,(3) 泊松分布,定义,则称X服从参数为(
24、0)的Possion分布,记为XP().,可以证明 泊松分布作为二项分布的近似(np=).即,巴斯卡分布 在n重贝努里试验中,如果第r次“成功” 出现在第n 次试验中,则,几何分布 在n重贝努里试验中,如果第1次“成功” 出现在第n 次试验中,则,超几何分布,f(x)0, x;,性质,连续型随机变量的概率密度函数,随机变量的分布函数,定义 设X是任意一个随机变量,称函数F(x)=P(Xx), x为随机变量X的分布函数.,(1) 0F(x)1, x,(2)F(x)是x的单调不减函数;(3),(4)F(x)在每一点处均是右连续的,即:F(x+0)=F(x),1. 分布函数,性质,(1) F(x)=
25、,(3) 对任意ab有P(aXb)=P(Xb)-P(Xa)=F(b)-F(a); P(a Xb)=P(Xb)-P(Xa)=F(b-0)-F(a-0);P(Xa)=F(a-0);P(Xa)=1-P(Xa)=1-F(a-0).,对于离散型随机变量X的分布函数有,对于连续型随机变量X的分布函数有,(1),(3) F(x)是(-,+)上的连续函数;(4) P(X=x)=F(x)-F(x-0)=0;,(2) f(x)=,(5) 对任意aa) =1-P(Xa)=1-F(a).,常见的连续型随机变量的概率密度,(1) 均匀分布,称X服从a,b上的均匀分布.记为XU(a,b).,(2) 指数分布,则称 X服从
26、参数为的指数分布,记为XE() (0).,定义,若随机变量X的概率密度函数为,注 指数分布具有“永远年青”性。即,(3) 正态分布,定义,注 (1) 概率密度曲线是以x=为对称轴,以y=0为渐近线的R上的连续函数;,f(x),x,0,(2)在x=点f(x)取得最大值:,X N(,2),(3) 曲线f(x)与x轴之间的面积是1.,若=0,2=1,即,标准正态分布.,XN(0,1),x,0,注 标准正态分布的概率密度曲线以y轴为对称轴.,x,0,注 (1),x,-x,标准正态分布的分布函数,2. 正态分布的分布函数及其计算,(2) P(|X|a)= (a) - (-a) = (a) 1-(a),=
27、 2 (a)-1.,正态分布的分布函数,若XN(,2),则,所以,若XN(,2),则对任意的ab有,离散型随机变量函数的概率分布:,例23 设随机变量X的概率分布如下,Y=2X+1,Z=X2,求Y,Z的概率分布.,解 (1)Y的对应取值为-1,1,3,5,P(Y=-1)=P(2X+1=-1)=P(X=-1),=0.2,P(Y=1)=P(X=0)=0.3, P(Y=3)=P(X=1)=0.1, P(Y=5)=P(X=2)=0.4,所以Y的概率分布为,(2)Z的取值为0,1,4,P(Z=0)=P(X=0)=0.3,P(Z=1)=P(X=1)+P(X=-1)=0.3,P(Z=4)=P(X=2)=0.
28、4,所以Z的概率分布为:,2.3. 随机变量函数的分布,注意,离散型随机变量函数的概率分布分以下两步来求:,(1)由y=g(x)计算出随机变量Y的所有取值y1,y2,.,yn,.; (2)P(Y=yn)为yn 对应的随机变量X的取值的概率和.,例24 设随机变量X,Y=2X+1,求随机变量Y的概率密度函数fY(y).,解 (1)求Y的分布函数FY(y):,FY(y)=P(Yy)=,=FX(,P(2X+1y),=P(X,(2)对分布函数求导:,f Y(y)=,=,利用复合函数求导链式法则得:,f Y(y)=,=,将fX(x)代入得:,f Y(y)=,=,连续型随机变量函数的概率密度函数,进一步可
29、以推广得到以下结果:,定理1 设XfX(x),y=g(x)是x的单调可导函数,其导数不为0,值域为(a,b),-ab+,记x=h(y)为y=g(x)的反函数,则Y=g(X)的概率密度函数为:,FY(y)=P(Yy)=,f Y(y)=,设y=g(x),特别:对随机变量X的线性函数有以下定理,定理2 设随机变量XFX(x),Y=kX+b(k0),则Y的概率密度为,例如 设X为连续型随机变量,XFX(x),Y= -4X+3,则Y的密度函数为,证明,所以 YN(0,1),第2章 一维随机变量及分布补充例子,1.离散型随机变量的分布函数为,0.3,2.已知随机变量X只能取-1、0、1、2四个值,其相 应的概率依次为c,2c,3c,4c.求:(1)常数c;,4.当随机变量,(),5已知随机变量X的概率密度为,求:1) A;2) 分布函数; 3)概率P(-1/2X1/2).,A=2;2) 分布函数,3)概率P(-1/2X1/2)=1/4 .,6.已知X的分布函数为,7.设随机变量X的密度f(X)满足f(x)=f(-x),分布函数F(x)满足,(),8:设随机变量的分布函数为求:(1)A;(2)X的概率密度;(3) 。,