1、条件概率及其应用摘 要概率论与数理统计就是研究随机现象的统计规律的一门学科,由于在生产生活等等各个方面随机现象具有普遍性,使得概率论与数理统计具有极其广阔的应用。概率论是对随机事物的现象进行统计规律演绎的研究,而数理统计又是对随机事物现象进行统计规律归纳的研究。并且条件概率这个概念有是概率论与数理统计的一个重要的内容和一个基本的工具。本文从条件概率的定义、性质、定理、应用这四个方面来解释、探讨、分析条件概率。近年来,由于一方面它为科学技术、工农业的生产等的现代化作出了极其重要的贡献;另一方面,广泛的应用也促进概率论与数理统计有了非常大的发展。本文从条件概率的定义、性质、定理这三个方面来解释、探
2、讨、分析条件概率。并 从 应 用 的 角 度 对 条 件 概 率 进 行 系 统 全 面 的 阐 述 ,把 目 前 应 用 和 后 继 发 展 进 行 兼 顾 考 虑 , 随 着 科学技术、工农业的生产等的现代化的发 展 , 该 课 题 还 存 在 大 量 的 后 续 研 究 工 作 。关键词:条 件 概 率 ; 全 概 率 公 式 ; 贝 叶 斯 公 式 ; 应 用引言或绪论等(内容略)第一章条件概率的定义和性质条件概率是概率论中的一个基本工具,在中产生活中有着重要作用。在现实的世界里很少存在单一的不受别的事件影响的情况,由于事件的概率经常会由于其他时间的影响而发生改变,所以这里我们引入条件
3、概率这一概念。这样我们就能了解在事件 B 已经发生的情况下时间 A 发生的概率,这样也就解决了无条件概率不能解决的问题例 1、设在 N 只鸡的总体中,有 条是白鸡而且有 条是母鸡的。若事ANBN件 A 及事件 B 表示随机选取一条是白鸡及是母鸡,则P(A)= P(B)= 现在,以所有母鸡组成的子总体代替总体的位置,我们来计算从母鸡中随机选出的一只鸡是白鸡的概率。这概率就是 / ,其中 是白色母鸡ABNABN的数目。在研究某个特定的子集的时候,我们需要用一个新的符号来表达。一般所采用的符号是 P(A|B),可读为“在事件 B(所选出的鸡是母鸡的)发生的假定条件下,时间 A(白鸡)发生的概率” 。
4、采用数学符号P(A|B) = = ABN()P很显然,每一个子集本身总可以被考虑为一个总体。为了表达上的方便,我们说一个子集时,意思是说这个子集背后还有一个较大的总体。从上面的例子可以看出 P(A)一般是与 P(A|B)不同的。再来看一个例子。例 2、从标号为 1、2、3、4 的四个球中,等可能地任取一个球,那么事件A:“得标号为 4”的概率 P(A)=0.25 ;如果已知事件 B:“得标号为偶数”已经出现,那么这时只剩下两种可能,或得 2 号或得 4 号,所以 P(A|B)=0.5 在一般情况下,应该怎么样定义 P(A|B)呢?由于频率与概率有很多类似的性质,先从频率的讨论开始。设 A、B
5、为任一个随机试验 E 中的两个事件,每次试验结果。不外是下列四种情况中的一种。(1)A 出现 ,B 不出现 (2)B 出现,A 不出现 (3)A,B 都出现 (4)A,B 都不出现。现在把 E 重复做 n 次,分别以 n1、n2、n3、n4 记下四种情况出现的次数,显然 =n 。而且4ii=1B 的频率为 (B)= ,nF23+nAB 的频率为 (AB)= ,在 B 已经出现的条件下,A 的频率为 (A|B )= ,根据这些式子,n23n+得(AB)= (A|B) (B) 。nFnnF因此,如 (B)0 就有(A|B)=nn( A)( )这个式子告诉我们,如何去定义 P(A|B)。我们就得到如
6、下定义定义 设(,F,P)为概率空间,A F,B F,设 P(B)0 。在事件 B 已出现的条件下,事件 A 出现的概率 P(A|B)定义为P(A|B)= ()PAB对于古典类型的随机试验,设 B 含有 m 个不同的基本事件,m0 ,AB 含有 k 个,以 n 表示 中总共不同的基本事件的个数,则P(A|B)= = knm类似的可以知道,对于几何随机试验,例如 F(B)0 ,我们有这样的式子P(A|B)= =()FABL容易验证,条件概率具有概率定义中的三个基本性质:如果 P(B)0 ,那么 P(A|B)作为 A 的集函数是 F 上的概率;即(1)对每个 A F,有 1 P(A|B ) 0 ;
7、(2)P( |B)=1 ;(3)如 F,m=1,2,. ,两两互不相容,则有mm=1=1(|)(|)ABP现在对上面的三个性质进行证明:证 (1)因 , 0 ,故由(3)知 1 P(A|B ) 0( )(( B)(2) = = =1|P()P(3) = = =m=1(|)ABm1()m1()ABPm1(|)第二章条件概率的三定理现在对条件概率来证明三条重要的定理,这就是:概率的乘法定理,全概率公式与贝叶斯(Bayes)公式。这些定理在概率的计算中起着重要的作为。2.1 概率的乘法定理定理 1 设 , ,., 为 n 个事件,n 2,满足 0 ;1A2A12n-1()PA则=12n()P1213
8、12n12n-1(|)(|)(|)P上式称为乘法公式。它的直观意义是: , ,., 同时出现的概率,等于出现 ,在 出现的条件下出现 ,在 , 出现的条件下出现 ,1A2A123A各自的概率的乘积。证 由于 0,故 =1()P12)12n-1()P 12n()P右方出现的条件概率都有意义;由12132nn-()|(|)P条件概率的定义有 1231212n12n-()()( =()AAPP 例 1 设箱子内有 a(a 2)个白球 b 个黑球,在其中接连取三次,每一次取出一个球,取球后不还原,问三个取出来的求都是白球的概率是多少?解 以 表示“第 i 次取得白球”这一个事件, i=1、2、3、要求
9、的是iA。因为123()P12a()=0+bP故可用 = 。显然12n()PA121312n12n-1(|)(|)(|)APA。如已知第一次取得白球,箱内只剩下 a-1 个白球 b 个黑球,可1a()=+b见 ,类似得 = 。于是由概率的乘法公2-|( ) 312(|)Pa-+b( )式得 123a-()=+bA注:这个例子中随机试验 是复合的: = 。 共含有 a+b 个E123E1, 共含有 a+b-1 个 , 共含有 a+b-2 个 , =(白球,球,球) ,12233A=(球,白球,球) , =(球,球,白球) ,这里“球”不论是白或者黑均可。AA事件 对第一次试验的结果加了条件, 。
10、如已知 出现,那么1A1a()=+bPA1A由 a-1 个白球 b 个黑球组成,所以 。如已知前二次都是22-|( )得到的白球,则 由 a-2 个白球 b 个黑球构成,所以 = 。 3 312(|)a-+b( )注意到随机试验 依赖于随机试验 后的结果,随机试验 依赖于随机试验2E1EE和随机试验 的结果,所以说 、 、 都是相依的随机试验。1E23例 2 设一批产品总共有 N 件,其中有 M 件产品是次品,不放回地抽取三件,试求第三件猜抽到的是正品的概率。解 令=抽到的第 i 件是正品 , i=1、2、3iA于是 表示抽到的第 i 件是次品,故所求的概率是i123121312()(|)(|
11、)PAPAMN()12注:上例中的概率 也可以直接用古典方法求得,但是不如使用乘123()PA法公式简单方便。这个公式中的条件概率不要从定义出发来求,而应从该条件所限制的一个较小样本空间内来求古典概率。2.2 概率的全概率公式定理 2 设 , , 为有穷或者可列多个互不相容的事件, =1,1H2 n()PH0, (n=1 ,2,3, ) ,则对任何一个事件,有nP.nn=|PHPA( )上面的式子称为全概率公式。证明 :由于 =1 得到 =0 。因为 互不相容,故 也n()n( ) nHnA互不相容,n=1 ,2,3, ,于是=PAnn()+PAH( )n=n由条件概率的乘法公式 ;带入上面的
12、式子得到nn|PAHnn=|PPA( )例 1 设甲盒子中有 a 个白球 b 个黑球,a0,b0,乙盒子中有 c 个白球d 个黑球,自甲盒子中任意取一球放入乙盒子中,然后再从乙盒子中任取一球,试求事件 A:“从乙盒子中取得的球为白球”的概率。解 以 表事件“自甲盒子中取出的球为白(黑)球 ”,显然 =12H 12H, ,所以 =1,又 0 0 ,1=12PH1a+bP2ba+P由全概率公式。2nnn=1|AA但是如 出现,那么乙盒子中有 c+1 个白球,d 个黑球,所以 =1H 1|PAH;类似得到 = 。代入 中便得c+d2|PHc+12nnn=1|P到 acbcdaA+=()1例 2 某个
13、工厂有四条流水线生产同一种产品,该四条流水线的产量分别占产量的 15%、20%、30% 和 35%,又这四条流水线的不合格品率依次为0.05、0.04、0.03 以及 0.02 。现在从出厂产品中任意取一件产品,问恰好抽到不合格品的概率为多少?又若该工厂规定,处了不合格的产品要追究有关流水线的经济责任,现在在出厂产品中任意取一件,结果为不合格品,但是该件产品是哪一条流水线生产的标志已经脱落,问厂方如何处理这件不合格品比较合理?比方说,第一条(或者第二条、第三条、第四条)流水线应该承担多大的责任?解 令A=任取一件,恰好抽到不合格品B=任取一件,恰好抽到第 i 条流水线的产品 (i=1、2、3、
14、4)于是由全概率公式得到 4iii=1()|PAB=0.5.204.30.502=0.0315=3.15%其中, 分别为 0.05、0.04、0.03、0.02 。这是题目中告诉我们的。i(|)PAB在实际问题中,这些数据可以从过去的生产的产品中统计出来。下面来解决下面的问题。从概率论的角度考虑可以按 的大小来追究第 i 条i|PBA(i=1、 2、3 、4)流水线的经济责任。例如,对于第四条流水线,由条件概率的定义知 44()|=PA在前面的计算当中,已经利用全概率公式来求得 4iii=1()|PAB= =0.0315=3.15%0.5.204.30.502而 444()(|).52.7PA
15、于是有 4441()|)0.(|) .2319iiiB 由此可知,第四条流水线应该负有 22.2%的责任。这个结果是容易理解的,虽然第四条流水线的产量占总产量的 35%,但是他的不合格率却不是很高,他生产的不合格品只占总不合格品的 22.2% ,所以在来计算下 、1(|)PBA和2(|)PBA3(|)111()|0.5.075BPAB141()|.7(|) .238)iii 由此可知,第一条流水线应该负有 23.8%的责任。222()(|)0.4.08PABB241|.8(|) .531()iii 由此可知,第二条流水线应该负有 25.4%的责任。333()(|)0.3.09PABB341|.
16、75(|) .2861()iii 由此可知,第三条流水线应该负有 28.6%的责任。上面的计算中实际上已经建立了一个非常有用的公式常常称为贝叶斯公式。2.3 概率的贝叶斯公式定理 3 设 , , 为有穷或者可列多个互不相容的事件,1H2=1, 0, (n=1 ,2,3, ) ,则对任何一个事件 A, 0 n()PHn P, 有 n(|)|mmnPAH上面的式子称为贝叶斯公式证明 :由条件概率的定义及全概率公式得到n(|)|mmmnPAHPH例子 设甲乙丙三个盒子中甲盒子中有 个白球 个黑球1a1b乙盒子中有 个白球 个黑球22丙盒子中有 个白球 个黑球 , 33123(0)a现在任意取出一盒子
17、,再从这个盒子当中取出来一个球,结果发现这个球为白球。试在事件 A“此球为白球”的条件下,求事件 “这个球是属于甲盒1H子的”条件概率 。1|PHA解 这里 ,这里 分别表示“这个球属于123=0123, ,甲盒子” “这个球属于乙盒子” “这个球属于丙盒子” ,这三个互不相容的事件, ,所以 ;又由全概率公式3n=13n=1()P3nnn=1|AHA0213a1a+3b+b所以可以用贝叶斯公式得到 11123ab|=+3a+PHA= 3121()ab)贝叶斯公式通常用在下列实际问题中:设只可能出现 共有123H, , 有穷个或者可列多种不同的情况,而事件 A 只能伴随着这些情况之一发生。如今
18、 A 已经出现的情况下,试求发生了情况 的条件概率。m例子 有朋自远方来,他乘坐火车来的概率是 ,乘船来,或者乘坐汽30车来,或者乘坐飞机来的概率分别是 , , ,如果他乘坐火车来,1525迟到的概率是 ;如果他乘坐船或者乘坐汽车,那么迟到的概率分别为 14 13, ; 如果乘坐飞机来便不会迟到(因而。这时迟到的概率为 0) 。结果他12是迟到了,试问在此条件下,他乘坐的是火车的概率是多少?解 以事件 A 表示“迟到” , 分别表示“乘坐火车”1234HH , , ,“乘船” “乘坐飞机” ,这样于是 11111223344(|)|=(|)+(|)+|)+(|)PAPHPPAH30415125
19、 注意 与 是不同的。类似的,如果以事件 A 的对立事件|=2PHA=P(不迟到)代替上面式子中的 A ,就得到1| 3104=2+155 =9342.4 概率的三定理的综合应用下列中各个例子可以说明上述定理的联合应用例 1 设甲乙二人在装有 a 个白球和 b 个黑球的盒子中任意取出一个球,从甲开始然后轮流取球。每次取后不还原,试求甲(或者乙)先取出的是白球的概率 (或者 ) 。1p2解 为了使甲先取出一个白球,必须也只须或者甲第一次就取出的球是白球(记为“白” ) ,或者甲第一次取出的球是黑球,乙第二次取出的球是黑球,甲第三次取出的球为白球(记为“黑、黑、白” ) 因而事件“甲先取出的球是白
20、球”可以表示为互不相容的事件“白” 、 “黑、黑、白” 、 “黑、黑、黑、黑、白” 的和,然而事件“白”的概率为 ,事件“黑、黑、白”的概率 ab可用概率的乘法公式 =12n()PA来计算得出 121312n12n-1()|(|)(|)PAAPA aba,事件“黑、黑、黑、黑、白”的概率任然可以用概率的乘法公式来计算出, ,所以1234abbaa1(1)(1)2(3)( 4)bbp a 同样得到 2 (1)21(3)abbpaab 注意,由于 b 是有穷数,故上面两个式子右方中自某一项起全为 0,又因为甲、乙二人中,总有一个人先取出白色的球,故 。以 、 的值12p1p2代入并且简化后,得到等
21、式 ()11bbabaa于是我们附带地用概率的方法证明了上面的恒等式。用概率的方法来证明一些关系或者解决其他一些数学分析中的问题。是概率论中的重要研究方向之一。例 2 从装有 a 个白球和 b 个黑球的盒子中同时取出 n 个球, ,试abn求至少取出一白球的概率 p 。解 先求对立事件的概率,事件 B:“取出的全部是黑球”的概率是bnqa所以 (1)1(1bnpqaab还可以用另一个让发求得 p :同时取出 n 个球可以看成不还原地连续取出 n 次,每次取出一个球。为了使 n 次中至少取出一白球,必须也只须或者第一次就得到白球(概率为 ) ,或者第一次取出的是黑球第二次取出的是白球(概率ab为
22、 ) , ,这些事件互不相容,所以1ab121 1ababbnapabn 比较上面的两个式子,可见它们右方的值相等,于是又得到恒等式:当a0 时 (1)2()1+ 1bbbnaaa()()12bbn 第三章条件概率的应用在前面的内容中我们认识的大多概率都是在样本空间中的。并且只是计算了一些条件概率,许多的实验都是用某些特定的条件概率来描述。在理论上这意味着:样本空间中的概率可由给定的条件概率中推到出来。下面来介绍几个条件概率的应用3.1 用条件概率所定义的概率波利亚罐子模型罐子模型。一个罐子中包括 b 个黑球与 r 个红球。随机地抽取一个球。看了颜色再放,并且还要另外加进去 c 个与抽出来的球
23、具有同样颜色的球和 d 个相反颜色的球(这个时候罐子里面就有 r+b+c+d 个球了) ,这种过程反复地进行,其中 c 和 d 是任意的整数。C 和 d 可以取为负数,不过在这种情形下经过有限次取球之后会因为没有了球而停止。特别的,取 c=-1,d=0,则我们的抽样就变成了无放回的抽样,它在 r+b 次以后就结束现在我们转向数学描述,注意一点就是,某些基本的概率可以通过它所确定的条件概率来计算。对应于 n 次抽取的样本空间的典型的描述法是用 n 个字母 B 和 R 的序列来代表其样本点。事件“第一次取出的球是黑的” (即是第一个字母是 B 的全部序列所构成的集合)的概率为 。如果第一个球是黑色
24、的()br球,则第二次取出的球的颜色任然为黑色的概率是 因此黑()cd黑的概率为 ()()bcrd黑黑黑的概率为 ()(2)()bcbcrdrd显然这样的方法可以计算出每一个样本点的概率概率的显式表达式不是很容易得到的,除非在下面介绍的一个重要的而且著名的特殊情形:波利亚管子模型,其特征是 d=0,c0。每次抽取后,这时候与取出来的球有相同颜色的球的数目增加,而与取出的球的颜色不同的球的数目保持不变。在效果上看,每一次取出的球是什么颜色增加了下一次也取到这种颜色球的概率,因此,我们得带到了类似传染病的一个模型,在这其中,每一次传染以后都增加再传染的概率。在 n 次抽取中,先取出 个黑球后在取出
25、 个红球(这1n2n当中 )的概率是12n12()2()()2bcbcrrcrb考虑 n 个抽取为 个黑球, 个红球的其他抽取顺序,计算它的概率,发现因12n子是相同的,只是排列的次序是不同的。因此可以得到抽出 个黑球和 个红1n2球的所有可能的抽取方式具有不同的概率,这为波利亚罐子模型咋分析上的简明性,分子分母同乘以 ,即是所有的排列的数目,利用广义二项式系式得1n到下列形式: 1 21 12, ()(+)nbcnrcbrcnp3.2 配对问题例 有 n 张信纸,分别标号为 1,2,3,n,另外有 n 个信封也同样标号,今将每一张信纸任意的装入每一个信封中,试求“没有一个配对”的概率及“恰有
26、 r 个配对成功”的概率 ( ) ,这里说的“r 个配对”是指的是0qrq有 r 张信纸,分别装入同号码的信封。解 以 表示“第 i 号信纸装入第 i 号信封”这一事件,则iA01()niqPA为了求 ,利用一般加法公式。第 i 号信纸可以装入 n 个信封,恰1()niP好装入第 i 号信封的概率 ,故1()iAn1()1iisP如 出现,第 j 号信纸共有 n-1 个信封可以选择,故iA(|)jin1(|)ijijiAAn从而 2,()(1)22!ijijsP类似地一般有, (r=1,2,n)1!rs于是 10 01()()()!kknnnikqPA注意 与 n 有关,如记为 则0q0q1lim().36xne利用 便不难求出 。如果指定某 r 张信纸装入对应的信封中,这事件0r的概率为1()nr其余 n-r 张信纸中没有一个配对成功的概率为 00(1)()!knrkq由于 r 张配对的信纸一共有 种选择的方法,所以r00(1)(1)(1)!kknrnrr kqn注意当 时候,1(rqe