1、二项分布与超几何分布 是两个非常重要的 、 应用广泛的概率模型 , 实际中的许多问题都可以利用这两个概率模型来解决 。 在实际应用中 , 如何理解它们的关联性同时又能区分 两个概率模型呢 ? 本文笔者就此问题予以阐述 。一 、 超几何分布与二项分 布的定义1.一般地 ,在含有 M件次品的 N件产品中 ,任取 n件 ,其中恰有 X件次品数 ,则事件 X=k 发生的概率为P (X=k) =CMkCnmnkCNn, k=0, 1, 2, , m其中 m=min M,n, 且 nN, MN, n, M, NN*。 其分布列为超几何分布列 。 如果随机变量 X的分布列为超几何分布列 , 则称随机变量 X
2、服从超几何分布 。2.一般地 , 在相同条件下重 复做的 n次试验称为 n次独立重复试验 。 在 n次独立重复试验中 , 设事件 A发生的次数 X, 在每次试验事件 A发生的概率为 p,那么在 n次独立重复试验中 , 事件 A恰好发生 k次的概率为P (X=k) =CnkPk(1-p)n-k, k=0, 1, 2, , n。 此时称随机变量 X服从二项分布 , 记作 XB (n, p), 并称 p为成功概率 。二 、 超几何分布与二项分 布的区别从它们的定义不难看出 超几何分布研究的是 试验后的结果 (不研究试验中先后取的顺序 ), 并且是无放回的抽取 ; 二项分布研究的是既有研究先后发 生的
3、顺序又有试验结果 , 并且是有放回的抽取 。 超几何分布是无放回的抽取 , 即每做一次试验 , 下一次再发生同一事件 A的概率已经发生了变化 , 即每次发生的概率都不相等 。 实质上 , 超几何分布是古典 概型的一种特例 。二项分布是有放回的抽取 , 每做一次试验 , 发生同一事件 A的概率都相同 。 这就是二者之间 的区别 。 本文笔者举例说明 :例 1: 在装有 4个黑球 6个白球的袋子中 , 任取 2个 ,试求 : (1) 不放回地抽取 , 取到黑球数 X的分布列 ;(2) 有放回地抽取 , 取到黑球数的分布列 。解 : (1) 是不放回地抽取 , X服从超几何分布 。从 10个球中任取
4、 2球的结果数为 C102, 从 10个球中任取 2个 , 其中恰有 k个黑球的结果数为 C4kC62-k, 那么从 10个球中任取 2个 , 其中恰有 k个黑球的概率为P (X=k) =C4kC62kC102, k=0, 1, 2。所以随机变量 X的分布列是(2) 是有放回地抽取 , 每次抽到黑球的概率相同 ,XB (2,0.4)。 那么从 10个球中任取 2个 , 其中恰有 k个黑球的概率为P (X=k) =C2K04K062K, k=0, 1, 2。所以随机变量 X的分布列是三 、 超几何分布与二项分 布的联系例 2 某批 n件产品的次品率为 2%, 现从中任意地抽出 3件进行检验 。
5、问 : 当 n=500, 5000, 50000时 , 分别以放回和不放回的方式抽取 , 恰好抽到 1件次品的概率各是多少 ?解 : (1) 当有放回地抽取时 , 次品数 XB (3,0.02)P (X=1) =C31002 (1002)20057624(2) 无放回地抽取时 , X服从超几何分布n=500时 , P (X=1) =C101C4902C50030057853n=5000时 , P (X=1) =C1001C49002C500030057647n=50000时 , P (X=1) =C10001C490002C5000030057626说明 : 当产品总数很大而抽 出的产品较少时 , 每次抽出产品后 , 次品率近似不变 , 这样就可以近似看成每次抽样的结果是相互 独立的 , 抽出产品中的次品件数近似服从二项分布 。总之 , 在教学过程中 , 教师要让学生深刻体会超几何分布与二项分布的区 别与联系 , 引导学生发掘题中所给的隐含条件 , 抓住实质 , 从而能够正确解题 ,并能利用所学知识解决 一些实际问题 。超几何分布与二项分布的区别与联系X 0 1 mpCM0CN-Mn0CNnCM1CN-Mn1CNnCMnCN-MnmCNnX 0 1 2P13815215X 0 1 2P 036 048 016