1、离散型随机变量及其分布知识点一:离散型随机变量的相关概念;随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母 、 等表示离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。若 是随机变量, ,其中 、 是常数,则abab也是随机变量连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量 离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不
2、可以一一列出离散型随机变量的分布列:设离散型随机变量 可能取的值为 取每12ix、 一个值 的概率为 ,则称表1,2ix()iiPxp1x2 iPp 为随机变量 的概率分布,简称 的分布列 知识点二:离散型随机变量分布列的两个性质;任何随机事件发生的概率都满足: ,并且不可能事件的概率为 ,必然0()1PA0事件的概率为 由此你可以得出离散型随机变量的分布列都具有下面两个性质: 1;(1) 0,2ip, 12()P特别提醒:对于离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率的和即 1)()()kkkxxPx知识点二:两点分布:若随机变量 X 的分布列: 则称 X 的分布列为
3、两点分布列.特别提醒:(1)若随机变量 X 的分布列为两点分布, 则称 X 服从两点分布,而称 P(X=1)为成功率.(2)两点分布又称为 0-1 分布或伯努利分布(3)两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等等;都可以用两点分布列来研究.知识点三:超几何分布:一般地,在含有 件次品的 件产品中,任取 件,其中恰有 件次品,则MNnX0 1P称超几何分布列.(),01,min,knMNCPXMnN 其 中为超几何分布列, 知识点四:离散型随机变量的二项分布;在一次随机试验中,某事件可能发生也可能不发生,在 次独立重复试验中这个n事
4、件发生的次数 是一个随机变量如果在一次试验中某事件发生的概率是 ,那么 p在 次独立重复试验中这个事件恰好发生 次的概率是n kknkqpCP)(, ( 0,123, pq1)于是得到随机变量 的概率分布如下:0 k nnqp1n nqpC 0qpC由于 恰好是二项式展开式:knC中的各项的值,所以称这样的01 0()nnknn 随机变量 服从二项分布,记作 ,其中 , 为参数,并记(,)Bp:p(,)knpqbkp知识点五:离散型随机变量的几何分布:在独立重复试验中,某事件第一次发生时,所作试验的次数 也是一个正整数的离散型随机变量 “ ”表示在第 次独立重复试验时事件第一次发生.如果把 次
5、kk k试验时事件 发生记为 、事件 不发生记为 ,AAk, ,那么()kp(), (1)kqp11231231()()(kk kPPPAqp (0,2, q于是得到随机变量 的概率分布如下: pq2p 1kqp称这样的随机变量 服从几何分布,记作 1(,),0,12,.kgpq其 中知识点六:求离散型随机变量分布列的步骤;(1)要确定随机变量 的可能取值有哪些.明确取每个值所表示的意义;0 1 nN nNC(2)分清概率类型,计算 取得每一个值时的概率(取球、抽取产品等问题还要注意是放回抽样还是不放回抽样;(3)列表对应,给出分布列,并用分布列的性质验证.几种常见的分布列的求法:(1)取球、
6、投骰子、抽取产品等问题的概率分布,关键是概率的计算.所用方法主要有划归法、数形结合法、对应法等对于取球、抽取产品等问题,还要注意是放回抽样还是不放回抽样.(2)射击问题:若是一人连续射击,且限制在 次射击中发生 次,则往往与二项分布nk联系起来;若是首次命中所需射击的次数,则它服从几何分布,若是多人射击问题,一般利用相互独立事件同时发生的概率进行计算.(3)对于有些问题,它的随机变量的选取与所问问题的关系不是很清楚,此时要仔细审题,明确题中的含义,恰当地选取随机变量,构造模型,进行求解.知识点六:期望数 学 期 望 : 一 般 地 , 若 离 散 型 随 机 变 量 的 概 率 分 布 为x1
7、 x2 xn P p1 p2 pn 则称 为 的 数 学 期 望 , 简 称 期 望E1px2n数 学 期 望 的 意 义 : 数 学 期 望 离 散 型 随 机 变 量 的 一 个 特 征 数 , 它 反 映 了 离 散 型 随 机 变 量 取值 的 平 均 水 平 。平 均 数 与 均 值 : 一 般 地 , 在 有 限 取 值 离 散 型 随 机 变 量 的 概 率 分 布 中 , 令 1p2,则有 , ,所以 的 数 学 期 望 又 称np12p1nE1(x21)nx为 平 均 数 、 均 值 。 期望的一个性质:若 , 则baba)知识点七:方差;方差:对于离散型随机变量 ,如果它所
8、有可能取的值是 , , , , , 且 取1x2nx这 些 值 的 概 率 分 别 是 , , , , , 那 么 ,1p2np 称为随机变量 D21)(Ex)(ExnpE)(的均方差,简称为方差,式中的 是随机变量 的期望标准差: 的算术平方根 叫做随机变量 的标准差,记作D方差的性质: ; .ab2)(22)(方差的意义:(1)随机变量 的方差的定义与一组数据的方差的定义式是相同的;(2)随机变量 的方差、标准差也是随机变量 的特征数,它们都反映了随机变量取值的稳定与波动、集中与离散的程度;(3)标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛.二项分布的期望与方差:若 ,则
9、, ,Bnp:Enp1Dp几何分布的期望和方差:若 , 其 中 , , 则 , .,gkp1kq0,12kq12知识点八:正态分布;(1)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.(2)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为的样本,就是进行了 次试验,试验连同所出现的结果叫随机事件,所有这些事件的nn概率分布规律称为总体分布.(3)总体密度曲线:样本容量越大,所分
10、组数越多,各组的频率就越接近于总体在相应各组取值的概率设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线 位位位b位O位/位a(4)总体分布密度密度曲线函数 的两条基本性质:()yfx ( );由曲线 与 轴围成面积为 .()fx0R1(5)解决总体分布估计问题的一般程序如下:先确定分组的组数(最大数据与最小数据之差除以组距得组数) ;分别计算各组的频数及频率(频率 ) ;总 数频 数画出频率分布直方图,并作出相应的估计.(6)条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折
11、线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.(7)正态分布密度函数:简称正态曲线,2(),1(),(,)(0)xxe 函 数 式 中 的 实 数 、 是 参 数 ,(),bxaXPadX随 机 变 量 满 足 : 则 称 的 分 布 为 正 态 分 布其中 是圆周率; 是自然对数的底; 是随机变量的取值; 为正态分布的均值;是正态分布的标准差.正态分布一般记为 。即若 ,则),(2N2,N:,E2D(8)正态分布 是由均值 和标准差 唯一决定的分布),(N通过固定其中一个值,讨论均值与标准差对于正态曲线的影响 , 它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间 内取值的,ab概率等于该区间上总体密度曲线与 轴、直线 、 所xx围成曲边梯形的面积.