1、第3章 用概率分布描述随机变量,主要内容,3.1度量事件发生的可能性 3.2随机变量的概率分布 3.3几个重要的小样本分布 3.4样本统计量的抽样分布2,3.1度量事件发生的可能性,确定性现象:自然界和社会生活中,在一定的条件下,某种现象的结果是唯一的,并且事先可知。如:水在一个大气压下100度时必然沸腾;地铁票价;铁块不能漂浮在水面上。 随机现象:自然界和社会生活中,在一定的条件下,其结果不唯一;并且事先不知道哪种结果会出现。如:天气温度;投掷硬币观察向上的那一面 事件 :随机现象的每一种可能的结果。记为;1, 2, 3, n也称为样本点或基本事件。 随机事件 :在一次观察中可能发生或不发生
2、的事件。用A,B,C,D表示。分别是样本点的集合。投掷一枚标有1、2、3、4、5、6数字的立方体两次,向上面上的数字之和为8。 A=(26),(62),(35),(53),(44),3.1度量事件发生的可能性,确定性事件 :或称为必然事件。在一次观察中必然发生的事件。用表示 不可能事件:在一次观察中必然不发生的事件,用表示。 样本空间:所有基本事件的集合或全体。用表示 逆事件:样本空间中扣除事件A后的所有基本事件的集合: 事件的运算: “并,+”; “与,积”; “差,-” ,“包含或 ”;“等价 ,=”,3.1度量事件发生的可能性,频率:做N次试验,事件A发生了n次,事件A的频率F(A)=n
3、/N 事件的概率P(A):表示做一次试验,A发生的可能性大小, 0P(A)1。当试验次数无限大时, F(A)趋近于一个常数,即P(A)。 P(A)=F(A)“频率代替概率原则” 事件的概率必须满足两个条件 : 必然事件的概率为1 ;不可能事件的概率为0。,3.2随机变量的概率分布,随机变量:用数值来描述特定试验一切可能出现的结果,它的取值事先不能确定,具有随机性。用英文字母X、Y、Z等表示 如:一年内,某地区出生的婴儿人数X某种产品的销售量Y某地区的温度Z投篮50次,投中的次数Z1小时内120、110、119、121的电话呼叫次数X,3.2随机变量的概率分布,随机变量(一维随机变量) : 1.
4、离散型;只取整数值。 2.连续型;能取任意值。 随机变量的密度函数:描述随机变量的特征,表明随机变量的取值及其取相应值的概率 对离散型随机变量而言,概率密度函数可表示为;,3.2离散型随机变量的特征值,1.随机变量的特征值:表明随机变量取值基本情况;如平均值,标准差等。 2.离散型随机变量的平均值:称为数学期望E(X);中心值 3.离散型随机变量的方差:Var(X)=D(x),3.2.2离散型随机变量的概率分布,伯努利(Bernoulli)分布:两点分布 ;只取两个值二项分布:把伯努利分布独立的做n次,3.2.2离散型随机变量的概率分布,泊松分布(Poisson):一段时间内,电台的呼叫次数,
5、3.2.3连续型随机变量的概率分布,连续性随机变量:可以取任意值,取值在某个区间内。 分布函数 密度函数 密度函数的性质,3.2.3连续型随机变量的概率分布,正态分布:钟型分布,两头小、中间大。,3.2.3连续型随机变量的概率分布,关于X=u对称,均值决定了它的位置,方差决定了图形的陡峭或平坦标准正态分布:均值u=0,方差=1。用Z表示 密度函数:(x), 分布函数,u,3.2.3连续型随机变量的概率分布,ECXEL中的正态分布函数 1.NORMDIST;计算给定均值、方差的正态分布的概率 2.NORMSDIST;计算标准正态分布的概率 3.NORMSINV;计算已知概率时,标准正态分布的反函
6、数,3.3小样本分布,分布:,3.3小样本分布,ECXEL中的卡方分布函数 1.CHIDIST;计算给定自由度的卡方分布的概率 2.CHIINV;计算给定自由度卡方分布右尾概率的反函数,3.3小样本分布(T分布),分布,3.3小样本分布(T分布),EXCEL中的T分布函数 1.TDIST;计算给定自由度T分布的右侧概率值 2.TINV;计算给定自由度和概率值的反函数,3.3小样本分布(F分布),分布,3.3小样本分布(F分布),EXCEL中的F分布函数 1.FDIST;计算给定自由度时F分布的概率值 2.FINV;计算给定自由度和概率值的右尾反函数值,3.4样本统计量的抽样分布,1)样本统计量:是指不包含任何未知参数的样本的函数 2)抽样分布:是指样本统计量的随机分布。如:样本均值的分布,样本比例的分布,样本标准差的分布等,3.4样本统计量的抽样分布,1)样本均值的抽样分布 当样本量(n30)足够大时,样本均值的抽样分布服从正态分布2)样本比例的抽样分布3)样本方差的抽样分布,3.4样本统计量的抽样分布,统计量的标准误差 1)样本均值的标准误差:2)样本比例的标准误差:,本章小结,概率的含义 随机变量 随机变量的概率分布 常见的概率分布,