1、1,第六讲:正态分布,2,学习目标,掌握正态分布的特性; 正态分布曲线下面积的含义; 标准分的计算和应用; 利用标准正态分布表计算概率。 理解大数定理和中心极限定理,3,一、什么是正态分布?,4,从 “分布” 说起,5,直方图用长条的面积来表示频次或相对频次; 折线图用直线连接直方图中条形顶端的中点;当组距逐渐减小时,折线将逐渐平滑为曲线。,6,峰点(Peak)研究,单峰,多峰,7,几种常见的频数分布曲线,8,一、 正态分布曲线,9,1.1 什么是正态分布?,1、由德国数学家高斯提出,也叫高斯分布; 2、自然界、社会经济生活中大量存在的分布规律; 3、经典统计推断的基础; 4、在所有的分布中,
2、 正态分布居于首要 位置;,10,1.2 正态分布的基本特征,特征一:一个高峰 特征二:一条对称轴 特征三:一条渐近线,M0Md=,众值=中位值均值,11,1.3 正态分布的数学表达式,(x) = 随机变量 X 的频次(概率密度) 总体标准差; = 总体方差 = 总体均值 =3.14159; e = 2.71828 x = 随机变量的取值 (- x ),12,1.4 两个参数的影响( , ),位置参数,均 值,标准差,形状参数,13,1.4.1 对正态曲线的影响,1 2 3,14,1.4.2 对正态曲线的影响,曲线A和B的比较,16,正态曲线的位置由均值 决定;正态曲线的形状“高,矮,胖,瘦”
3、的特点由标准差 决定;当 较小时,曲线“高”且“瘦”;当 较大时,曲线“矮”且“胖”。,17,二、正态曲线下的面积,18,2.1 正态曲线下面积的涵义,随机变量的频次总和; 一般把正态曲线下的总面积约等于1,这时一定区间内的频次分布表现为概率分布。,19,2.2 正态曲线的一个重要性质,无论正态曲线具有哪种均值和标准差,在均值和横坐标某一点的距离内(用标准差来表示)曲线下的面积是常数。下图说明此意。,20,正态曲线下的面积(图), -, + ,95.46%,68.26%,21,2.3 几个典型取值区间的概率值,P( - + ) =0.6827; P( -2 +2 )=0.9545; P( -3
4、 +3 )=0.9973;,22,三、标准正态分布,23,3.1 什么是标准正态分布,以标准差为单位的正态分布一般称为标准正态分布(standardized normal distribution),24,3.2 标准正态分布的重要性,简化统计分析一般的正态分布取决于均值和标准差 ;计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,25,3.3 标准分(Standard scores),公式:,Z值代表每个X值在标准正态分布上的数值。,26,3.4 标准正态分布的表达式,正态分布的表达式为:N( , )
5、标准正态分布的表达式为:N(0,1) 标准正态分布是一般正态分布的特例,即0, 1的正态分布。,27,3.5 标准分的实际意义,各总体之间可以通过标准分进行合理的比较 不同总体间综合指标的比较 如:甲城市居民月收入的均值为3000元,标准差为500元;乙城市居民月收入的均值为4500元,标准差为1000元。若甲城市的居民A的月收入为4000元,乙城市居民B的月收入为5500元。看起来B的收入比A的高,但与本地其他居民相比较,结果可能有所不同。这时候就需要把A与B的收入都转换成标准值,进行更加直观的比较。 结果是?,28,3.6 标准分的应用,例题:李明参加了全校新生入学摸底考试,数学得了90分
6、,英语得了75分。假定全校新生数学成绩的均值 =85分,标准差 =10分;全校新生英语成绩的均值 =60分,标准差 =5。这次考试李明哪门科目考试考得好一些?,29,3.7 标准正态分布的面积,P(-1 Z 1 ) =0.6827; P(-2 Z 2 ) =0.9545; P(-3 Z 3 ) =0.9973;由于标准正态分布N(0,1)的图形是唯一的,因此使用标准正态分布无须自己计算,只需要学会查表就行了。,30,四、标准正态分布表的使用,31,4.1 标准正态分布表的介绍,见教材P385附录二 有问题,32,4.2标准正态分布的计算,【例5】已知服从标准正态分布N(0,1),求P( 1.3
7、)=? 解:因为 服从标准正态分布N(0,1),可直接查附表4,根据z=1.3,有P( 1.3)= 1.3=0.9032,Xi:大写,小写 读作:克西,33,【例6】:,已知服从标准正态分布N(0,1),求P( 1.3)=? 解:因为 1, 而 P( 1.3) P( 1.3)1 因此有P( 1.3)1 P( 1.3)1 1.30.0968,34,【例7】,已知服从标准正态分布N(0,1),求P( 1.3)=? 解:附表四中没有给出Z0的 Z值。根据标准正态分布图形是以Z0为对称的原理, P( 1.3)=1 1.30.0968,35,【例8】,已知服从标准正态分布N(0,1),求P(1.3 2.
8、3)? 解: P(1.3 2.3) 2.3 1.3=0.98930.9032=0.0861,36,【例9】,根据统计,北京市初婚年龄服从正态分布。其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人,其百分比为多少? 解:1. 年龄换为标准分: Z1 ,Z22. 查表得 Z1 0.50, Z2 0.8413 Z2 - Z1 =0.3413, 所以25岁到30岁之间结婚的人,百分数为34.13%.,37,4.3 标准正态分布表的使用,1. 通过标准分公式,将一般为正态分布转换为标准正态分布; 2. 计算概率时 ,查标准正态分布表; 3. 对于负的 x ,可由 (-x) x得到; 4. 对于
9、标准正态分布,即XN(0,1),有 P (a X b) b a P (|X| a) 2 a 1,38,常用的标准值,Z 1.65,概率P为0.05; Z 1.96,概率P为0.025; Z 2.58,概率P为0.005;,39,五、大数定理和中心极限定理,40,5.1 极限定理,简单讲,凡是采用极限的方法(例如,观察次数n趋于无限)所得出的一系列定理统称极限定理。极限定理分为两类:大数定理(Law of large numbers)中心极限定理 (Central limit theorem),41,5.2 大数定理,【例子】 从扑克牌盒中取出一张牌,出现牌“K”的概率是1/13,在取的次数比较
10、少时,出现“K”的频率可能与1/13相差得很大,但是在取的次数很多时,出现“K”的频率接近1/13几乎是必然的。,42,5.2 大数定理,这些例子说明,在大量随机现象中,不仅看到了随机事件频率的稳定性,而且还看到平均结果的稳定性。这就是概率论中大数定理的概念。阐明大量随机现象平均结果的稳定性的一系列定理。著名的大数定理:贝努里大数定理和切贝谢夫大数定理,43,5.2.1 贝努里大数定理,多次重复试验,随机事件的频率日趋稳定,具有接近概率的趋势。,44,5.2.2 切贝谢夫大数定理,多次重复试验,随机变量的平均值接近数学期望(即总体均值)。,45,5.3 中心极限定理,任何变量,不管其原有分布如何,如果把它们n 个加在一起,只要n足够大,其和的分布必然接近正态分布,均值的分布也接近正态分布。,46,为什么社会经济生活、自然界存在许多随机变量的分布都服从正态分布?请结合中心极限定理来解释。,47,如果一个现实的量是由大量独立偶然的因素的影响叠加而得,且其中每一个偶然因素的影响又是均匀地微小的话,可以断定这个量将近似地服从正态分布。这就解释了为什么在自然、社会、经济领域里大量存在服从正态分布的随机变量。例如,身高、体重、智商、婚龄等等,因为影响它们的因素都是大量的。,