1、第4章 假设检验,主要内容,假设检验的原理 总体均值的假设检验 总体比例的假设检验 总体方差的假设检验 两总体均值差的假设检验,引 例,某健身俱乐部欲根据往年的会员情况,制定2011年的会员发展营销策略。主管经理估计俱乐部会员的平均年龄是35岁,其中2535岁的会员占总人数的70%。研究人员从2009年入会的新会员中随机抽取40人,调查得知他们的平均年龄是32岁,其中2535岁的会员占74%。根据这份调查结果,问主管经理的对会员年龄的估计是否准确?(总体均值和总体比例) 假定总体分布中的参数是未知的,但事先对参数的取值作出假定;如:均值(平均年龄)=35,2535岁占比(P)=70% 思考:1
2、.本假定是否正确?需要检验。2.如何检验?需要抽样。利用样本的信息来验证(检验)原假定是否正确?,统计学是通过假设检验的方法来解决上述问题的。 假设检验(Hypothesis testing)和参数估计(Parameter estimation)是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断参数估计是用样本统计量估计总体参数的方法,总体参数在估计之前是未知的 假设检验则是先对总体参数的取值提出一个假设,然后利用样本信息去检验这个假设是否成立,统计方法,统计方法,统计描 述,统计推断,参数估计,假设检验,假设检验的基本原理,假设检验(Hypothesis Testing)也称为显著
3、性检验,是事先作出一个关于总体参数取值的假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断方法。 假设检验的理论依据是概率论中的“小概率事件在一次试验中不可能发生”原理。 大数定律:当试验次数足够大时,小概率事件必然发生。“日久见人心”,“路遥知马力”。“保险”,假设检验的过程和思路 概率意义下的反证法,总体,假设总体的 平均年龄是35岁,样本均值是32岁,样本,假设检验的步骤,第一步:根据问题要求提出原假设(Null hypothesis,H0)和备选假设(Alternative hypothesis,H1); 原假设H0:
4、关于总体参数的取值情况的假定 备选假设H1:与原假设H0相互对立,需要支持或证实的。 第二步:确定适当的检验统计量及相应的抽样分布; 第三步:选取显著性水平,确定原假设的接受域和拒绝域; 第四步:计算检验统计量的值; 第五步:作出统计决策。 下面结合例题1对每一个步骤的内容进行分析和说明,举例1,某健身俱乐部主管经理估计会员的平均年龄是35岁,研究人员从2011年入会的新会员中随机抽取40人,调查得到他们的年龄数据如下。,试根据调查结果判断主管经理的估计是否准确?,1. 提出原假设和备选假设,原假设(Null hypothesis)又称零假设,是需要通过样本推断其正确与否的命题,用H0表示。
5、本例中可以提出: H0 : m=35;这里m表示总体会员的平均年龄,意味着总体会员的平均年龄与主管经理估计的35岁没有差异 与原假设对立的假设是备选假设,用H1表示。 在本例中,备选假设意味着“总体会员的平均年龄与主管经理估计的会员平均年龄35岁有显著差异”,可以表示为H1 : m35。 原假设与备选假设互斥,检验结果二者必取其一。,原假设,陈述需要检验的假设,用 H0 表示 例如: H0: = 35代表“正常”的情形 总是包含等号“=”。 H0: p= 70% 检验以“假定原假设为真”开始。反证法,备择假设,为原假设的对立情况,用H1表示 例如: H1: 35; : H1: P 35 不包含
6、等号;,, 需要支持和证实的,2. 确定适当的检验统计量,假设检验需要借助样本统计量进行统计推断,称为检验统计量。不同的假设检验问题需要选择不同的检验统计量 检验统计量:利用样本的信息构造的函数。 在具体问题中,选择什么统计量,需要考虑的因素有:总体方差已知还是未知,用于进行检验的样本是大样本还是小样本,等等 在本例中,由于n=4030是大样本,所以 近似服从正态分布,以样本标准差代替总体标准差,所用的统计量是:,3. 选取显著性水平,确定接受域和拒绝域,显著性水平(Significant Level):事先给定的形成拒绝域的小概率,用a表示 通常取a=0.01, a=0.05或a=0.10;
7、表明,当作出接受原假设的决定时,其正确的概率为99%,95%或90% 拒绝域:原假设 H0 成立条件下,统计量落入的小概率区域接受域:统计量能够取值的非拒绝域。 本例为双侧检验,有 接受域:1.96z1.96 拒绝域:z1.96 a/2,-1.96,1.96,1-a,a/2,在实际应用中,一般是先给定显著性水平,这样就可以由有关的概率分布表查到临界值(critical value) ,从而确定H0的接受域和拒绝域。对于不同形式的假设, H0的接受域和拒绝域也有所不同。,如图所示,双侧检验的拒绝域位于统计量分布曲线的两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,右单侧检验的拒绝域位于统计量分
8、布曲线的右侧。,4. 计算检验统计量的值,在提出原假设H0和备选假设H1,确定了检验统计量,给定了显著性水平a以后,接下来就要根据样本数据计算检验统计量的值。其计算的基本公式为:上式不是计算检验统计量的唯一公式在本例中,,5. 作出统计决策,根据样本信息计算出统计量z的具体值,将它与临界值 相比较,就可以作出接受原假设或拒绝原假设的统计决策。 在本例中,由于z=3.1841.96,落在拒绝域内,所以拒绝原假设H0。可以得出结论:在a=0.05的显著性水平下,抽样结果的平均年龄显著低于主管经理的估计值,有理由认为经理的估计不准确。,假设检验中的两类错误,第一类错误 弃真错误。原假设正确,因为抽样
9、等原因,反 而拒绝了原假设。后果很严重 犯第一类错误的概率为 第二类错误 取伪错误。原假设错误,因为抽样等原因,反 而接受了原假设。 犯第二类错误的概率为 ,假设检验中四种可能结果的概率,对于一定的样本量n,不能同时做到减小犯这两种错误的概率。如果减小a错误,就会增大b错误的机会;如果减小b错误,则会增大a错误的概率。因此,在假设检验中,需要对这两类错误进行控制。, 与 的逆向关系,不能同时降低两类错误!,假设检验中的P值,P值(P-value)是指在原假设为真时,所得到的样本观察结果的概率,即样本统计量落在观察值以外的概率 根据“小概率原理”,如果P值非常小,就有理由拒绝原假设,且P值越小,
10、拒绝的理由就越充分 实际应用中,多数统计软件直接给出P值,其检验判断规则如下(双侧检验): 若P值a/2,则拒绝原假设; 若P值 a/2 ,则不能拒绝原假设。,单侧检验,1. 左单侧检验:拒绝区域在左侧 产品的使用寿命能够达到8000小时的要求吗? H0: 8000 H1: 8000 2. 右单侧检验:拒绝区域在右侧 新产品的使用寿命比以往的8000小时有显著提高吗?H0: 8000 H1: 8000,假设检验的内容,假设检验,总体均值的 假设检验,总体比例的 假设检验,总体方差的 假设检验,s未知,s已知,两个总体均值差 的假设检验,已知标准差,总体均值的Z检验,1. 将样本统计量(如 )转
11、换为标准正态分布Z变量。 2. 给定显著性水平,可得 ,Z的临界值。与Z值比较 如Z检验统计量的值落在临界域内则接受H0否则,不能接受H0,已知,均值的双侧Z检验,假设 总体服从正态分布; 当(n 30)时,不服从正态分布的总体可以用正态分布来近似 原假设只有“=”号; 使用Z检验统计量,H0,临界值,临界值,(1/2),(1/2),样本统计量,拒绝域,拒绝域,非拒绝域,拒绝域,抽样分布,1 ,置信度,举例2,2005年北京市职工平均工资为32808元,标准差为3820元。现在随机抽取200人进行调查,测定2006年样本平均工资为34400元。按照5%的显著性水平判断该市2006年的职工平均工
12、资与2005有无显著差异?,解答,本例中,我们关心的是前后两年职工的平均工资有没有显著的差异,因此,属于双侧检验。检验过程如下: (1)提出假设: H0:m=32808;H1:m32808; (2)总体标准差s已知,大样本抽样,故选用Z统计量; (3)显著性水平a=0.05,由双侧检验,临界值: 。判断规则为:若z1.96或z-1.96,则拒绝H0;若-1.96z 1.96,则不能拒绝H0。 (4)计算统计量Z的值(5)检验判断:由于 ,落在拒绝域,故拒绝原假设H0。 结论:以5%的显著性水平可以认为该市2006年的职工平均工资比2005年有明显的差异。,已知,均值的单侧Z检验,1. 假设 总
13、体服从正态分布; 当(n 30)时,不服从正态分布的总体可以用正态分布来逼近。 2. 原假设有 或者 号: H0 :uu0, H0:uu0 3. 使用Z检验统计量,Z,0,Z,0,拒绝域,拒绝域,H0:0 H1: 0,H0:0,H1: 0,较小的m值与H0不矛盾.,拒绝域,1 - ,1,举例3,已知某电子产品的使用寿命服从正态分布,根据历史数据,其平均使用寿命为8000小时,标准差为370小时。现采用新的机器设备进行生产,随机抽取了100个产品进行检测,得到样本均值为7910小时。试问在5%的显著性水平下,新的机器是否合格?,解答,这是一个左单侧检验问题。抽样的目的是为了检测新机器生产的产品使
14、用寿命是否达到标准,我们比较关心的是使用寿命的下限,如果新产品的使用寿命与过去相比没有明显降低,则说明所使用的新机器合格;反之,则说明新机器不合格。检验过程如下: (1)提出假设: H0:m8000;H1:m8000; (2)总体标准差s已知,大样本抽样,故选用Z统计量; (3)显著性水平a=0.05,由单侧检验,临界值 (4)计算统计量Z的值:(5)检验判断:由于 ,落在拒绝域;故拒绝原假设H0。即认为产品的使用寿命有明显降低,新机器不合格。,未知的大样本检验,1. 假设 总体服从正态分布; 当(n 30)时,不服从正态分布的总体可以用正态分布来近似 2. 使用Z检验统计量,用样本方差代替总
15、体方差 3. 将样本统计量转换为标准正态分布Z变量4. 与Z的临界值比较 如Z检验统计量的值落在临界域内则接受H0 否则,拒绝H0,举例4,某乳制品厂生产的一种盒装鲜奶的标准重量是495克。为了检测产品合格率,随机抽取100盒鲜奶,测得产品的平均重量为494克,标准差为6克,试以5%的显著性水平判断这批产品的质量是否合格?,解答,产品的标准重量是495克,过轻或者过重都不符合产品质量标准。检验过程如下: (1)提出假设: H0:m=495;H1:m495; (2)总体标准差s未知,但是由于大样本抽样,故仍选用Z统计量 (3)显著性水平a=0.05,由双侧检验,临界值(4)计算统计量Z的值,式中
16、用s代替s:(5)检验判断:由于 ,落在接受域;故不能拒绝原假设H0,即不能说明这批产品不符合质量标准。,未知的小样本检验,1. 假设:总体服从正态分布; 2. 使用t检验统计量3. t检验的决策规则: 若采用双侧检验,临界值为-ta/2和ta/2 。当-ta/2 t ta/2时,落入接受域,不能拒绝原假设;反之,则拒绝原假设。 若采用左单侧检验,临界值为-ta。当t ta时,落入拒绝域,拒绝原假设;反之,则不能拒绝原假设。,举例5,沿用例4,对鲜奶产品进行抽样检查,随机抽取10盒产品,测得每盒重量数据如下(单位:克):496、499、481、499、489、492、491、495、494、5
17、02。试以5%的显著性水平判断这批产品的质量是否合格?,解答,根据前面的分析,本例题为双侧检验问题。检验过程如下: (1)提出假设: H0:m=495;H1:m495; (2)总体标准差s未知,小样本抽样,故仍选用t统计量; (3)当a=0.05,自由度n-1=9时,由双侧检验,查表可以得出临界值: (4)计算统计量t的值:(5)检验判断:由于 ,落在接受域;故不能拒绝原假设H0,即不能说明这批产品不符合质量标准。,假设检验的内容,假设检验,总体均值的 假设检验,总体比例的 假设检验,总体方差的 假设检验,两个总体 比例之差,单一总体,两个总体均值差 的假设检验,单一总体比例的假设检验,通常是
18、在大样本条件下进行的,根据正态分布来近似临界值,其检验方法和步骤与均值检验时相同。 待检验的假设为: 双侧检验: 左侧检验: 右侧检验: 检验统计量为:,举例6(双侧),沿用引例。主管经理估计25-35岁的会员占总人数的70%,随机抽取40人,调查得知其中25-35岁的会员占74%。试以5%的显著性水平判断主管经理的估计是否准确?,解答,根据题意,建立如下假设: 样本比例 p=0.74; 显著性水平 a=0.05,由双侧检验,临界值:Za/2=1.96; 由于是大样本抽样,样本统计量Z值为: 由于 ,即Z的值落入接受域,故不能拒绝原假设;即不能认为主管经理的估计错误。,两个总体比例之差的假设检
19、验,假设两个总体服从二项分布。两个总体中具有某种特征单位数的比例分别为p1和p2,但p1和p2未知,可用样本比例p1和p2代替。 待检验的假设为: 双侧检验: 左侧检验: 右侧检验: 检验统计量为:,举例7(单侧),某电子产品厂商对两条流水线上生产的同种产品进行质量检测,检测结果如下: A流水线:抽样检测产品100个,合格92个; B流水线:抽样检测产品80个,合格76个; 能否根据上述检测结果,以5%的显著性水平判断流水线B的合格率比流水线A的合格率高?,解答,根据题意,这是一个左单侧检验问题,建立如下假设: 样本比例 p1=0.92,p2=0.95; 显著性水平 a=0.05,由左单侧检验
20、,临界值: Za=-1.645; 统计量Z值为: 由于 ,落入接受域,故不能拒绝原假设;即不能认为流水线B的产品合格率高于流水线A的。,假设检验的内容,假设检验,总体均值的 假设检验,总体比例的 假设检验,总体方差的 假设检验,两个总体 方差比,单一总体,两个总体均值差 的假设检验,单一总体方差的假设检验,对方差进行检验的程序,与均值检验、比例检验是类似的,它们的主要区别在于使用不同的检验统计量 方差检验使用c2统计量:,H0,临界值,临界值,1/2,1/2,样本统计量,拒绝域,拒绝域,非拒绝域,拒绝域(双侧),抽样分布,1,置信度,举例8,沿用例4,某乳制品厂的一种盒装鲜奶产品的标准重量是4
21、95克,现改进生产工艺,要求每盒的误差上下不超过3克。从新生产出的产品中随机抽取15盒进行检查,测得产品的重量误差如下(克)。试以5%的显著性水平判断这批产品的质量是否合格。,解答,本例为双侧检验,拒绝域为: 或建立如下假设: 计算得:s2=8.617 显著性水平a=0.05,两个临界点分别为: 统计量结论:由于 落在接受域,故不能拒绝原假设;即认为这批产品的重量达到标准。,两个总体方差比的假设检验,假定两个总体都服从正态分布。 用两个样本方差的比来进行判断:如果 接近于1,说明两个未知的总体方差很接近;如果比值结果远离1,说明s12和s22之间有较大差异。 建立假设(双侧): 或或 两个方差
22、之比服从F分布,使用F统计量:,在原假设下,检验统计量: ,此时F统计量的两个自由度分别为:分子自由度n1-1,分母自由度n2-1。 在双侧检验中,拒绝域在F分布的两侧,两个临界点的位置分别为:在单侧检验中,拒绝域在F分布的右侧,建立如下假设: 临界点为 其中,F1-a/2,1/2,1/2,拒绝域,拒绝域,非拒绝域,拒绝域(双侧),抽样分布,1,Fa/2,F,举例9,某校抽查了20名学生的应用统计学考试成绩,其中,男生12人,女生8人,他们的分数见下表。根据这组数据,以5%的置信水平检验两个总体(男、女生的平均成绩)的方差是否相等。,解答,本题采用双侧检验,建立如下假设:计算得: 统计量由a=
23、0.05,有:结论:由于 故不能拒绝;即可以认为这两个总体的方差没有显著差异。,假设检验的内容,假设检验,总体均值的 假设检验,总体比例的 假设检验,总体方差的 假设检验,配对样本,独立样本,两个总体均值差 的假设检验,已知s,未知s,独立样本,1. 已知 Z统计量 2. 未知,大样本 Z统计量 3. 未知,小样本 假设总体服从正态分布; t统计量。,均值之差的Z检验,样本统计量:1. 已知 2. 未知,大样本,举例10,瑜伽和舍宾是近年来流行的休闲健身方式,某健身俱乐部对这两种方式的减肥瘦身效果进行了数据统计,结果显示:在参加为期一个月的健身班后,瑜伽班成员的减重量标准差为0.75千克;舍宾
24、班的减重量标准差为0.95千克。 现从两个健身班中各抽取一个随机样本,样本量分别为n1=40,n2=35,瑜伽班的平均减重量为 =2.35千克,舍宾班的平均减重量为 千克。试以5%的显著性水平判断两种健身方式在减肥瘦身效果上是否有显著差别?,解答,由于检验两种健身方式在减肥效果上是否有显著差别,没有涉及方向,故本例是双侧检验。检验过程如下: (1)提出假设: (2)两个总体标准差s均已知,大样本抽样,选用Z统计量; (3)显著性水平a=0.05,由双侧检验,查表可以得出临界值:(4)计算统计量 : (5)检验判断:由于 ,落在接受域,故不能拒绝原假设;即不能认为两种健身方式在减肥效果上有显著差
25、别。,均值之差的t检验( ),1.小样本条件下,检验两个具有相同方差的独立总体的均值。 2.假设 两个总体都是正态分布; 如果不是正态分布,可以用正态分布近似 (n1 30 & n2 30 ); 总体方差未知,但可以假定两个方差相同,3. 样本统计量:式中,t的自由度为 n1+n2-2;,均值之差的t检验( ),1.小样本条件下,检验两个具有不同方差的独立总体的均值。 2.假设 两个总体都是正态分布; 如果不是正态分布,可以用正态分布近似 (n1 30 & n2 30 ); 总体方差未知,但假定两个方差不相等。,3. 抽样分布近似服从自由度为f 的t分布: 样本统计量:式中,t的自由度为 f;
26、,举例11,沿用例10。从瑜伽班和舍宾班中分别随机抽取10名和15名成员进行体重减轻量的调查,得到如下结果(单位:千克)。试以5%的显著性水平判断两种健身方式在减肥瘦身效果上是否有显著差别?,解答,本题为双侧检验问题,建立假设为:由于是小样本,两个总体方差未知,且无法判断 是否成立,故选用t统计量,其自由度为f; 计算得: 由t分布表可查知: 样本统计量t值:由于 ,落在接受域,故不能拒绝原假设;即不能认为两种健身方式在减肥效果上有显著差别。,配对样本,1. 检验两个相关总体的均值 对应的 (Matched) 重复测量 (前/后) 2. 排除对象之间的差异 3. 假定 两个总体都服从正态分布
27、如果不服从正态分布,可以用正态分布来近似 (n1 30 & n2 30 ),配对样本的t检验,检验统计量:其中,差值的均值 ,标准差,举例12,仍然沿用例10。为了比较参加健身班前后体重的变化情况,现从瑜伽训练班中随机抽取8名学员,调查得到她们在参加健身班前后的体重数据(单位:千克)如下。假设参加健身班前后的体重均服从正态分布,试以5%的显著性水平判断参加健身班后体重是否比之前显著降低?,解答,H0: m0 即参加健身班后体重没有显著降低; H1: m 0 即参加健身班后体重显著降低 依题意:由于得到的是配对样本的数据,差值服从正态分布,总体标准差未知且小样本,计算统计量t:由a=0.05,单侧检验,查t分布表得到: 接受域为: ;拒绝域为 ; 结论:由于 ,落在拒绝域,故拒绝原假设H0 ;即可以认为参加健身班后体重显著降低。,本章小结,参数检验的基本原理 总体均值的检验 总体比例的检验 总体方差的检验,