1、假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章讨论参数检验方法。,第五章 参数假设检验,第一节 假设检验的基本思想一、小概率原理二、假设检验的一些基本概念,讨论,某种药物有强烈作用,按规定每片有效成分含量均值为0.5mg,标准差为0.01mg。假定药片有效成分含量服从正态分布。问怎样判断这个厂家的产品是否符合要求?,要解决的问题:是否合格?,有效成分含量为随
2、机变量,问题3: 时,能否说明产品不合格?,讨论,判断方法:抽样,问题1 抽样方法? 问题2 样本容量?,估计,随机抽样模拟1,假设:药品符合要求=0=0.5;,随机抽样模拟2,假设:药品不符合要求0=0.5;,例5.1 某种药物有强烈作用,按规定有效成分含量为0.5mg/片。今随机抽取某厂生产的这种药品12片,测得平均有效含量为0.4938mg。假定药片有效成分含量服从标准差为0.01mg的正态分布。问这个厂家的产品是否符合要求?,例5.1,解 该药厂此药品的有效成分含量为X.,考虑两个假设: (a)该药厂的此药品符合要求=0=0.5; (b)该药厂的此药品不符合要求0=0.5.,例5.1,
3、样本均值 与0.5有差异,差异产 生的两种情形:,(1)抽样误差 (2) 抽样误差,讨论,样本均值 与0.5有差异,差异产生的原因:,(1)标准差为0.01mg, 随机误差,(2)随机抽取, 抽样误差,(3),讨论,=0.5,小,大,寻找界值c,0.5,0.5,0.5,大,一、小概率原理,例5.1 某种药物有强烈作用,按规定有效成分含量为0.5mg/片。今随机抽取某厂生产的这种药品12片,测得平均有效含量为0.4938mg。假定药片有效成分含量服从标准差为0.01mg的正态分布。问这个厂家的产品是否符合要求?,(1),假设=0.5,(2)确定不利于假设=0.5 的范围,(3)定义小概率事件,概
4、率小于=0.05的事件为小概率事件。,确定“界”的规则:,(4)计算“界c”,(5)根据当前样本数据作推断,判定=0.5不成立,即认为0.5.,“反证法” +小概率原理,矛盾!,假设=0.5不成立,0.5。,结论:,理论上: 若假设=0.5成立,事实上:,事件 为小概率事件,事件 不是小概率事件,“反证法” +小概率原理,矛盾!,假设=0.5不成立,0.5。,结论:,理论上: 若假设=0.5成立,事实上:,事件 为小概率事件,事件 不是小概率事件,二、假设检验的一些基本概念,总体的期望是否等于一个特定的值:两种分布的期望值是否相等: 随机变量X是否服从二项分布:,关于总体的种种假设称为统计假设
5、(statistical hypothesis),1.统计假设 例,测得140例30岁以上的冠心病病人血清胆固醇为220.742.2,另有487名同龄非冠心病者血清胆固醇为175.430.6,想了解冠心病病人的血清胆固醇是否较高?,统计假设 例,某医师研究洛赛克治疗消化性溃疡的疗效,以泰胃美作为对照,观察结果如下:,统计假设 例,在冠心病普查中,研究冠心病与眼底动脉硬化两者之间是否存在一定的关系?,2.假设检验,利用样本提供的信息判断假设是否成立的统计方法,称为假设检验(hypothesis testing). 总体的期望是否等于一个特定的值:两种分布的期望值是否相等: 随机变量X是否服从二项
6、分布:,3.原假设与备择假设,原假设(null hypothesis,零假设):H0 :=0.5 备择假设(alternative hypothesis): H1 :0.5,3.原假设与备择假设,假设=0.5成立,概率小于=0.05的事件为小概率事件。,?,事件 为小概率事件,3.原假设与备择假设,H0:=0.5, H1:0.5.,H0:0.5, H1:=0.5.,不能用一个例子去证明一个结论,因此用一个样本(例子)不能证明一个命题(假设)。但是可以用一个例子(样本)推翻一个命题。,由 确定c时,4. 检验统计量,检验统计量,5.显著性水平,统计学上的结论: 在=0.05的水平上,拒绝假设=0
7、.5,认为0.5.,即认为该厂的此药的有效成分含量与规定的水平0.5的差异有统计学意义(statistical significance).,显著性水平(significance level) 检验水平(level of test),给定检验水平,检验统计量(即 )的可 能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过的区域 ,是零假设的拒绝区域;大概率区域是概率为 1-的区域,是零假设的接受区域。,问题:,1. 假设检验要解决的是什么样的问题? 2.在例5.1中给的条件“正态分布”起的什么作用?如果没有这个条件能否解决例5.1的问题? 3.为什么在例5.1中样本均值不
8、等于规定的值时还不能说生产不合格?在解决例5.1问题的过程中哪里反映了对产生差异来源的考虑?,4.这里的“反证法”是严格的逻辑上的反证? 5.例5.1中取不同的检验水平,结论会有什么变化么?如果有变化,那么这样的检验方法还有意义么?,问题1,1. 假设检验(hypothesis test)要解决的是什么样的问题?,利用样本的信息判断一些关于总体的假设是否成立,问题2,2.在例5.1中给的条件“正态分布”起的什么作用?如果没有这个条件能否解决例6.1的问题?,例5.1 某种药物有强烈作用,按规定有效成分含量为0.5mg/片。今随机抽取某厂生产的这种药品12片,测得平均有效含量为0.4938mg。
9、假定药片有效成分含量服从标准差为0.01mg的正态分布。问这个厂家的产品是否符合要求?,(3)定义小概率事件:=0.05,例5.1,(1)假设=0.5:,(2)确定不利的范围:,(4)计算“界”值。,问题3,3.为什么在例5.1中样本均值不等于规定的值时还不能说生产不合格?在解决例5.1问题的过程中哪里反映了对产生差异来源的考虑?,样本均值 与0.5有差异,差异产生的原因:,(1)标准差为0.01mg, 随机误差,(2)随机抽取, 抽样误差,(3),例5.1,样本均值 与0.5有差异,差异产生的 两种情形:,(1) 抽样误差 (2) 抽样误差,绝对差值,抽样误差,问题4,矛盾!,假设=0.5不
10、成立,0.5。,结论:,理论上: 假设=0.5,事实上:,事件 为小概率事件,事件 不是小概率事件,4.这里的“反证法”是严格的逻辑上的反证?,0.05水平上拒绝原假设H0 : =0.5,H0:=0.5,H1:0.5,0.5,H1:0.5,随机抽样模拟1,药品符合要求=0=0.5;,在=0.01的水平上,不拒绝假设=0.5.,问题5,问题5,在=0.05的水平上,拒绝假设=0.5. 在=0.01的水平上,不拒绝假设=0.5.,的大小决定检验结论的性质,43,5. 检验的-p值,样本当前值,检验统计量当前值,概率,检验的-p值,p-值就是拒绝原假设所需的最低显著性水平,p-值判断的原则是:如果p
11、-值小于给定的显著性水平,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,接受原假设。,随机抽样模拟1,药品符合要求=0=0.5;,拒绝原假设时,0.05水平上拒绝原假设H0 : =0.5,第一类错误,第I类错误:拒绝了正确的原假设弃真错误P拒绝H0|H0真第一类错误的概率,6.两类错误,犯第一类错误的概率,拒绝原假设H0 : =0.5,在=0.05的水平上,拒绝域:在=0.01的水平上,拒绝域:,检验水平, 拒绝域,检验水平,在=0.05的水平上,拒绝假设H0. 在=0.01的水平上,拒绝假设H0., =拒绝原假设的时犯第一类错误的概率的上限 1
12、-的大小反映拒绝原假设时的把握性、可靠性,接受原假设时,不拒绝原假设H0 : =0.5,随机抽样模拟2,药品不符合要求=4.9,6.第二类错误,第II类错误:接受不正确的原假设存伪错误 =P不拒绝H0|H0假第二类错误的概率,两类错误,第I类错误:拒绝了正确的原假设弃真错误P拒绝H0| H0真=显著性水平 第II类错误:不拒绝错误的原假设纳伪错误P不拒绝H0 | H0不真=,两类错误,例 诊断肝炎。原假设是“和正常人一样”。第I类错误是,把正常者判断为异常,造成误诊假阳性;,第II类错误是,把肝炎患者判断为正常,造成漏诊假阴性。,两类错误,的大小反映检验结论的把握性、可靠性 的大小决定检验结论的性质,显著性水平与统计结论,在=0.05的水平上,拒绝假设=0.5. 在=0.01的水平上,不拒绝假设=0.5.,单侧检验的拒绝域,拒绝域,面积为,H0:=0 H1: 0(or H1:0 ),右侧检验,双侧检验和单侧检验比较,双侧检验拒绝原假设时,单侧必然拒绝原假设.,双侧单侧,小结,假设检验 小概率原则 原假设 备择假设 检验水平 两类错误,问题:,在以下的条件下,确定检验的拒绝域 (1)总体正态,总体方差已知: H0:=0, H1:0 (2)总体正态,总体方差未知: H0:=0, H1:0 (3)两个总体正态,两个样本独立,方差齐性 H0:1=2, H1: 12,