1、第九章 假设检验(一),1,9.1 假设检验的基本概念,假设检验:对一个或多个总体的概率分布或参数的假设. 所作的假设可以是正确的, 也可以是错误的.,为判断所作的假设是否正确, 从总体中抽取样本, 根据样本的取值, 按一定的原则进行检验, 然后, 作出接受或拒绝所作假设的决定.,2,例1. 某厂有一批产品,按国家规定标准,次品率不得超过4才能出厂。现从中任取10件进行检验(每次取1件,取后放回),发现有4件次品,问该批产品能否出厂?,1.问题的提出,假设该批产品的次品率为p, 问题:检验假设p4%是否成立? 利用抽样的结果来判断这一假设是否成立。,3,若以X表示折断力,那么这个例子的问题就化
2、为:如何根据抽样的结果来判断等式:“EX570”是否成立。,例2.某车间生产的一种铜丝,其折断力服从N(570, 64)。现改变生产工艺,并从新产品中抽取10个样品进行测量,得 575.2(N), 问折断力大小与原来是否相同?(假定方差不会改变)。,上述例子的共同特点是:先对总体的参数或总体的分布函数的形式作某种假设H0,然后由抽样结果对假设H0是否成立进行推断。 在数理统计学中,称检验假设H0的方法为假设检验。,5,在假设检验中,通常把那个需要我们去检验是否为真的假设H0称为原假设或者零假设。,如例1中的假设H0:p4%,例2中的假设H0:EX570,等等。例1,例2是对总体参数的假设进行判
3、断,这类问题称为参数的假设检验。,6,检验假设的依据是“小概率事件在一次试验中实际上是不可能发生”原理(概率论中称它为实际推断原理). 它是指 这样一个信念:概率很小的事件在一次实际试验中是不可能发生的。如果发生了,人们宁愿认为该事件的前提条件起了变化。,2.假设检验的基本思想,7,小概率原理又称实际推断原理,它是概率论中一个基本而有实际价值的原理,在日常生活中也有广泛应用。人们出差,旅行可以放心大胆地乘坐火车,原因是火车出事故这事件的概率很小,在一次试验(乘坐一次火车)中,这个小概率事件实际上不会发生的。,8,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分
4、布,H0,9,假设检验的过程,10,假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”,11,某厂生产的螺钉,按标准强度为68克/mm2, 而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要 求,否则认为不符合要求.为此提出如下假设:,现从该厂生产的螺钉中抽取容量为 36 的样本, 其样本均值为 ,问原假设是否正确?,引 例,12,若原假设正确, 则,13,规定 为小概率事件的概率大小,通常取= 0.05, 0.01,例如, 取 = 0.05 , 则,因此, 可以确定一个常数 c , 使得,14,由,15,显著性水平和
5、拒绝域 (双侧检验 ),16,显著性水平和拒绝域 (双侧检验 ),17,显著性水平和拒绝域 (双侧检验 ),18,由引例可见,在给定 的前提下,接受还是 拒绝原假设完全取决于样本值, 因此所作检验可能导致以下两类错误的产生:,19,H0 为真,H0 为假,正确,正确,第一类错误(弃真),第二类错误(取伪),假设检验的两类错误,犯第一类错误的概率通常记为 犯第二类错误的概率通常记为 ,20,H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像 一场审判过程,统计检验过程, 错误和 错误的关系,你不能同时减少两类错误!,和 的关系就像翘翘板,小 就大, 大 就小,22,希望所用的检验方
6、法尽量少犯错误,但不能完全排除犯错误的可能性. 在样本的容量给定的情形下, 不可能使两者都很小,降低一个, 往往使另一个增大.,假设检验的指导思想是: 控制犯第一类错误的概率不超过 ,然后, 若有必要,通过增大样本容量的方法,减少 .,23,所以,拒绝 H0 的概率为 , 又称为显著性水平, 越大,犯第一类错误的概率越大, 即越显著.,本引例中,犯第一类错误的概率=P(拒绝H0|H0为真),若H0为真, 则,24,H0 真,H0 不真,25,一般,作假设检验时,先控制犯第一类 错误的概率 , 在保证 的条件下使 尽量地小.要降低 一般要增大样本容量. 本课程仅考虑控制 .,备择假设可以是单侧的
7、,也可以是双侧的.引例中的备择假设是双侧的.如果根据以往的生产情况, 0 = 68.现采用了新工艺,关心的是新工艺能否提高螺钉强度, 越大越好.此时, 可作如下的假设检验:,注 1,注 2,26,右侧检验: 原假设 H0 : = 68;,备择假设 H1 : 68,给定显著性水平 , 根据,可确定拒绝域,27,因而, 接受域,称这种检验为右侧检验.,原假设 H0: = 0 = 68,备择假设 H1: 68,左侧检验,类似可确定拒绝域,因而, 接受域,28,显著性水平和拒绝域 (左侧检验 ),29,显著性水平和拒绝域 (左侧检验 ),30,显著性水平和拒绝域 (右侧检验 ),置信水平,31,显著性
8、水平和拒绝域 (右侧检验 ),32,关于零假设与备择假设的选取,H0与H1地位应平等,但在控制犯第一类错误 的概率 的原则下,使得采取拒绝H0 的决 策变得较慎重,即H0 得到特别的保护.,因而,通常把有把握的、有经验的结论作为 原假设,或者尽可能使后果严重的错误成为 第一类错误.,注 3,33,假设检验的步骤,根据实际问题所关心的内容, 建立原假设 H0与备择假设H1,在 H0为真时,选择一个合适的检验统计量V ,它的分布是已知的,由H1确定拒绝域的形式,给定显著性水平 , 对应的拒绝域,双侧检验,右边检验,左边检验,其中,34,第二节 正态总体均值和方差的假设检验,一. 设XN(,2),而
9、2 为已知. U检验,(1)已知2.待检验的假设:H0:= 0,检验水平:(给定的小量)- 双边检验,第一步 提出假设 H0: =0(原假设);H1: 0(备选假设).,第二步 构建检验统计量,35,第三步 确定拒绝域,第四步 由样本提供的信息计算出u 的值,并对H0的正确性进行推断.,若 则拒绝原假设(H0伪) 若 则接受原假设(H0真),第五步 给出结论,假设检验统计量拒绝域推断结论,36,例1 我国健康成年男子的脉搏平均为72次/分,标准差为6.4次/分,现从某体院男生中,随机抽出25人,测得平均脉搏为68.6次/分.根据经验脉搏X服从正态分布.如果标准差不变,试问该体院男生的脉搏与一般
10、健康成年男子的脉搏有无差异?并求出体院男生脉搏的置信区间.,解:此例是在已知=6.4的情况下,,第二步 统计量,第一步 检验假设 H0:=72,37,对于=0.05,查标准正态分布表得,因为|u0|=2.6561.96,故拒绝H0.,第三步 确定拒绝域,拒绝域: |u|1.96,第五步 结论该体院男生的脉搏与一般健康 成年男子的脉搏存在差异。,第四步 现在n=25, =68.6,由于,所以,该体院男生脉搏的95%的置信区间为66.1 , 71.1。,39,H0 原假设; H1 备选假设,第一步 提出假设 H0: =0(原假设);H1: 0(备选假设).,第二步 构建检验统计量,(2)(右边检验
11、)H0:0;H1: 0, 此时样本信息显示 0,第三步 确定拒绝域,第四步 由样本提供的信息计算出 的值,并对H0的正确性进行推断.,若 则拒绝原假设(H0伪) 若 则接受原假设(H0真),第五步 给出结论,类似可以由左边检验。相应的拒绝域形式为,例2 已知某零件的质量XN(,2),由经验知=10g, 2=0.05.技术改新后,抽取8个样品,测得质量(单位:g)为 9.8,9.5,10.1,9.6,10.2,10.1,9.8,10.0, 若方差不变,问平均质量是否比10为小? (取=0.05),解 本例是一个左边检验问题, 检验假设:,选取统计量,42,由样本值计算出,查标准正态分布表得,故接受假设,在H0为真的条件下,43,作业,习题九 3,44,