1、第八章 假设检验,1 假设检验,一、假设检验的定义和基本思想,1、定义,在总体的分布函数完全未知或只知其形式,但不 知其参数的情况下,为了推断总体的某些未知特 性,提出某些关于总体的假设,然后根据样本对 所提出的假设作出是接收,还是拒绝的决策,称 这一过程为假设检验。,2、基本思想,接下来,是要讨论如何检验假设 是正确还是错误的?,我们知道 是 的无偏估计, 的观察值 的大小在一定程度上反映了 的大小,因此观察值 与 的偏差 不应太大;,这里是根据实际推断原理(即小概率事件在一次试验中几乎是不发生的)。,接下来,是要根据给定的样本值,去考察是否有一个拒绝 的小概率事件发生。,假设 成立 ,则
2、。 选择 , 使 是一个拒绝原假的小概率事件,一单它发生了,即有 ,我们就有理由怀疑假设 的正确性,所以我们是通过控制概率 来作出是否接受假设 的决策。,例如在本例中取 ,则有 ,又已知 ,再由给定的样本观察值算得 , 所以 ,即 于是拒绝 ,认为这天包装机工作不正常。,对于事先给定的一个很小的数 ,如果要使得则 ,所以我们只要验证是否有 。若 ,即小概率事件发生了,则拒绝 。,这里是采用反证法的思想,为了检验“假设 ”是否成立,先假设这个“假设 ”是成立的,看由此会产生什么后果。如果导致了一个不合理的现象出现(小概率事件发生),就表明原来的假设是不正确的,也就是说,“假设 ”是不能成立的。因
3、此应拒绝这个“假设”;如果没有导致一个小概率事件发生,则没有理由拒绝原假设。实际上,假设检验的基本思想是一种带有概率的反证法。,3、有关的几个概念,通常我们称 为原假设(或称零假设),而称 为备择假设(或称对立假设),称数 为显著水平,称统计量 为检验统计量。当检验统计量取某个区域 中的值时,就拒绝原假设,则称区域 为拒绝域,拒绝域的边界点为临界点。,例如上例的拒绝域为 ,而 为临界点。,二、两类错误,由于我们是根据一次抽样结果对假设作出判断的,因此不可避免地会犯以下错误:,(1) 当 为真时,我们可能犯拒绝 的错误,我们将这类错误称之为第I类错误; 该错误的概率可表示为 ,该类错误是“弃真”
4、错误;,(2) 当 不真时,我们也可能犯接受 的错误,我们将这类错误称之为第II类错误;该错误的概率可表示为 ,该类错误是“取伪”错误。,设一袋中装有黑球和白球共5个,可能是2黑3白,也可能是4黑1白,为了检验假设:袋中有2个黑球, 袋中有4个黑球从该袋中抓取两个球,检验规则为:当取到的两个都是黑球时,就拒绝 ,否则接受 ,求该检验方法犯第一类错误的概率和犯第二类错误的概率 。,由此可知,以上所讲的假设检验就是对犯第一类错误的概率加以控制,而没有考虑犯第II类错误的概率,我们将这类假设检验称为显著性检验。即对事先给定的小数 ,寻找拒绝域 ,使得,三、单边检验,我们将形如 的假设检验称为双边假设
5、检验。,通常称形如 的假设检验为右边检验;称形如 的假设检验为左边检验;我们把右边检验和左边检验统称为单边检验。,这里要注意:当 时,有,类似地可得左边检验 的拒绝域为,由于 ,由上式得,例2:某工厂生产的固体燃料推进器的燃烧率服从正态分布 , ,现在用新方法生产了一批推进器,从中随机取 25 只,测得燃烧率的样本均值为 ,设在新方法下总体均方差仍为 ,问用新方法生产的推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著水平,四、如何选定原假设 和备择假设,尽管在一对对立假设中,可以挑选其中之一作为原假设,但在进行显著性检验时,我们是通过使犯第I类错误的概率很小,而不考虑犯第II类
6、错误的概率,这就意味着 是受保护的,也表明 、 的地位不是对等的,因此选择哪一个假设作为原假设是有区别的,选择原假设 和备择假设 的原则是:,(1)使得两类错误中后果严重的错误成为第I类错误;,注: 特别是对单边假设检验,如果没有明确告诉采用怎样的假设作为原假设,一般都要根据以上的原则来选择原假设。,(2)持谨重的态度,取原假设为维持现状;即取 为“无效率”、“无改进”、“无价值”等。,五、 假设检验的基本步骤,1、根据实际问题的要求,提出原假设 和备择假设 ;,2、给定显著水平 和样本容量 ;,3、确定检验统计量及拒绝域的形式;,4、按 求出拒绝域;,5、取样,根据样本观察值作出是接受还是拒
7、绝 的决策。,2 正态总体均值的假设检验,一、单个总体均值的检验,1、已知 ,关于 的检验,(1) 双边检验,双边检验问题为:,拒绝域为,通常称这种检验为 检验法。,(2)单边检验,右边检验问题:,在显著水平为 下的拒绝域为,左边检验问题:,在显著水平为 下的拒绝域为,2、 未知,关于 的检验,(1) 双边检验,双边检验问题为:,在显著水平为 下的拒绝域为,通常称这种检验为 检验法。,(2) 单边检验,右边检验问题:,在显著水平为 下的拒绝域为,左边检验问题:,在显著水平为 下的拒绝域为,二、 两个正态总体均值差的检验,1、 方差 已知的情形,(1) 双边检验,双边检验问题为:,在显著水平为
8、下的拒绝域为,(2) 单边检验,右边检验问题:,在显著水平为 下的拒绝域为,左边检验问题:,在显著水平为 下的拒绝域为,2、方差 未知且相等的情形,(1) 双边假设检验,双边检验问题:,在显著水平为 下的拒绝域为,(2)单边检验,右边检验问题:,在显著水平为 下的拒绝域为,左边检验问题:,在显著水平为 下的拒绝域为,双边检验问题:是双边检验问题:当 时的一种特殊情形。,单边检验问题:或 是单边检验问题:或当 时的一种特殊情形。,三、 举例,注意: 怎样选择原假设的问题!,3 正态总体方差的假设检验,一、 单个总体方差的检验,双边检验问题:,取 作为检验统计量,检验问题的拒绝域的形式为:,或,1
9、、双边假设检验,通常取,由上 分位点的定义知,通常,称这种检验法为 检验法。,2、单边假设检验,右边检验问题:,拒绝域的形式为:,这里要注意:当 时,有,必需,二、两个总体的方差检验,1、双边假设检验,双边检验问题:,拒绝域的形式为:,通常,取,所以,2、单边假设检验,所以,得,在显著水平为 下的拒绝域为,四、举例,例1: 某厂生产的某种型号的电池,其寿命(以小时计)长期以来服从方差为 的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变。现随机取26只电池,测出其寿命的样本方差 。问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取显著水平 )?,例2: 在平
10、炉上进行一项试验以确定改变操作方法 的建议是否会增加钢的得率,试验是在同一只平炉 上进行的。每炼一炉钢时除操作方法外,其它条件 都尽可能做到相同。先用标准方法炼一炉,然后用 建议的新方法炼一炉,以后交替进行,各炼了10炉, 其得率分别为 (1)标准方法:78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3 (2) 新方法: 79.1 81.0 77.3 79.1 80.079.1 79.1 77.3 80.2 82.1设这两个样本相互独立,且分别来自正态总体 和 , 均未知,首先检验两个方差 是否相等?如果相同,问建议的的新操作方法能否提 高得率?(取 ),所以接受原假设,假设两个总体方差相等是合理的。,(2) 检验问题为:,方差未知, ,采用左边两个正态总体均值差检验法,它的拒绝域为,由给的条件知,查表得 , ,所以拒绝 , 即新操作方法能提高钢的得率。,4 置信区间与假设检验的关系,一、双边检验与置信区间的关系,