1、第八章 假设检验,引言 第一节 假设检验 第二节 正态总体均值的假设检验 第三节 正态总体方差的假设检验 第四节 置信区间与假设检验之间的关系 习题课,若对 参数 有所 了解,但有怀 疑猜测 需要证 实之时,用假设 检验的 方法来处理,引 言,假设检验是指施加于一个或多个总体的概率分布或参数的假设. 所作假设可以是正确的,也可以是错误的.,为判断所作的假设是否正确, 从总体中抽取样本,根据样本的取值,按一定原则进行检验, 然后作出接受或拒绝所作假设的决定.,假设检验所以可行,其理论背景为实际 推断原理,即“小概率原理”,第一节 假设检验,假设检验,参数假设检验,非参数假设检验,这类问题称作假设
2、检验问题 .,总体分布已 知,检验关 于未知参数 的某个假设,总体分布未知时的假设检验问题,在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.,一、假设检验的基本思想和方法,生产流水线上罐装可乐不断地封装,然后装箱外运. 怎么知道这批罐装可乐的容量是否合格呢?,把每一罐都打开倒入量杯, 看看容量是否合于标准.,这样做显然不行!,罐装可乐的容量按标准应在350毫升和360毫升之间.,每隔一定时间,抽查若干罐 .,如每隔1小时,抽查5罐,得5个容量的值X1,X5,根据这些值来判断生产是否正常.,如发现不正常,就应停产,找出原因,排除
3、故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量.,通常的办法是进行抽样检查.,很明显,不能由5罐容量的数据,在把握不大的情况下就判断生产 不正常,因为停产的损失是很大的.,当然也不能总认为正常,有了问题不能及时发现,这也要造成损失.,如何处理这两者的关系,假设检验面对的就是这种矛盾.,在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动. 这些因素中没有哪一个占有特殊重要的地位. 因此,根据中心极限定理,假定每罐容量服从正态分布是合理的.,现在我们就来讨论这个问题.,罐装可乐的容量按标准应在 350毫升和360毫升之间.,它的对立假设是:
4、,称H0为原假设(或零假设);,称H1为备择假设(或对立假设).,H1:,这样,我们可以认为X1,X5是取自正态 总体 的样本,,现在要检验的假设是:,如何判断原假设H0 是否成立呢?,由于 是正态分布的期望值,它的估计量是样本均值,因此 可以根据 与 的差距,来判断H0 是否成立.,较小时,可以认为H0是成立的;,当,生产已不正常.,当,较大时,应认为H0不成立,即,问题:较大、较小是一个相对的概念。合理的界限在何处?应由什么原则来确定? 问题归结为对差异作定量的分析,以确定其性质.,差异可能是由抽样的随机性引起的,称为“抽样误差”或 “随机误差” 这种误差反映偶然、非本质的因素所引起的随机
5、波动 这种随机性的波动是有一定限度的 如果差异超过了这个限度,我们就不能用抽样的随机性来解释了 此时必须认为这个差异反映了事物的本质差别,即反映了生产已不正常 这种差异称作“系统误差”,问题:根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常? 即差异到底是由“抽样误差”还是“系统误差”所引起的?,解决:差异定量化,给出这个量的界限 。 如果差异在界限内,则认为是抽样误差; 如果差异超过界限,则认为是系统误差。,判断原则:小概率事件在一次试验中基本上不会 发生,回到我们前面罐装可乐的例中:,在提出原假设H0后,如何作出接受和拒绝H0的结论呢?,在假设检验中,我们称这个小
6、概率为显著性水平,用 表示.,常取,的选择要根据实际情况而定。,罐装可乐的容量按标准应在350毫升和360毫升之间. 一批可乐出厂前应进行抽样检查,现抽查了n 罐,测得容量为 X1,X2,Xn,问这一批可乐的容量是否合格?,提出假设,选检验统计量, N(0,1),由于 已知,,对给定的显著性水平 ,可以在N(0,1)表中查到分位点的值 ,有,我们可以取拒绝域为:,这样,“,”是一个小概率事件.,W:,如果由样本值算得该统计量的实测值落入区域W,则拒绝H0 ;否则,不能拒绝H0 .,如果H0 是对的,那么衡量差异大小的某个统计量落入区域 W(拒绝域) 是个小概率事件. 如果该统计量的实测值落入W
7、,也就是说, H0 成立下的小概率事件发生了,那么就认为H0不可信而否定它. 否则我们就不能否定H0 (只好接受它).,我们所依据的逻辑是:,注意:不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度 。,如果显著性水平 取得很小,则拒绝域 也会比较小.,其产生的后果是: H0难于被拒绝。,如果在 很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异.,基于这个理由,人们常把 时拒绝H0称为是显著的,而把在 时拒绝H0称为是高度显著的.,例2 某工厂生产的一种螺钉,标准要求长度是32.5毫米. 实际生产的产品,其长度X 假定服从正态分布未知,现从该厂生
8、产的一批产品中抽取6件, 得尺寸数据如下:,32.56, 29.66, 31.64, 30.00, 31.87, 31.03,问这批产品是否合格?,分析:这批产品(螺钉长度)的全体组成问题的总体X. 现在要检验E(X)是否为32.5.,二、假设检验的一般步骤,提出原假设和备择假设,第一步:,第二步:,能衡量差异大小且分布已知,第三步:,即“ ”是一个小概率事件 .,小概率事件在一次 试验中基本上不会 发生 .,得否定域 W: |t |4.0322,不在拒绝域中,故接受H0 。,第四步:,将样本值代入算出统计量 t 的实测值,第五步:作出判断,| t |=2.9974.0322,假设检验会不会犯
9、错误呢?,由于作出结论的依据是下述,小概率原理,小概率事件在一次试验中基本上不会发生 .,不是一定不发生,三、假设检验的两类错误,如果H0成立,但统计量的实测值落入否定 域,从而作出否定H0的结论,那就犯了“弃真”的错误 .,如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“取伪”的错误 .,假设检验的两类错误,P拒绝H0|H0为真= ,P接受H0|H0不真= .,犯两类错误的概率:,显著性水平 为犯第一类错误的概率.,两类错误的概率的关系,一般来说, 当样本容量固定时, 若减少犯一类错误的概率, 则犯有另一类错误的概率往往增大。 一般来说
10、, 总是控制第I类错误的概率, 使它不大于 , 的大小视具体情况而定, 通常 取0.1, 0.05, 0.01, 0.005等值。 这种只对犯第I类错误的概率加以控制, 而不考虑犯第II类错误的概率的检验, 称为显著性检验。,双边假设检验中的备择假设H1, 表示 可能大于也可能小于 , 称为双边备择假设。 左边检验和右边检验统称为单边检验。,双边假设检验:,左边检验:,右边检验:,例3 某工厂生产的固体燃料推进器的燃烧率服从正态分布,现在用新方法生产了一批推进器。从中随机取 n=25只,测得燃烧率的样本均值为,设在新方法下总体均方差仍为 2cm/s,问这批推进器的燃烧率是否较以往生产的推进器的
11、燃烧率有显著的提高?取显著性水平,z=3.1251.645,故拒绝H0 ,即认为这批推进器的燃料率较以往生产的有显著的提高。,落入否定域,解:提出假设:,取统计量,某织物强力指标X的均值 =21公斤. 改进工艺后生产一批织物,今从中取30件,测得 =21.55公斤. 假设强力指标服从正态分布 且已知 =1.2公斤, 问在显著性水平 =0.01 下,新生产织物比过去的织物强力是否有提高?,四、课堂练习,z=2.512.33,故拒绝原假设H0 ,即新生产织物比过去的织物的强力有提高。,落入否定域,解:提出假设:,取统计量,提出 假设,根据统计调查的目的, 提出 原假设H0 和备选假设H1,作出 决
12、策,抽取 样本,检验 假设,对差异进行定量的分析, 确定其性质(是随机误差 还是系统误差. 为给出两 者界限,找一检验统计量T, 在H0成立下其分布已知.),拒绝还是不能 拒绝H0,显著性 水平,P(T W)=-犯第一 类错误的概率, W为拒绝域,五 、小 结,第二节 正态总体均值的 假设检验,一、单个总体 均值 的检验,1. 已知,关于 的检验(Z检验)在上一小节中已讨论过正态总体 , 当 已知时关于 的检验问题.在这些检验问题中,我们都是利用 在为真时服从 分布的统计量 来确定拒绝域。这种检验法常称为 Z 检验法。,注意 :比较正态总体 在方差 已知时,对均值 的两种检验问题 和 尽管两者
13、原假设 的形式不同,实际意义也不一样,但对于相同的显著性水平,它们的拒绝域是相同的。因此遇到形如 的检验问题,可归结为 来讨论。对于下面将要讨论的其它正态总体的参数的检验也有类似的结果。,2. 未知,关于 的检验(t检验)设总体 ,其中 未知,我们来求检验问题的拒绝域(显著性水平为 )。设 是来自正态总体X 的样本,由于 未知,现在不能利用 来确定拒绝域了。,注意到 是 的无偏估计,我们用 S 来代替 ,采用 作为检验统计量。当过分大时就拒绝 , 拒绝域的形式为已知当 为真时, ,故由P 拒绝 为真 ,,得 , 即拒绝域为对于正态总体 ,当 未知时,关于 的单边检验的拒绝域在课本附表中已给出。
14、,例1 某种电子元件的寿命 X(以小时计)服从正态分布, 均未知。现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于225(小时)?,上述利用 t 统计量得出的检验法称为 t 检验法。在实际中,正态总体的方差常为未知,所以我们常用 t 检验法来检验关于正态总体均值的检验问题。,解: 按题意需检验取 。由表8.1知检验问题的拒绝域为现在n=16, 又算得 即得t不落在拒绝域,故接受 ,即认为元件的平均 寿命不大于225小时。,二.两个正态总体均值差的检验(t
15、检验),我们还可以用t检验法检验具有相同方差的两个正态总体均值差的假设。 设 是来自正态总体 的样本, 是来自正态总体 的样本且设两样本独立。又分别记它们的样本均值为 ,记样本方差为 。设 均为未知,要特别引起注意的是,在这里假设两总体的方差是相等的。,现在来求检验问题:( 为已知常数)的拒绝域,取显著性水平为 引用下述 t 统计量作为检验统计量:其中,当 为真时,已知 与单个总体的 t 检验法相仿,其拒绝域的形式为P拒绝 为真,可得 于是得拒绝域为关于均值差的其它两个检验问题的拒绝域在书附表中给出。常用的是 的情况。当两种正态总体的方差均为已知时,我们可用Z检验法来检验两正态总体均值差的假设
16、问题。,例2 在平炉进行一项试验以确定改变操作方法的 建议是否会增加钢的得率,试验是在同一只平炉上进行的。每炼一炉钢时除操作方法外,其它条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼了10炉,其得率分别为标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1,设这两个样本相互独立,且分别来自正态总体 和 , 均未 知。问建议的新操作方法能否提高得率? (取 ),解:需要检验假设 分别求出标准方法和
17、新方法的样本均值和样本方差如下:,又, 故拒绝域为现在由于样本观察值t-4.295-1.7341,所以拒绝 ,即认为建议的新操作方法较原来的方法为优。,第三节 正态总体方差的 假设检验,是来自X的样本,要求检验假 设(显著性水平为 ):为已知常数。,设总体 均属未知,,一、单个总体的情况,由于 是 的无偏估计,当 为真时 ,比值一般来说应在1附近摆动,而不应过分大于1或过分小于1。由于当 为真时, 我们取 作为检验统计量,如上所说知道上述检验问题的拒绝域具有以下的形式:,或,此处的 值由下式确定:P拒绝 为真为计算方便起见,习惯上取 (3.1)故得,于是得拒绝域为或上述检验法为 检验法。关于方
18、差 的单边检验法的拒绝域已在附表中给出。,例3 某厂生产的某种型号的电池,其寿命长期以来 服从方差 (小时 )的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机取26只电池,测出其寿命的样本方差 小时 )。问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化(取 )?,或由观察值 得 所以拒绝 , 认为这批电池寿命波动性较以往的有显著的变化。,解:,二、两个总体的情况,设 来自总体 的样本,是来自总体 的样本,且两样 本独立。其样本方差分别为 。且设 均为未知,现在需要检验假设:,由于 的独立性及 得知故当 为真时,即当 时有,( 3.2),我们取 作为
19、检验统计量。当 为真时 ,而当 为真时由于 ,故 有偏大的趋势,因此拒绝域的形式为,(3.3),k 由下式确定: P拒绝 为真即有于是拒绝域为上述检验法称为F检验法。关于 的另外两个检验问题的拒绝域在附表中给出。,(3.4),例4 试对例2中的数据作方差的假设检验(取 ),解:此处 , 拒绝域为,或,现在 即有故接受 ,认为两总体方差相等。,例5 研究机器A和机器B生产的钢管的内径 , 随机抽取机器 A 生产的管子18 只,测得样本方差 ;抽取机器B生产的管子13只, 测得样本方差 。设两样本相互独立,且设由机器A,机器B生产的管子的内径分别服从正态分布 , ,这里 均未知。作假设检验:(取
20、),解: 此处由(3.4)式拒绝域为现在故接受 .,某机器加工某种零件,规定零件长度为100cm,标准差不超过2cm。每天定时检查机器的运行情况。某日抽取10个零件,测得平均长度 cm,样本标准差 , 问该日机器工作是否正常 ?,三、课堂练习,解:设加工零件长度为 均未知。 (1)检验假设 , 这是t-检验,当 成立时,统计量拒绝域为对 计算得 .,(2)检验假设 , 这是 检验问题; 当 成立时, 统计量拒绝域为,对 ,由t-分布表查得 。 因为 。接受假设 ,即认为 。,计算得 由 ,查得 ,因为 ,故接受假设 ,即认为 。综合(1),(2)可以认为该日机器工作状态正常。,第四节 置信区间
21、与假设检验 之间的关系,置信区间与假设检验之间有明显的联系, 先考察置信区间与双边检验之间的对应关系. 设X1,.,Xn是一个来自总体的样本, x1,.,xn是相应的样本值. Q是参数q的可能取值范围.,设(q (X1,.,Xn), q (X1,.,Xn)是参数q的一个置信水平为1-a的置信区间, 则对于任意qQ, 有 Pqq(X1,.,Xn) q q(X1,.,Xn)1-a, (4.1),考虑显著性水平为a的双边检验 H0:q=q0, H1:qq0. (4.2),Pq q (X1,.,Xn) q q (X1,.,Xn)1-a, (4.1) H0:q =q0, H1:q q0. (4.2) 由
22、(4.1), 当H0为真时,按显著性水平为a的假设检验的拒绝域的定义, 检验(4.2)的拒绝域为q0 q (x1,.,xn) 或 q0 q (x1,.,xn); 接受域为 q (x1,.,xn) q0 q (x1,.,xn).,这就是说, 当我们要检验假设(4.2)时, 先求出q的置信水平为1-a的置信区间(q,q), 然后考察q0是否落在区间(q,q), 若q0(q,q), 则接受H0, 若q0(q,q), 则拒绝H0.,反之, 对于任意q0Q, 考虑显著性水平为a的假设检验问题: H0:q=q0, H1:qq0, 假设它的接受域为 q(x1,.,xn) q0 q(x1,.,xn), 即有,
23、由q0的任意性, 由上式知对于任意qQ, 有,因此(q(X1,.,Xn),q(X1,.,Xn)是参数q的一个置信水平为1-a的置信区间.,这就是说, 为求出参数q的置信水平为1-a的置信区间,我们先求出显著性水平为a的假设检验问题: H0:q=q0, H1:qq0的接受域:q(x1,.,xn) q0 q(x1,.,xn), 那么(q(X1,.,Xn),q(X1,.,Xn)就是q的置信水平为1-a的置信区间.,还可验证, 置信水平为1-a的单侧置信区间 (-,q (X1,.,Xn)与显著性水平为a的左边检验问题H0:q q0, H1:q q0有类似的对应关系.,即若已求得单侧置信区间(-,q (
24、X1,.,Xn), 则 当q0(-,q (X1,.,Xn)时接受H0, 当q0(-,q (X1,.,Xn)时拒绝H0.,反之, 若已求得检验问题H0:q q0, H1:q q0的接收域为: - q0 q (X1,.,Xn), 则可得q的一个单侧置信区间(-,q (X1,.,Xn).,置信水平为1-a单侧置信区间(q (X1,.,Xn),)与显著性水平为a的右边检验问题H0:q q0, H1:q q0也有类似的对应关系.,即若已求得单侧置信区间(q (X1,.,Xn),). 则 当q0 (q (X1,.,Xn),)时接受H0, 当q0 (q (X1,.,Xn),)时拒绝H0.,反之, 若已求得检
25、验问题H0:q q0, H1:q q0的接受域为:q (X1,.,Xn)q0, 则可得q的一个置信区间:(q (X1,.,Xn),).,假设检验与置信区间对照,( 2 已知),( 2 已知),( 2未知),( 2未知),(未知),(未知),例1 设XN(m,1), m未知, a=0.05, n=16, 且由一样本算得x=5.20, 于是得到参数m的一个置信水平为0.95的置信区间,现在考虑检验问题H0:m =5.5, H1:m 5.5. 由于5.5(4.71, 5.69), 故接受H0.,例2 数据如上例. 试求右边检验问题H0:mm0, H1:mm0的接受域, 并求m的单侧置信下限(a=0.05). 解: 检验问题的拒绝域为,或即m04.79. 于是检验问题的接受域为m04.79. 这样就得到m的单侧置信区间(4.79, ), 单侧置信下限m=4.79.,习题课,(1),(2),解:设东支矿脉的含锌量为 , , 西支矿脉的含锌量为 ,(1)首先需检验假设:当 成立时,检验统计量 拒绝域为 或,对 计算得 由F分布表查得 因为 故接受假设 ,即认为 ,(2)检验假设 这属于 ,检验统计量为检验的拒绝域为计算得查分布表得因 , 故接受假设 ,即认为两支矿脉的含锌量相同。,而题中知拒绝域,