1、第九章 假设检验,STAT,9.1.1对研究性假设的检验(右侧检验) 如我们前面的案例就可以看成是一个研究性假设的例子。 研究性假设是:改进后的车型更节油,即平均油耗低于8.48升。通常,研究性假设作为备择假设。 则上例中我们可建立如下的零假设( )和备择假设( ):,9.1 零假设和备择假设,STAT,例:某饮料生产商声称他们生产的两升罐装饮料平均至少有67.6盎司中的饮料。为了检验该生产商的陈述,我们将抽取一个两升灌装饮料的样本,然后对其中所装应料的重量进行测量。该问题即属于对陈述正确性的检验,一般的,我们都先假定生产商的陈述属正确的。则上例中我们可建立如下的零假设和备择假设:,9.1.2
2、对陈述正确性的检验(左侧检验),STAT,9.1.3对决策情况下的检验(对策检验)不管接受零假设还是接受备择假设,都须作出决策。例:根据从刚刚收到的货物中所抽取的零件的样本,质量控制检验员就必须做出决策:是接受这批货物还是因为其不符合规格而向供应商退回这批货物。假定零件的平均长度是2英寸。则上例中我们可建立如下的零假设和备择假设:,STAT,建立零假设和备择假设总结: 设 表示在零假设和备择假设中考虑的某一特定数值。一般来说,对总体均值的假设检验采取下面的三种形式之一:,对总体平均数的假设就有了3种情况: 双边 (1) 检验 总体平均厚度等于5mm 总体平均厚度不等于5mm 单边 (2) (左
3、侧检验) 检验 (3) (右侧检验) (一).什么是双侧检验?1.只关心样本平均数与总体平均数,或样本成数与总体成数有没有显著性的差异,不问其差异的方向是正差或负差时,采用双侧检验。 2.例:检验某零件生产是否正常,只关心零件口径尺寸是否符合标准长度, 不向其口径长度超出公差范围是正差或负差,都拒绝原假设成立。 3.又例:灯泡厂生产灯泡,灯丝的平均寿命过长或过短都不好。故当样本平均寿命高于或低于总体平均寿命过多都拒绝原假设。 4.双侧检验的原假设采用等号形式,备择假设采用不等号形式.,5.在双侧检验时,将给定的显著性水平 按对称分布原理平均分配到左右两方,每方各为 ,查正态分布表或t分布表,可
4、得下临界值 和上临界值 如计算出来的统计量t小于(或等于)下临界值(或上临界值)。都拒绝原假设。 二.什么是单侧检验? 如果只关心的问题不仅要检验样本平均数(或成数)与总体平均数(或成数)之间有没有显著性差异,而且要追究是否发生预先指定方向的差异,不论其正差异(负差异),都采用单侧检验。 1.左侧检验:只关心总体平均数(成数)是否低于预先的假设 例:电气公司采购人员采购大批电子元件,要求元件平均寿命达到1000小时,否则不接受。 即:(原假设是:元件的平均寿命 小时);(备择假设:元件的平均寿命 小时),左侧检验相应有左侧临界值 ,由于这时临界值区域是单侧的要求,考虑到正态分布概率表和t分布概
5、率表是双侧的,如果单侧的概率要求为 ,则双侧的概率应为 ,并按F(t )=1-2 的要求查概率表求下临界值-t ,如果计算的统计量t 小于或等于临界值-t 则拒绝原假设;如果 ,则接受原假设。2.右侧检验:只关心总体平均数(成数)是否高于预先假设。 例:某经济特区对某项地方法规进行民意测验,执法机关认为只有60%的人赞成,而立法机关则认为有60%以上的人赞成。即: (原假设:赞成该项法规的比例 60%) (备择假设:赞成该法规的比例 60%)右侧检验也相应有右侧临界值 ,由于右侧检验的临界值拒绝区域也是单侧的要求,如果单侧的概率要求为 ,则双侧的概率应为 ,并按F(t)=1-2 的要求查概率表
6、求得上临界值 ,如果计算的统计量 ,则拒绝原假设;反之 ,则接受原假设。,STAT,第一类错误: 拒绝正确的原假设,简称“拒真”; 第二类错误 :接受错误的原假设,简称“纳伪”如下所示: 我们把两类错误发生的概率表示如下: 第一类错误发生的概率; 第二类错误发生的概率;,9.2 第一类和第二类错误,STAT,在实践中,我们通常确定允许犯第一类错误的概率的最大值,将其称为显著性水平。可以选择=0.05或= 0.01。,STAT,总结 在大样本情况下,无论总体标准差已知或未知,样本均值总是服从正态分布,则可归纳左侧检验的一般步骤:1、建立零假设和备择假设2、确定检验统计量,并计算其值3、根据事先确
7、定的显著性水平,查标准正态分布表得临界值4、拒绝规则:,9.3.1 单个总体均值的单侧假设检验,STAT,同理,在大样本情况下,右侧检验的一般步骤:1、建立零假设和备择假设2、确定检验统计量,并计算其值3、根据事先确定的显著性水平,查标准正态分布表得临界值4、拒绝规则:,STAT,例:某市的一家公司生产一种新型的轮胎,这种新型轮胎的设计规格是平均行驶里程至少为28000英里。随机抽取了30只轮胎作为一个样本进行检验,结果,样本均值时27500英里,样本标准差是1000英里。采用0.05的显著性水平,检验是否有足够的证据拒绝轮胎的平均行驶里程至少为28000英里的陈述。 解:已知 1、建立零假设
8、和备择假设,STAT,2、确定检验统计量,并计算其值3、4、,STAT,例:根据美国高尔夫球协会的准则,只有射程和滚动距离平均不超过280码的高尔夫球可在比赛中使用。假定某公司最近开发了一种高技术生产方法,用这种方法生产的高尔夫球的射程和滚动距离平均为280码。现在抽取一个有36个高尔夫球的随机样本来检验该公司的陈述是否为真。数据如下表。(假定在显著性水平为0.05的条件下进行)。,9.4大样本情况下总体均值的双侧检验,STAT,该问题就是一个双侧检验的例子。先建立如下的零假设和备择假设:在大样本的情况下,仍然选择统计量Z,和单侧检验不同的是,此时的拒绝域分布在正态曲线的两侧,对应的概率均为
9、。查表时应该查 对应的临界值,STAT,上例中,依据表中资料可计算得,则统计量的值为根据给定的显著性水平,STAT,归纳:在大样本情况下,双侧检验的一般步骤:1、建立零假设和备择假设2、确定检验统计量,并计算其值3、根据事先确定的显著性水平,查标准正态分布表得临界值4、拒绝规则:,STAT,在大样本的情况下,给定置信水平 的总体均值的置信区间为:进行假设检验时,首先需要对总体的参数作出假定:双侧检验,9.4.3 区间估计和假设检验的关系,(1),STAT,因此,双侧假设检验的样本均值的非拒绝区域可以由下式给出:双侧假设检验的非拒绝域和置信区间之间的关系:,(2),STAT,由此得到由置信区间方
10、法到假设检验的运算过程: 假设的形式:(1)从总体中抽取一个简单随即样本构建总体均值的置信区间:(2)如果置信区间包含假定的 值,则不拒绝零假设 。否则,拒绝,STAT,例:仍然采用前述关于高尔夫球的双侧检验的例子:根据样本数据我们已经计算得到: 对于给定的置信水平 可以得到总体均值的95%的置信区间为:,即274.58282.42,总体均值的假设值 在这个区间,所以我们不能拒绝零假设。,STAT,9.6 总体比例的检验,STAT,我们只考虑 的情况下,样本比例服从正态分布下的总体比例的假设检验。由于比例是特殊的均值,因此对比例进行检验的步骤及判断准则与对均值的检验相同,只需要检验统计量中的均
11、值换成比例对应的指标就可。例:在过去的几个月中,在松树溪打高尔夫球的人中有20%是女性。为了提高女性高尔夫球收的比例,球场采取了一项特殊的激励措施来吸引女性。一周以后,随机抽取了400名球手作为一个样本,结果有300名男性和100名女性。课程经理想知道这些数据是否支持他们的结论:松树溪的女性高尔夫球手的比例有所增加。,STAT,解:已知 1、建立零假设和备择假设2、确定检验统计量,并计算其值3、4、,例2:某药厂生产某种液 剂,其浓度按正态分布。规定标准浓度为60%。现在每小时抽取100cc,一班8小时共抽取800 cc进行测验,测得平均浓度为56%,问液剂配方是否正常? ( =0.05),统
12、计学,解:这是总体成数的双侧检验问题,统计学,1.某电池厂生产一种电池,历史资料表明平均发光时间1000小时,标准差80小时,在最近生产的产品屮抽取100个电池,测得平均发光时间990小时,问新生产电池发光时间是否有明显降低.( ),解: 这是总体平均数左单侧检验问题:(1) 小时 小时 (2 ) (正态概率分布表是双侧的,拒绝区域包括所有小于、等于、-1.65的t值.(3)所以,不能拒绝原假设 ,认为该电池发光时间没有显著降低.即接受 .,4、假设检验,统计学,STAT,同样,我们可以计算该检验的P值,已知z=2.50,标准正态分布表显示均值与2.5之间的面积为0.4938,则P=0.500
13、0-0.4938=0.0062。小于显著性水平0.05,拒绝零假设。以下是关于本章内容的总结:,总结:单个总体的假设检验,总体均值的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:H1:,z,(2) H0:H1:,(3 )H0:H1:,z,0,z,0,正态总体2已知,总体均值的检验,条件,检验条件量,拒绝域,H0、H1,(1) H0:H1:,t,(2) H0:H1:,(3) H0:H1:,t,0,t,0,0,正态总体2未知(n30),总体成数的检验,条件,检验条件量,拒绝域,H0、H1,(1) H0:P=P0H1:PP0,z,(2) H0:PP0H1:PP0,(3) H0:PP0H1:PP0,z,0,z,0,0,np5 nq5,