1、5-1,第七章 假设检验,第一节 假设检验基本原理 第二节 总体参数假设检验 第三节 非参数检验,5-2,第一节 假设检验基本原理,假设检验(Hypothesis Testing)也称为显著性检验。是事先作出一个关于总体参数的假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断方法。特点:1)采用逻辑上的反证法 2)依据统计上的小概率原理,5-3,假设检验的过程和思路 概率意义下的反证法,总体,假设总体的平均年龄是20岁,样本均值是18岁,样本,5-4,假设检验中的小概率原理,什么小概率?1. 在一次试验中,一个几乎不可能发生的
2、事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定。假设检验中把这个小概率称为显著性水平,表示为 。常见的取值有1%,5%,10%。这个值越小,拒绝原假设的判断的说服力越强。,5-5,假设检验的步骤,提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,5-6,提出原假设和备择假设,什么是原假设?(Null Hypothesis)1. 待检验的假设,又称“0假设”2. 如果错误地作出决策会导致一系列后果3. 总是有等号=, 或 4. 表示为H0 H0: = 某一数值 指定为= 号,即 或 例如, H0:
3、 = 3190(克),5-7,提出原假设和备择假设,什么是备择假设?(Alternative Hypothesis)1. 与原假设对立的假设2. 总是有不等号: , 3. 表示为H1 H1: 某一数值 例如, H1: 3910(克),5-8,确定适当的检验统计量, 什么检验统计量?1. 用于假设检验问题的统计量2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知3. 检验统计量的基本形式:,5-9,规定显著性水平, 什么显著性水平?1. 是一个概率值2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域3. 表示为 (alpha) 常用的 值有0.01,
4、 0.05, 0.104. 由研究者事先确定,5-10,作出统计决策,1. 计算检验的统计量2. 根据给定的显著性水平,查表得出相应的临界值或 /2从而确定H0的接受域和拒绝域3. 将检验统计量的值与 水平的临界值进行比较4. 得出接受或拒绝原假设的结论(统计量的值落在H0 的拒绝域,拒绝原假设,落在接受域,接受原假设。),5-11,对于不同形式的假设, H0的接受域和拒绝域也有所不同。,如图所示,双侧检验的拒绝域位于统计量分布曲线的两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,右单侧检验的拒绝域位于统计量分布曲线的右侧。,5-12,双侧检验与单侧检验,双侧检验、单侧检验与原假设形式的关系
5、。(以总体均值的假设为例),5-13,双侧检验(原假设与备择假设的确定),1. 双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施2. 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格3. 建立的原假设与备择假设应为H0: = 10 H1: 10,5-14,双侧检验(确定假设的步骤),1. 例如问题为: 检验该企业生产的零件平均长度为4厘米2. 步骤 从统计角度陈述问题( = 4) 从统计角度提出相反的问题( 4) 必需互斥和穷尽 提出原假设( = 4) 提出备择假设( 4) 有 符号,5-15,双侧检验(例子),该企
6、业生产的零件平均长度是4厘米吗? (属于决策中的假设)提出原假设: H0: = 4提出备择假设: H1: 4,5-16,双侧检验(显著性水平与拒绝域),5-17,双侧检验(显著性水平与拒绝域),5-18,单侧检验(原假设与备择假设的确定), 检验研究中的假设1. 将所研究的假设作为备择假设H12. 将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设3. 先确立备择假设H1,5-19,单侧检验(原假设与备择假设的确定),例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 属于研究中的假设建立的原假设与备择假设应为 H0: 1500 H
7、1: 1500 例如,改进生产工艺后,会使产品的废品率降低到2%以下 属于研究中的假设 建立的原假设与备择假设应为 H0: 2% H1: 2%,5-20,单侧检验(原假设与备择假设的确定),检验某项声明的有效性1. 将所作出的说明(声明)作为原假设2. 对该说明的质疑作为备择假设3. 先确立原假设H0 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的,5-21,例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的建立的原假设与备择假设应为 H0: 1000 H1: 25该批产品
8、的平均使用寿命超过1000小时吗?(属于检验声明的有效性,先提出原假设) 提出原假设: H0: 1000 选择备择假设: H1: 1000,5-23,左侧检验(显著性水平与拒绝域),5-24,左侧检验(显著性水平与拒绝域),5-25,右侧检验(显著性水平与拒绝域),5-26,右侧检验(显著性水平与拒绝域),5-27,假设检验中的P值,P值(P-value)是指在原假设为真时,所得到的样本观察结果或更极端结果的概率,即样本统计量落在观察值以外的概率。根据“小概率原理”,如果P值非常小,就有理由拒绝原假设,且P值越小,拒绝的理由就越充分。 实际应用中,多数统计软件直接给出P值,其检验判断规则如下:
9、1. 单侧检验 若p-值 ,不能拒绝H0 若p-值 , 拒绝H02. 双侧检验 若p-值 /2, 不能拒绝H0 若p-值13。第五步:判断。由于上一步的比较结果可知,样本落入拒绝域,所以拒绝原假设,认为样本数据不能证明总体中位数等于160件。,5-70,(二)配对样本场合的符号检验,样本配对场合与单样本场合的符号检验,基本原理是一致的。设从两个总体中分别抽出一个容量相等的样本,然后将两样本的数据进行一一配对,得到一组配对值。再将各对配对值相减,记录下差数的符号,计算出“+”的个数n+与“-”的个数n-。如果两个样本的总体差异不显著,配对值之差的正负号出现的概率各是1/2,则n+与n-应当非常接
10、近;如果n+、n-相差太大的话,说明两总体存在显著差异。例子见书上的。,5-71,三、秩和检验,秩和检验也称Wilcoxon-Man-Whitney检验。该检验方法可用于检验两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。,5-72,秩和检验原理:设分别从两个未知的总体独立、随机地抽取容量为n1和n2的样本,把样本容量较小的总体称为总体。如果两样本容量相等,就把任意一个总体称作总体,另一个总体称作总体,这里不妨设n1n2。现将两个样
11、本混合起来,并按数据的大小,从小到大排列编号,每个数值的编号就是它的秩次。如果混合样本中有若干个相同的数值,则把它们的秩次进行简单算术平均,用此平均值作为这些数值的秩次,计算来自总体的n1个数据在混合样本中的秩次之和,记为T。,5-73,显然T最小的可能值是:T1=1+2+3+n1=n1(n1+1)/2 ;最大的可能值是T2=(n2+1)+(n2+2)+(n2+n1)=n1(n2+1)+(n2+n1)/2。如果两个总体分布无显著差异,则T值不应太大或太小,等于中间值(T1+T2)/2;如果总体分布于总体的右边,T将接近其最大值T2;如果总体位于总体的左边,T将接近于它的最小值T1。因此,我们可
12、以用秩和T作为检验的统计量。,5-74,第一种方法,当n1和n2都不超过10时,查“秩和检验表”确定临界值;第二种方法,当n1和n2都超过10时,秩和T服从正态分布:先对T进行标准化变换,再利用标准正态分布表,确定检验的临界值。,5-75,例5:有A、B两家厂商供应同一种商品,两家商品价格与性能一致,但使用寿命是否一致有待检验。今分别从两家生产产品中抽出样本,测定产品使用寿命(见下表,单位:小时):试以0.05的显著性水平,检验两厂商产品寿命是否有差异?,5-76,解:第一步:作出假设。H0:MA=MB,H1:原假设是两厂商生产的产品没有差异,平均寿命相同,备选假设是平均寿命不相同,是双侧检验。,5-77,第二步:求秩和。将样本混合、排列:,5-78,以上数据下面划横线的为B厂商产品寿命。B厂商产品样本容量小,看做总体,n1=5。A厂商产品是总体,n2=6。总体的秩和 T=2.5+4.5+6.5+6.5+9.5=29.5。,5-79,第三步:确定拒绝域。显著水平=0.05,进行双侧检验,查“秩和检验表”,n1=5,n2=6,得临界值T1()=20,T2( )=40。第四步:比较秩和与临界值大小。结果是:2029.540,即 T1() T T2( ) 。第五步:判断。样本落入接受域,所以接受原假设,样本数据证明A、B两厂商产品的寿命也是一致的。,