1、,假设检验,参数假设检验,非参数假设检验,这类问题称作假设检验问题 .,总体分布类型 已知,检验关 于未知参数的 某个假设,总体分布类型未知时的假设检验问题,本章将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.,hypothesis testing,假设检验,假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。,参数假设是对总体参数的一种看法。总体参数包括总体均值、总体比例、总体方差等。分析之前必需陈述。 参数假设检验是通过样本信息对关于总体参数的某种假设合理与否进行检
2、验的过程。即先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息去检验这个假设是否成立。如果成立就接受这个假设,如果不成立就放弃这个假设。,我认为该企业生产的零件的平均长度为4厘米!,一、假设检验问题的提出二、假设检验的一般步骤,第6.1节 假设检验的基本概念,一、假设检验问题的提出,引例(女士品茶问题)一种饮料由牛奶与茶按一定比例混合而成,可以先倒茶后倒牛奶(记为TM)或反过来(MT)。某女士声称,她可以鉴别是 TM 还是 MT。设计如下试验,来检验她的说法是否可信。准备 8 杯饮料,TM 和 MT 各半,把它们随机的排成一列让该女士品尝,并告诉她 TM 和 MT 各有 4 杯,
3、然后请她指出哪 4 杯是 TM。结果她都说对了。 请你判断该女士是否有鉴别力!,若该女士只说对了 3 杯,又会得到怎样的结论?,参数假设检验举例,例1:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。为判断该地1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。这是一个关
4、于总体均值的假设检验问题。,参数假设检验举例,例2:某公司进口一批钢筋,根据要求,钢筋的平均拉力强度不能低于2000克,而供货商强调其产品的平均拉力强度已达到了这一要求,这时需要进口商对供货商的说法是否真实作出判断。进口商可以先假设该批钢筋的平均拉力强度不低于2000克,然后用样本的平均拉力强度来检验假设是否正确。这也是一个关于总体均值的假设检验问题。,参数假设检验举例,例3:某种大量生产的袋装食品,按规定每袋重量不得少于250克,现从一批该种食品中任意抽取50袋,发现有6袋重量低于250克。若规定食品不符合标准的比例达到5就不得出厂,问该批食品能否出厂。可以先假设该批食品的不合格率不超过5,
5、然后用样本不合格率来检验假设是否正确。这是一个关于总体比例的假设检验问题。,假设检验的思想: 1、有一个明确的命题或假设 H; 2、当 H 成立时,考虑某一变量 X 的性质,在女士品茶问题中,考虑 X 为该女士说对的杯数,注意此时 X 的分布已知; 3、以 x 表示 X 的观测值,考虑 P(X=x)=px,px 越小,试验结果越不利于 H; 4、根据规定的小概率事件,做出最后的决策。,假设检验的基本原理,假设检验所依据的基本原理是小概率原理。 什么是小概率? 概率是01之间的一个数,因此小概率就是接近0的一个数 著名的英国统计家Ronald Fisher 把20分之1作为标准,也就是0.05,
6、从此0.05或比0.05小的概率都被认为是小概率 Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,什么是小概率原理?,小概率原理发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。 根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。 检验中使用的小概率是检验前人为指定的。,如果假设这批产品的次品率P4,则可
7、计算事件“抽10件产品有4件次品”的出现概率为:,小概率原理举例:,某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂?,可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率P4 ,因而认为假设次品率P4是不能成立的,故按质检部门的规定,这批产品不能出厂。,注意:在假设检验中“拒绝”和“接受”反映了决策者在所面对的样本证据下,对该命题所采取的一种态度、倾向性,而不是在逻辑上“证明”该命题正确与否!,假设检验的思想,企图肯定什么事情很困难,而否
8、定却相对容易得多!,概率论中的反证法!(依据小概率事件原理),分析:,例1、某厂生产的合金强度服从正态分布N(,16),其中的设计值为不低于110(Pa).为保证质量,该厂每天都要对生产情况例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa).某天从生产中随机抽取 25 块合金,测得强度值为 x1,.,x25, 其平均值为 = 108(Pa),问当日生产是否正常?,1、本题要求根据样本的信息对命题“合金的平均强度不低于110(Pa)”作出判断.因此是假设检验问题.,2、命题“合金的平均强度不低于110(Pa)”正确与否仅涉及参数,因此该命题是否正确将涉及如下两个参数集合:,
9、命题成立对应于“0”,命题不成立对应于“1”。称这两个非空参数集合为(统计)假设。,“ 假设不正确”拒绝该假设 ;“ 假设正确”不拒绝该假设 。,3、目的是利用所给总体N(,16)和样本均值 =108(Pa)来判断假设“0”是否成立。“判断”在统计学中称为检验或检验准则。此准则是在解决问题时首先要确定的,有了它,检验结果有两种:,例1、某厂生产的合金强度服从正态分布N(,16),其中的设计值为不低于110(Pa).为保证质量,该厂每天都要对生产情况例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa).某天从生产中随机抽取 25 块合金,测得强度值为 x1,.,x25, 其平
10、均值为 = 108(Pa),问当日生产是否正常?,二、假设检验的一般步骤,1 建立假设,在假设检验中,把被检验的假设称为原假设,记为,也称零假设,通常将不应轻易加以否定的假设作为原假设。当 H0 被拒绝时而接受的假设称为备择假设。记为 也称为对立假设。,例如:例 1 的统计假设分别为,表示 H0 对 H1 的假设检验问题.,简记为,2 检验法则-选择检验统计量,给出拒绝域形式,由样本对原假设进行判断需要通过一个统计量来完成,称之为检验统计量。,使原假设被拒绝的样本观测值所在的区域称为拒绝域(或否定域、临界域).它是样本空间的一个子集,记为 W。,如例1中, 要检验的假设是正态总体的均值,在方差
11、已知时,样本均值 是个很好的检验统计量。,当拒绝域确定后,检验准则依之确定:,若(x1 , xn)W, 则认为 H0 不成立.,若(x1,.,xn) , 则认为 H0 成立;,称 为接受域.,如例1中, 若 110 与样本均值的差过分地大, 即 则应拒绝 H0. 因此在样本均值的取值中存在一个临界值 c (待定), 拒绝域应为,原假设 H0 在客观上只有两种可能: 真、假。,即有下面四种情况:,(1)、假设检验的两类错误,3 选择显著性水平,样本值 (x1,xn) 也只有两种可能性:属于拒绝域 W、不属于 W。,1)H0真,而(x1,xn)W;拒绝H0,2)H0真,而(x1,xn)W;接受H0
12、,3)H0假,而(x1,xn)W;拒绝H0,4)H0假,而(x1,xn)W;接受H0,第一类错误 (拒真错误),第二类错误 (受伪错误),记犯第一类错误的概率为,即,记犯第二类错误的概率为,即, =P拒绝H0|H0为真= P(XW), 0,假设检验的两类错误,P拒绝H0|H0为真= ,P接受H0|H1为真= .,犯两类错误的概率:,拒绝H0,(2)显著性水平,则称该检验是显著性水平为的显著性检验,简称水平为的检验。,如果一个检验满足犯第一类错误的概率,,定义: 设检验问题,注:水平为的检验就是要求犯第一类错误的概 率不超过.一般 地取=0.05、 =0.10或=0.01。即:犯第一类错误的概率
13、是个小概率事件,小概率事件在一次随机试验中几乎不发生. 若H0 真, 也即, H0 成立下的小概率事件发生了,那么就认为H0不可信而拒绝它. 否则就不能否定H0 (只好接受它). 这就是假设检验的基本思想。,4 给出拒绝域,在规定了检验的显著性水平后,根据容量为n的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的临界值。 临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。 对于正态总体,总体均值的假设检验可有如下图示:,正态总体,总体均值假设检验图示: (1) 双侧检验,设H0:XX0 , H1:XX0,有两个临界值,两个拒绝域
14、,每个拒绝域的面积为/2。也称双尾检验。,双侧检验示意图,X0,双侧检验示意图 (显著性水平与拒绝域 ),双侧检验示意图 (显著性水平与拒绝域 ),观察到的样本统计量,双侧检验示意图 (显著性水平与拒绝域 ),观察到的样本统计量,双侧检验示意图 (显著性水平与拒绝域 ),观察到的样本统计量,(2)单侧检验 有一个临界值,一个拒绝域,拒绝域的面积为。分为左侧检验和右侧检验两种情况。 单侧检验示意图(显著性水平与拒绝域),左侧检验,设H0:XX0 ,H1:XX0;临界值和拒绝域均在左侧。也称下限检验。,X0,左侧检验示意图 (显著性水平与拒绝域 ),左侧检验示意图 (显著性水平与拒绝域 ),观察到
15、的样本统计量,右侧检验,设H0 :XX0 ,H1:XX0; 临界值和拒绝域均在右侧。也称上限检验。,X0,右侧检验示意图 (显著性水平与拒绝域 ),右侧检验示意图 (显著性水平与拒绝域 ),观察到的样本统计量,4 给出拒绝域,在确定显著性水平后,可以确定检验的拒绝域W.,如在上面例1中, 取=0.05, 要使对任意的110 有,由于g()为的减函数。只要,又标准正态分布的0.05分位数 ,所以,即检验的拒绝域,或令 ,则,即0,P155,注:考虑若的真实值为 108 时,对应犯第二类错误的概率为,原假设被特别保护起来,如果没有充分的理由,不能轻易拒绝!,注:确定H0与H1的一般原则 : 若问题
16、只提出一个假设,且检验的目的仅仅是为了判别这个假设是否成立,并不同时研究其它假设,则直接取该假设作为原假设 H0 即可. 在实际问题中,若是问新方法(新材料、新工艺、新配方之类)是否比原方法好,通常将原方法取为“原假设H0”,而将新方法取为“备择假设H1”. 且在处理 H0 时总是偏于保守的,在没有证据时不轻易拒绝 H0 . 还要考虑数学上的处理方便来设定 H0 与 H1 .,5 作出判断,有了明确的拒绝域 W 后,由样本观测值可以做出判断:,假设检验的步骤,1、 提出假设,建立H0与H1,3、根据给定显著性水平,查临界值并确定拒绝域,4、作出判断,接受或拒绝原假设.,2、确定检验统计量及其分
17、布,并由给定的样本值计算统计量的值,假设,统计量,查表,判断,设 X N ( 2),2 已知,需检验 :,1. H0 : 0 ; H1 : 0,2. 构造统计量,给定显著性水平 与样本值(x1,x2,xn ),小结:关于 的检验( 2 已知),4.判断,若 则拒绝原假设,接受对立假设,认为 0 。,3.根据 , 查临界值 。,已知,故应选择检验统计量,由题中条件和计算得:,设 X N ( 2),2 未知,需检验 :,1. H0 : 0 ; H1 : 0,2. 构造统计量 t(n-1),给定显著性水平 与样本值(x1,x2,xn ),小结:关于 的检验( 2 未知),4. 判断,若 则拒绝原假设
18、,接受对立假设,认为 0,3.根据 , 查临界值 。,练习:,已知某公司生产某种灯管,公司经理称,他们的产品平均使用寿命为三年,为检验他的说法,随机抽取5个灯管。测得寿命数据为1.3,4.1,4.8,3.4,2.9(单位:年),已知灯管使用寿命服从正态分布,请检验经理的说法是否正确?显著水平 为0.05.,0,注意:P180,改,设 X N ( 2),需检验2 :,1. H0 : H1 :,2. 构造统计量,给定显著性水平与样本值(x1,x2,xn ),小结:关于2 的检验,未知, 2= 02, 2 02,4. 判断,若 则拒绝 原假设,接受对立假设,认为, 2 02,3.根据 , 查临界值
19、。,练习:某种溶液的成分(%)服从正态分布,现由10个样本观测值计算平均值为0.452,s=0.037,请检验 是否成立?( =0.10),(1),(2),(4),(3),接下去, 自己完成。,2. 未知均值,检验假设:总体方差202是否成立,6.2.4 区间估计与假设检验的关系,抽样估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的先验假设是否成立。 区间估计与假设检验的主要区别 1.区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验; 2.区间估计立足于
20、大概率,通常以较大的把握程度(置信水平)1-去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。,区间估计与假设检验的联系,1.区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。 2.对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。,用置信区间进行检验
21、 (例题分析),【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(= 0.05),双侧检验!,香脆蛋卷,用置信区间进行检验(例题分析),解:提出假设:H0: X = 1000H1: X 1000 已知:n = 16,=50,=0.05双侧检验/2=0.025 临界值: Z0.025=1.96,置信区间为,决策:,结论:,X = 1000 在置信区间内,不拒绝H0,可以认为这批产品的包装重量合格,、,本题也可以直接用正态分布来做,因为在大样本下(np10,n(1p)10),二项分布B(100,0.5)近似服从正态分布。直接按照正态分布来做,此时用的是t统计量,均方差直接用样本求出s,而不是用p(1p)/n来计算的,与上页近似为正态分布的结果,有所差异。,把双尾转化为单尾,t统计值的显著性概率为:0.016/2 = 0.008, 此时,犯错误的概率不超过0.8%。,