1、第七章,假设检验的基本概念,一、什么是假设检验,所谓假设检验,就是先成立一个关于总体情况的假设,然后抽取一个随机样本,以样本的统计值来验证对总体的假设。假设检验的意义:由于我们难以完全知道所关心的总体的数量特征与变化情况,因此常常需要对其进行假设,而假设是否成立,需要进行检验。,假设在社会科学中可以用于不同的层次。最高层次是理论假设,而理论层次的假设一般是无法加以直接验证的。为了能从理论上证实这些假设,必须概念操作化,把理论假设转变为可操作的经验性假设。再通过社会调查证明原有的假设是否合理。如果收集资料的范围仅是总体的一部分,是一个样本(随机样本),那么这种和抽样手段联系在一起、并且依靠抽样数
2、据进行验证的假设,就称作统计假设。也就是说,如果不采用抽样技术的话,也就不存在统计假设。例:根据以往资料,某地女青年的平均初婚年龄=20岁,但根据100名女青年的随机抽样调查,x=21岁,问能否认为该地女青年的初婚年龄比以往已有所推迟?,假设检验与参数估计,假设检验与参数估计是不同的。假设检验与参数估计有着不可分割的联系。参数区间估计可以转化为假设检验,假设检验也可以转化为参数区间估计。假设检验可以看作区间估计中置信区间的另一种表达方式:即可以用区间估计的技术来处理假设检验问题。,二、假设检验的基本原理,在大量观察中频频出现的事件具有较大的概率,出现次数较小的事件,具有小的概率。在日常生活中,
3、人们习惯于把概率很小的事件,当作在一次观察中是不可能出现的事件,这个原理称作小概率原理。举例说,我们几乎每天从电视、报纸、甚至街头广告牌上都能看到交通事故的统计,但人们绝不因此而放弃交通工具的使用 ,可见,在日常生活中,人们是在不自觉运用小概率原理。统计假设检验的基本原理是小概率原理。,小概率原理可以归纳为两个方面:可以认为小概率事件在一次观察中是不可能出现的。如果在一次观察中出现了小概率事件,那么,合理的想法是否定原有事件具有小概率的说法(或称假设)。,假设检验的思想可以描述如下:经过抽样获得一组数据,即一个来自总体的样本;如果根据样本计算的某个统计量(或几个统计量)表明在原假设HO成立的条
4、件下几乎是不可能发生的,就拒绝或否定这个原假设,并继而接受它的对立面研究假设,反之,如果在原假设HO成立的条件下,根据样本所计算的某个统计量,发生的可能性不是很小的话,那么就接受原假设。 即直接检验H0,间接检验H1。,小概率 原理:,如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。,总 体 (某种假设),抽样,样 本 (观察结果),检验,(接受),(拒绝),小概率事件 未 发 生,小概率事件 发 生,三、假设检验的基本形式,假设一般包括两部分:虚无假设HO和研
5、究假设H1。虚无假设HO:又称原假设、零假设;是一种无差别假设,是一种已有的,具有稳定性的经验看法,没有充分根据,是不会被轻易否定的。研究假设H1:又称备择假设;是研究者所需证实的假设。,虚无假设HO如前面所举女青年初婚年龄=20。原假设在研究中是稳定、受到保护的,但另一方面也并不表示永远不会被否定,否则也就失去其研究意义。当经过抽样调查,当实际数据否定了原有假设H0时,就产生了需要接受其逻辑的研究假设。以:H0=20岁为例,当=20被否定后,可采用的研究假设有:20,20;H0:=20,H1:20;H0:=20,H1:20。其中和称作单边检验,称作双边检验。,H0虚无假设, H1研究假设,两
6、端检验:H0:=0,H1:0,一端检验:H0:0,H1:0H0:0,H1:0,假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。,假设检验的基本形式,显著性水平,显著性水平,一般是指在原假设成立条件下,统计检验中所规定的小概率的标准,即规定小概率的数量界线,常用的标准有=0.10,=0.05或=0.01(即否定域或拒绝域在整个抽样分布中所占的比例)。,临界值、接受域和拒绝域,当统计量确定后,根据原假设H0成立的条件,可以画出统计量的分布。不妨设被确定的统计量满足Z(正态)分布,来研究如何确定临界值,接受域和拒绝域。,是临界值,|Z| 的概率为小概
7、率。,根据统计检验的小概率原理,如果抽样所获数据(样本)计算的统计量值ZS大于Z,Zs ,则应拒绝原假设H0;反之,如果抽样所获数据(样本)计算统计量ZS小于 ,则应接受H0。因此,以| |临界值,- , 称为接受域,-Z/2,Z/2的左右边称作拒绝域。,两端检验,又称双边检验,双尾检验。当我们关心的是是否存在差异,而不问差异的方向时,用两端检验。两端检验的假设形式如下:H0:=0H1:0,一端检验,又称单边检验,单尾检验。如果我们关心的是不仅存在差异,而且还有差异的方向,就要选用一端检验。一端检验可分作右端检验和左端检验:H0:0,H1:0(左端检验)H0:0,H1:0(右端检验),右端检验
8、与左端检验,右端检验:临界值和显著性水平有如下的关系式:P(ZZ)=左端检验:临界值和显著性水平有如下关系式:P(Z-Z)=注意:相同的情况下,一端检验比二端检验功效高些,也就是说二端检验更难否定研究假设。,否定域,否定域,Z,-Z,接受域,接受域,确定检验规则,检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。,差异,临界点,拒绝H0,接受H0,c,c,判断,两类错误,接受或拒绝H0,都可能犯错误,I类错误弃真错误, 发生的概率为,II类错误纳伪错误,发生的概率为,检验决策 H0为真 H0非真,拒绝H0 犯I类错误() 正确,接受H0
9、犯II类错误() 正确,怎样确定c?,四、假设检验的检验规则,甲种误差,甲种误差,又称第一类错误。所谓甲种误差,是指H0为真,但小概率事件发生了,拒绝了H0,即把真的当成了假的,它是在拒绝了原假设时出现的错误。犯甲种误差的概率就是显著性水平。,乙种误差,纳伪的错误,又称第二类错误,是指H0为假,但小概率事件没有发生,接受H0 ,即把假的当成真的,它是在接受原假设时出现的错误。犯乙种误差的概率为,的数值随着真实的原假设中0的偏离程度而变化,=-0越小,的数值就越大。,总的说来:当我们作出接受原假设时,有两种可能,一种是真实状况,确如原假设所示的那样,从而制断正确;另一种是真实状况并非如原假设所示
10、的那样,但我们接受了原假设,因此犯了纳伪的错误。同样,当我们作出拒绝原假设结论时,也有两种可能,一种是真实状况确非原假设所示,因此作出拒绝的判断是正确的;另一种是真实状况为原假设所示,但被我们拒绝了,因此,犯了弃真的错误。,当显著性水平减少时,由于拒绝域的减少,弃真的错误会减少,但由此而来的是接受域增大了,因而纳伪的概率要增大,反之亦然。因此,在样本容量n固定情况下,如果要同时减少两类错误,是不可能的。,H0为真:均值=0; H0为假:均值0,=1。 0 1 在实际操作中,一般先控制,在此前提下,减少误差的办法是提高样本容量,因为,统计检验功效随着n增大而加强。 注意:接受原假设并不意味着证明
11、原假设:因为当拒绝H0接受H1时,所犯甲种误差的概率是很小的,而当接受H0时,所犯纳伪即乙种误差则有很大可能。因此,H0和H1在假设检验中所承担的作用是不对称的,H0受到保护的假设,没有充分依据是否定不了的。,甲种误差与乙种误差,甲种误差,否定域,图1:=0,图2:= 10,0, 1,否定域,当总体参数值一定,则越小,越大。如果一定,则 越大,越小。,甲种误差与乙种误差的关系: 大就小,小就大。,基本原则:力求在控制前提下减少,显著性水平,一般取值为:0.1, 0.05, 0.001, 等。如果犯I类错误损失更大,为减少损失,值取小;如果犯II类错误损失更大,值取大。,确定,就确定了临界点c。
12、确定了临界点c,就确定了否定域的大小。,0,接受域,否定域,否定域,五、检定力:参数与非参数法,1所谓统计法的检定力是指该统计法能够准确的判断原假设(H0)的正误之能力。检定力=1-乙种误差之机会。2参数与非参数检定。用作检定的统计法有两种,即参数检定和非参数检定法。,参数检定法的特点,A.要求总体具备某些条件,比如t检定法要求总体的数值呈正态分布等,参数检定一般也要求变项的数值具有定距测量层次的性质。B.若总体满足参数检定法的要求,参数检定法能相当准确地判别原假设的正误。,非参数检定法的特点,A.不要求总体数值具备特殊的条件,如X2检定法,也不要求是定距测量层次。B.由于不理会总体的情况,非参数检定法在推论时较为困难,准确性受影响。C.只要样本加大,可使检定力加强。,建立总体假设 H0,H1,抽样得到样 本观察值,1,2,选择统计量 确定H0为真 时的抽样分布,3,根据具体决策 要求确定,确定分布上的临 界点C和检验规则,计算检验统 计量的数值,比较并作出检验判断,7,4,5,6,六、假设检验的步骤,