1、第五章平均数比较与T检验,基本理论,一、假设 1.假设 在研究之前不知其结果,可根据已有经验或理论对预期的结果做出假定性的说明,即假设。 假设检验一般要提出两个相互对立的假设:一个叫零假设,另一个叫备择假设。,2.零假设 所谓零假设,就是关于样本所属总体(指参数值)与假设总体(指参数值)之间无差异的假设也叫做原假设、虚无假设、解消假设。零假设是假设检验中希望拒绝的假设。,3.备择假设 所谓备择假设就是和零假设相反的假设。指的是关于当前样本所属的总体(指参数值)与假设总体(指参数值)有差异的假设,是研究者根据样本信息期待证实的假设,是否定了零假设后应当采取的假设,也叫做研究假设、对立假设。记为:
2、,假设检验总是从零假设开始的,然后,看有多大的把握拒绝零假设。如果拒绝零假设的把握非常大,则应该拒绝零假设,接受备择假设,认为样本所属总体的参数与假设总体参数有显著性差异,即本质差异;如果拒绝零假设的把握不大,或者说,若拒绝零假设犯错误的概率太大,则只好保留零假设,认为样本所属总体的参数与假设总体参数没有显著性差异,即本质差异。,假设检验的两大特点: (1)根据一定的概率来下结论; (2)采用反证法。,例如:根据经验我们可以说张家界的6月天不会下雪,假如有一年的6月份下了一场雪,则原来的结论就被推翻。这样的推理方法就是反证法。 再如:天下乌鸦一般黑。如果能够找到另外一种颜色的乌鸦,则原来的假设
3、就被推翻。,二、小概率事件,样本统计量的值(随机事件)在其抽样分布上出现的概率小于或等于事先规定的水平,这时,就认为小概率事件发生了。把出现小概率的随机事件称为小概率事件。,例如,假设某个样本所来自的总体等于假设的总体。于是,可以分析如果零假设是真实的,那么样本统计量的分布如何。并且,可以按照事先规定的水平把抽样分布分成两个区域,一个属于零假设的保留区域(出现的概率比较大),另一个为零假设的拒绝区域,出现的概率比较小(落在这个区域的事件都属于小概率事件)。,然后,实际分析所获得的这个样本统计量值,看它落入哪个区域。如果出现的概率足够小,属于小概率事件,就根据小概率事件在一次抽样中几乎不可能发生
4、原理,从实际可能性上,推翻零假设。 由此可见,小概率事件发没发生,是拒绝或保留零假设的依据。,三、显著性水平,统计学中把这种拒绝零假设的概率称为显著性水平,表示为:,也可以说,显著性水平是统计推断时,可能犯错误的概率。 值和可靠度之间的关系是:两者之和为1。值越大,可靠度就越低;值越小,可靠度就越高。,P值与H0的关系,检验的形式:,双侧检验只强调差异不强调方向的检验为双侧检验。所提出的假设检验的问题是是否一样、相同、有差异等等。 单侧检验既检验差异又考虑差异的方向的检验为单侧检验。具体来说,又分为左侧检验和右侧检验。 左侧检验所提出的假设检验的问题是否低于、差于总体平均数等等。右侧检验所提出
5、的假设检验的问题是否高于、优于、超过总体平均数、有效等等。,基本步骤:,(1)根据检验的目标,对待推断的总体参数或分布作一个基本假设H0; (2)利用收集到的样本数据和基本假设计算某检验统计量(t),且该统计量一定服从某种已知分布; (3)根据该统计量的值得到对应的相伴概率(P值),即:检验统计量在某个特定的极端区域取值在H0成立时的概率; (4)如果相伴概率P值小于用户给定的显著性水平a,则拒绝H0。否则,不拒绝H0。,平均数分析,该过程主要用于分组计算各统计指标,也可以进行单因素随机设计方差分析和线性检验。,AnalyzeCompare Means Means 出现对话框,操作,平均数分析
6、对话框,Options对话框,单一样本t检验,AnalyzeCompare Means One Sample T Test 出现对话框,操作,该过程用于检验样本平均数与总体平均数之间是否存在差异。,单一样本t检验对话框,实例分析:,某种生产浴皂机器的设计规则为每批平均生产120块肥皂,超过或低于这个标准都是不合理的。如下有10批产品组成的样本,且假定总体服从正态分布。见“例 5-1”。 108 118 120 122 119 113 124 122 120 123 显著性水平a为0.05,通过该样本检验,分析是否该生产过程运作正常,这个问题,实际上就是问样本检验结果与120的均值有无差异。采用
7、单样本的T检验过程。 具体操作如下: AnalyzeCompare Means One-Sample T Test,打开T检验对话框,如下图。,t即t值,df为自由度,sig.(2 tailed)为双尾P值。样本均值与检验值的差为-1.100。95%的样本差值落在(-4.63,2.43)这个置信区间内。 可以看出,t统计量的值为-0.705,相伴概率值(sig.significance)为0.4980.05,因此不能拒绝H0的原假设(120的检验值),显著性差异不大,结果表示该生产过程较正常。,独立样本t检验,AnalyzeCompare Means Independent-Sample T
8、test 出现对话框,操作,该过程用于检验两个独立样本的平均数之间是否存在差异。,独立样本t检验对话框,独立样本,独立样本(Independent Sample)是指两个样本彼此独立,没有任何关联。例如实验组与控制组、男生组与女生组、高收入组与低收入组、大学数学系与物理系等。但这里的独立样本是广义的独立,仅是指非关联变量。两独立的样本各接受相同的测量,研究者的兴趣在比较两批样本群在测量结果总体上是否存在差异。独立样本中,所有观测都是独立的,即具体个别样本的顺序可以变化的,与变量无关。,实例分析,某研究机构分别对20款中型及小型汽车进行安全性测试,较低的分数意味着安全性更高。数据见文档“例 5-
9、2”,要求使用两独立样本T检验来比较中型和小型汽车的安全性有无差异。 具体操作如下: AnalyzeCompare Means Independent-Samples T Test,打开独立样本T检验对话框,如下图。,(四)检验结果分析,首先,如果F检验的P,则不能拒绝F检验的H0,认为方差齐性;其次看equal行(第一行)的t检验概率。如果,则拒绝t检验的H0,认为两总体均值有显著差异;如果,则不拒绝t检验的H0,认为两总体均值不具有显著差异。 那么,如果F检验的P,则拒绝F检验的H0,认为方差不齐性;其次看Unequal行(第二行)的t检验概率。其余同上。 针对本例,由于F检验中sig.值
10、大于0.05,因此根据第一行t检验显著性概率为0.000,即认为中型汽车和小型汽车的安全性得分有显著性差异。,配对样本t检验,AnalyzeCompare Means Paired-Sample T test 出现对话框,操作,该过程用于检验两个配对样本的平均数之间是否存在差异。,配对样本t检验对话框,配对样本,配对样本(Paired Sample)或相关样本(Correlated Sample),指两个样本的观测值之间彼此有关联,如同一批被试者接受两种实验条件,即同一批观测对象接受两种不同的测量。对于此类样本,研究者所感兴趣的是二次测量之间是否存在差异。如实验前和实验后的测量,即具体个别样本
11、的顺序不可以变化的。,实例分析:,一种新型减肥食品正在作投入市场前的检验。一个随机样本由8个人组成试验前后样本体重数据见文档“例 5-3”,我们可以使用两配对样本T检验来比较服用减肥食品前后效果有无差异。 具体操作如下: AnalyzeCompare Means paired-Samples T Test,打开配对T检验对话框,如下图。将左框两变量移入配对变量框中,采用按住shift键的方式。,方差分析概述,(一)问题的提出 通过参数检验可以解决两两总体均值的比较,那么多个总体均值的检验如何作?(如:北京、上海、广州周岁儿童平均身高的比较)。这可以利用方差分析的方法来实现,(二)分析目的,方差
12、分析是从数据间的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素。 例如: 影响某农作物亩产量的因素(品种、施肥量、气候等) 影响推销某种商品的推销额(不同的推销策略、价格、包装方式、推销人员的形象等),(三)涉及的概念,(1)观察因素: 观测变量 (2)影响因素: 控制因素(控制变量)将控制因素的不同情况称为控制因素的不同水平. 随机因素.,(四)方差分析的类型,单因素方差分析 多因素方差分析 协方差分析,单因素方差分析,(一)目的 检验某一个控制因素的改变是否会给观察变量带来显著影响。 例如: 考察不同肥料对某农作物亩产量是否有显著差异。 考察妇女生育率在不同地区是否有显著差异。
13、 考察不同学历是否对工资收入产生显著影响。 考察不同的推销策略是否对推销额产生显著影响。,(二)基本思路,(1)入手点: 检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变量产生了显著影响。 (2)前提: 不同水平下各总体服从方差相等的正态分布。 (3) H0:不同水平下,各总体均值无显著差异。即不同水平下控制因素的影响不显著。,(三)实例分析,某城市五个地区每天发生交通事故的次数,见文件“例 6-1”,检验个地区平均每天交通事故的次数是否有显著性差异。 由于涉及到的控制变量只有一个:方位变化,但有5个总体样本,所以采用的是单因素方差分析 操作过程: 依次选取
14、AnalyzeCompare MeansOne-way ANOVA(analysis of variance),弹出对话框,如下图。,Options选项中所勾选的三个分别表示输出描述统计量、方差齐性检验表和均值点图。,检验结果分析: 由于方差分析F检验中sig.值小于0.05,因此拒绝原假设H0,表明所检验因素即地区不同对平均每天交通事故的次数观测量有显著影响。,(四)单因素方差分析中的多重比较,目的: 如果总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异。多重比较将对每个水平的均值逐对(两两)进行比较检验。SPSS提供了各种不同的多重比较方法,具体选项在post hoc 中选取。如下图,可以看出,只有南部地区的平均每天交通事故次数分别与东部、北部、中部的平均每天交通事故次数有显著性差异(sig.值0.05)。,