1、平均数的差异性 t 检验,主讲人:朱 丹,2,假设检验,对总体参数、分布形式、相互关系等提出假设,然后利用样本数据来判断该假设论述的合理性。,你相信他们的说法吗?你要如何去证明这些说法是正确或是错误?,为检验此论述,进行随机抽样调查,以样本数据检验此假设是否成立。,假设来西藏旅游的外国旅客平均消费支出8000元。有人提出拉萨市民人均月收入是2500元。有人提出西藏大学学生的平均IQ测验分数是110。,3,假设检验,产生假设检验的原因大致有两个:当对总体参数的真实性感到怀疑,需要通过样本来考察其正确与否时,往往借助于假设检验做出判断(决策)。当对变量间存在某种关系的证据(平均值之差、方差之比等)
2、怀疑时,也会要求进行假设检验。,4,第六章 假设检验,第一节 假设检验原理第二节 单一总体均值的假设检验第三节 两个总体均值差的假设检验第四节 总体比例与方差的假设检验第五节 SPSS在假设检验中的应用,5,第一节 假设检验原理,一、建立假设二、接受域和拒绝域三、两类错误四、假设检验的步骤五、p值(p-value)六、正确表述统计决策结果,Back,6,一、建立假设,原假设/虚无假设(null hypothesis):H0研究者要收集证据予以反对的假设。将研究结果无效的说法作为原假设。设定总体参数等于某一数值。认为两个或两个以上总体参数相等。 H0:=2500 OR H0:2500 (收入)
3、H0:1=2 (1会计,2企管,统计学成绩),“等号”始终在H0。,7,一、建立假设,例如:你对某品牌洗涤剂的产品标签中声称:“平均净含量不低于500克”,感到质疑。你想要证实“平均净含量不足500克”。即你想要推翻的是500克,要证实500克。此时,H0:500例如:你研究认为员工满意度和性别有关,你想要以样本数据来支持你的论点。此时,H0:员工满意度和性别无关,8,一、建立假设,备择假设(alternative hypothesis) :H1研究者要收集证据予以支持的假设。将研究结果有效的假设作为备择假设。与原假设对立,是要研究的问题。强调差异或方向性。例如,某品牌洗涤剂的产品, H1:5
4、00例如, H1:员工满意度和性别有关,9,一、建立假设,H0和H1是互斥的,主要有三种情况:双侧或双尾假设检验(two-tailed test) H0:=2500 ,H1:2500单侧或单尾假设检验(one-tailed test)右侧假设检验: H0: 2500 ,H1:2500 左侧假设检验: H1: 2500 ,H1:2500,双侧检验或单侧检验,根据H1来定。,10,例如:灯泡厂商在给用户提供一批灯泡时声称,该批灯泡的平均使用寿命是1600hr。为验证厂商的说法,需要用样本数据进行检验。,提出假设:,H0:=1600; H1:1600,如果样本数据很接近1600hr,则可以接受H0;
5、如果样本数据离1600hr很远,就会拒绝H0,接受H1。,如果有人对用户说:灯泡的平均使用寿命低于1600hr。此时,用户要研究的是是否会小于1600hr。,11,思考题:,想要检验女性职员平均体重是否大于55公斤,如何提出原假设和备择假设?,H0:=55; H1:55 或 H0:55;H1:55,Back,12,二、接受域和拒绝域,假设设定之后,我们需要一个判别标准,判断拒绝或接受H0。利用“小概率原理”,指发生概率很小的随机事件,在一次试验中几乎是不可能发生的。如果发生了,就可以拒绝提出的原假设。,例如:有一个厂商声称其产品的合格品率很高,可以达到99%,则从一批产品(100件)中随机抽取
6、1件,该件是次品的概率就非常小,只有1%。,如果厂商的宣称是真的,随机抽取1件是次品的情况几乎是不可能发生的。如果这种情况发生了,我们就有理由怀疑原来的假设是否成立,这时我们可以推翻原来的假设。,当然,推论也可能犯错误,确实有1件次品,刚好1次被抽到,这种错误概率是1%(显著水平)。,13,二、接受域和拒绝域,以统计量(称检验统计量,test statistic)的抽样分布为基础,给定小概率 ,判断样本数据是否接受H0。检验统计量所有可能取值分两为部分,可以拒绝H0的检验统计量取值的集合称拒绝域。反之,称接受域,不拒绝H0。划分的数值称临界值。接受域的区间概率1-,拒绝域的区间概率。,如何定义
7、接受域和拒绝域?,14,双侧假设检验的拒绝域定义:,在抽样分布两端各/2位置上确定拒绝域边界的临界值。,H0:=0; H1:0,只要0或0,二者之一成立,就可以否定H0。,它有两个拒绝域,两个临界值,每个拒绝域的概率/2 。,临界值,拒绝域:,样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0 。,15,单侧假设检验的拒绝域定义:,在抽样分布某一端的位置上确定拒绝域边界的临界值。,单侧检验有一个拒绝域,一个临界值,拒绝域的概率 。,右侧检验拒绝域:,右侧假设检验拒绝域在右边,左侧假设检验拒绝域在左边。,左侧检验拒绝域:,右侧检验图,Back,16,三、两类错误,以样本统计量推论总体参数,因为样
8、本数据具随机性,存在判断正确和错误的四种概率:,弃真错误又称第I类错误(Type I error)。 取伪错误又称第II类错误(Type II error)。,假设检验时,希望正确判断并减少犯错误的概率。通过控制(显著性水平,level of significance)减少犯错,此种检验称显著性检验。,Back,17,三、两类错误,弃真错误 如前例,厂商声称产品合格率是99%。100件中确实只有1件次品。进行抽样时,刚好1次被抽到次品,这种错误称弃真错误(第类错误),错误概率是1%()。,取伪错误 厂商声称产品合格率是99%,实际上仅有90%,表示100件中有10件次品。为了检验厂商宣称是否真
9、实,我们随机抽取20件产品,结果都是合格品,于是我们推断厂商宣称是真实的。犯第二类错误,错误概率。,Back,18,四、假设检验的步骤,Step1:提出原假设 H0 和备择假设 H1 例如:H0:=0;H1:0Step2:确定显著性水平是决策中的风险。主观确定。一般取0.05或0.01。,19,四、假设检验的步骤,Step3:选择检验统计量(Test Statistic)假设检验也是从抽样分布出发,借由样本数据计算检验统计量的数值进行推断。确定H0为真时,检验统计量服从的抽样分布。,例如:总体服从正态分布,且已知,则构造检验统计量Z,在H0为真的情况下,有,可以确定临界值,构造拒绝域和接受域。
10、,20,四、假设检验的步骤,Step4:计算检验统计量的数值根据样本数据计算检验统计量的数值。Step5:建立决策准则,进行判断根据值和抽样分布,确定临界值。将检验统计量的数值与临界值相比较,做出是否拒绝H0的判断。或以检验统计量计算p值,确定是否拒绝H0 。,Back,21,五、p值(p-value),p值:H0为真时,由样本数据给出的犯第类错误的概率的精确数值(观察到的显著性水平)。统计软件给出检验统计量的数值时,一般都给出该检验统计量数值的p值。,以p值进行假设检验: p值,接受H0 p值65,=0.05,因为 n=100为大样本,X=69,=10,在H0为真的情况下,构造检验统计量:,
11、由样本数据计算检验统计量的数值:,决策规则(如图),如果 ZZ0.05 拒绝H0,因为检验统计量Z的数值落在拒绝域,所以拒绝H0。证据显示,参加培训后可以提高词汇记忆任务的成绩。,Back,28,2.小样本的正态总体,已知,检验统计量:,【例】,29,例题(),SAT测验分数遵从=500,=100的正态分布。一位老师办辅导班,希望能够提高学生的SAT分数。随机抽取16个学生参加他的辅导班,其参加测验后得到的平均分数X=554。试问:参加这个辅导班对学生的SAT分数有影响吗?(1)以=0.05 为检验标准,进行检验。(2)以=0.01 为检验标准,结论有变化吗?,30,(1)解:,H0:=500
12、;H1: 500,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,决策规则(如图),如果 ZZ0.05 拒绝H0,因为检验统计量Z的数值落在拒绝域,所以拒绝H0。证据显示,参加辅导班对学生的SAT分数有显著影响。,=0.05,正态总体,小样本n=16,X=554,=100,31,(2)解:,H0:=500;H1: 500,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,决策规则(如图),如果 ZZ0.01 拒绝H0,因为检验统计量Z的数值落在接受域,所以不拒绝H0。证据显示,参加辅导班对学生的SAT分数没有影响。,Back,=0.01,正态总体,
13、小样本n=16,X=554,=100,32,3.小样本的正态总体,未知,检验统计量:,【例】,33,例题:,一位研究者编制问卷来评定抑郁水平,并对相同数量的正常人进行了测量,得到均值=55,且分数呈正态。测验中,高分表示抑郁程度高。为确定测验是否对那些有抑郁的个体有足够的敏感性,随机抽取一个抑郁症病人样本n=21,对其进行测试。得到一组数据如下: 59, 60, 60, 67,65, 90, 89, 73, 74, 81, 71, 71, 83, 83, 88, 83, 84, 86, 85, 78, 79 病人在这一测验上的分数与正常人显著不同吗? (=0.01),34,解:,H0:=55;
14、H1: 55,=0.01,正态总体,n=21为小样本,未知,以S估计,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,双侧检验决策规则:t t0.005(21-1) 或t - t0.005(21-1)拒绝H0,因为检验统计量t的数值落在拒绝域,所以拒绝H0。证据显示,抑郁的个体得分和正常人有显著不同,表明该问卷对于抑郁个体有足够的敏感性。,Back,35,第三节 两个总体均值差的假设检验,男性和女性的消费支出是否有差别?年轻员工和年老员工的平均请假天数是否相同?平均绩效奖金是否相同?如果把音乐引入生产线,生产量是否提高?,两个总体,关于定量数据的检验。,36,第三节 两
15、个总体均值差的假设检验,1. n1和n2皆大于302. 1,2已知的正态分布3. 1,2未知,n1和n2皆小于304. 配对样本(两个相关样本),Back,37,1. n1和n2皆大于30,检验统计量:,如果1和2未知,则以样本标准差S1和S2代替。,38,2. 1,2已知的正态分布,检验统计量:,【例】,39,例题:,有甲、乙两条生产线同时灌装产品,已知两条生产线产品的重量都服从正态分布。甲生产线X1N(1,0.32),乙生产线X2N(2,0.42)。现从甲、乙两条生产在线随机抽取10件和8件产品,测得它们平均重量分别为249.4g和250.2g。试问甲、乙两条生产线灌装产品的重量是否有明显
16、差异? =0.05,40,解答:,两独立样本,=0.05,因为n1=10,n2=8为小样本;总体为正态分布,且总体标准差已知,1=0.3, 2=0.4,H0为真时,检验统计量:,H0:120 ;H1:12 0,41,解答:,双侧假设检验,决策准则:如果ZZ0.025或ZZ0.025拒绝H0,因为检验统计量Z的数值落在拒绝域,所以拒绝H0。,甲、乙两条生产线罐装产品的重量存在显著的差异。,42,3. 1,2未知,n1和n2皆小于30,正态总体,且,,检验统计量:,【例】,43,例题:,小学一年级男女学生样本在大五人格量表中的内外向维度上的得分(分数越高,表明越外向)如表所示。试问男生和女生在内外
17、向维度上的得分是否有明显差异?(假设为正态总体,且两总体方差相同) =0.05,44,例题:,两独立样本,总体为正态分布,=0.05,n1=14,n2=14为小样本;,H0为真时,检验统计量:,H0:120 ;H1:12 0,计算,45,例题:,双侧假设检验,决策准则: 如果tt0.025(26)或tt0.025(26)拒绝H0,因为检验统计量t的数值落在拒绝域,所以拒绝H0。,数据显示,男生和女生在人格量表的内外向维度上的得分有显着差异。,46,3. 1,2未知,n1和n2皆小于30,正态总体,且,,检验统计量:,47,4.配对样本,d=XbXa:配对样本的差值,d:d的均值,检验统计量:,
18、(n0.8,在H0为真的情况下,构造检验统计量:,计算检验统计量的数值:,右侧检验:决策规则,如果 ZZ0.05 拒绝H0,因为检验统计量Z的数值落在接受域,所以不拒绝H0。没有明显证据表明支持率的估计是正确的。,=0.05,n=230大样本,且np和n(1-p)皆大于5,Back,53,2. 单一总体方差的假设检验,检验统计量:,拒绝域,拒绝域,拒绝域,Back,54,3. 两个总体方差比的假设检验,检验统计量:,拒绝域,拒绝域,拒绝域,Back,55,思考题:,某小区小麦的一般生产水平平均产量为250kg,其标准差为30kg。现用一种化肥进行试验,根据25个小区的抽样结果计算平均产量为27
19、0kg。问这种化肥是否使小麦明显增产。=0.05。,56,解答:,H0:=250;H1: 250,=0.05,因为n=25 为小样本;X=270,=30,H0为真时,检验统计量:,决策规则如图,如果ZZ0.05拒绝H0,Z 落在拒绝域,所以拒绝H0。,当=0.05的情况下,数据显示化肥会使小麦明显增产。,57,第五节 SPSS在假设检验中的应用,以SPSS进行假设检验时:1. 要先提出假设2. 自行确定显著性水平 3. 选择适当的推断统计方法 (统计学家已经选择了相应的检验统计量)4. SPSS会根据你选择的统计方法,自动计算出样本检验统计量数值(如:t 值、F 值和 p值)5. 以和p值进行
20、判断,决定拒绝或接受H0。,58,第五节 SPSS在假设检验中的应用,一、单样本 t 检验 二、两独立样本 t 检验三、两配对样本 t 检验,Back,59,一、单样本 t 检验 p.125,分析目的利用来自总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异。是对单个总体均值的假设检验。假设总体来自正态分布。如:从新生入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。SPSS操作Analyze Compare Means One-Sample T Test输出结果解读例子 p.127,60,单样本 t 检验的应用
21、,在一居民储蓄调查数据中,推断储户总体一次平均存款金额是否为2000元。同时储户一次存款金额总体可近似服从正态分布,因此,可采用单样本t检验来进行分析H0:=2000;H1: 2000Analyze Compare Means One-Sample T Test,61,62,63,64,因为 p-value=0.216=0.05,因此不能拒绝H0。数据显示,储户总体一次平均存款与2000元没有显著差异。,95%CI:有95%的把握认为储户总体一次平均存款金额在1721.87(2000-278.13)和3225.69(2000+1225.69)元之间。,65,思考题:,某生产食盐的生产线,其生产
22、的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为495, 502, 508, 496, 505, 499, 503, 498, 505, 500。假设重量呈现正态分布,请检验生产线的工作情况。,66,思考题解答:,H0:=500 ; H1:500,因为双尾检测概率p值0.432大于=0.05,故不拒绝H0,即抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。,Back,67,二、两独立样本 t 检验p.130,分析目的利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异。如:比较两校高三学生的数学成绩,从两校抽取高三学生,进而检验两校高三学生的平
23、均数学成绩是否有显著差异。两独立样本 t 检验的前提样本来自的总体应服从或近似服从正态分布,且两组样本相互独立。,68,二、两独立样本 t 检验,两总体方差相等或不相等,所采用的检验统计量不同。因此,要先对两总体的方差是否相等进行假设检验,SPSS利用Levene F方差齐性检验方法加以检验(p.131)。SPSS操作 p.132Analyze Compare Means Independent-Samples T Test输出结果解读 p.133Step1:对两总体方差是否相等的F检验。Step2:对两总体均值差的检验。,69,两独立样本 t 检验的应用,在居民储蓄调查数据中,分析城镇储户与
24、农村储户的一次平均存款金额是否存在显著差异。假设城镇储户与农村储户的一次存款金额总体都近似服从正态分布,因此,可采用两独立样本 t 检验来进行分析原假设为城镇储户与农村储户的一次平均存款金额无显着差异。H0:1=2 ;H1:12,70,71,72,73,74,Step1:对两总体方差是否相等的F检验。p-value=0.429 =0.05 ,不拒绝H0。显示两总体方差没有显著差异。,Step2:对两总体均值差的检验。p-value=0.380 =0.05 ,不拒绝H0。显示城镇储户与农村储户的一次平均存款金额无显着差异。,75,思考题:,为比较两种不同品种的玉米的产量,分别统计了8个地区的单位
25、面积产量,具体数据如下表所示。假定玉米产量服从正态分布,且两组样本相互独立。试比较两种玉米产量是否有显著性差异。,76,思考题解答:,数据组织:在SPSS数据文件中建立两个变量,分别是“品种”、“产量”,变量品种的变量值分别为A和B。,77,思考题解答:,H0:A= B ; H1:A B,F检验的p值=0.752大于=0.05,可以认为两总体方差无显著性差异。方差相等情况下,两独立样本t检验,双尾检测概率p值0.332大于=0.05,故不拒绝H0,不能认为两种玉米品种的产量有显著性差异。,Back,78,三、两配对样本 t 检验p.138,分析目的利用来自两个相关总体的样本数据,推断两个总体的
26、均值是否存在差异。假设总体来自正态分布。如:研究减肥茶的效果,需要测量同一组人的喝茶前和喝茶后的体重进行分析。八折的促销方式对销售额的影响是否产生显著影响。配对样本的特征:(1)两组样本的样本数相同;(2)两组样本观察值的先后顺序是一一对应,不能随意更改。SPSS操作 p.140Analyze Compare Means Paired-Samples T Test输出结果解读 p.141,79,两配对样本 t 检验的应用,为研究某种减肥茶是否有明显的减肥效果,某减肥茶生产厂商对35名肥胖志愿者进行减肥茶跟踪调研。首先将其喝减肥茶以前的体重记录下来,三个月后再依次将这35 名志愿者喝茶后的体重记
27、录下来。通过这两组数据对比分析,推断减肥茶是否有明显减肥作用。在此,体重近似服从正态分布。H0:1-2 =0;H1:1-2 0,80,81,82,83,84,喝茶前后的平均值有较大差异,喝茶前后线性相关程度弱(可略),喝茶前后体重的平均差异为19.2公斤。因为p-value=0.0 =0.05 ,拒绝H0。显示喝茶前后体重平均值存在显著的差异,可以认为该减肥茶具有显著的减肥效果。,85,思考题:,随机选择了8名肥胖儿童试验一种减肥方案,减肥前后的体重如下表。根据试验结果,在5%的显著水平下能否认为减肥方案有效?,86,思考题解答:,数据组织:在SPSS数据文件中建立两个变量,分别是“减肥前(WTB)”、“减肥后(WTA)” 。,87,减肥方案实施前后体重的平均差异为4公斤。因为p-value=0.001 =0.05 ,拒绝H0。显示减肥方案实施前后体重平均值存在显著的差异,可以认为该减肥方案有效。,思考题解答:,H0:A-B = 0;H1:A-B 0,Back,