1、第十一章 平均数的变异分析:ANOVA,1/39,第十章平均数的差异检定 ANOVA,Test for difference among the means: ANOVA,第十一章 平均数的变异分析:ANOVA,2/39,课程目标,了解变异数分析的原理了解F考验的原理与程序了解整体考验与事后考验的差异 了解相依样本的ANOVA了解共变量分析的原理熟习ANOVA的SPSS统计应用,第十一章 平均数的变异分析:ANOVA,3/39,基本定义,平均数考验方法变异数分析是一套应用于探讨平均数差异的统计方法当研究者所欲分析的资料是不同样本的平均数,也就是探讨类别变项对于连续变项的影响,平均数的差异成为主
2、要分析重点超过两个以上的平均数的考验,其原理是运用F考验来检验平均数间的变异量是否显著的高于随机变异量,又称为变异数分析,第一节,第十一章 平均数的变异分析:ANOVA,4/39,变异数分析的基本原理,平均数的变异分析超过两个平均数的考验,其原理仍是以平均数间的变异数(组间变异)除以随机变异得到的比值(F值),来取代平均数差异与随机差异的比值(t或Z值),而能够同时检验三个平均数的差异情形当F值越大,表示研究者关心的组平均数的分散情形较误差变异来得大,若大于研究者设定的临界值,研究者即可获得拒绝虚无假设、接受对立假设的结论。,第二节,第十一章 平均数的变异分析:ANOVA,5/39,单因子变异
3、数分析资料实例,可以计算出四个平均数,即三个组平均数与一个总平均数(grand mean)。变异数分析检验的就是这三个组平均数是否具有显著的差异 研究假设为:高、中、低三种不同运动量的受测者,其睡眠时间不同,第二节,第十一章 平均数的变异分析:ANOVA,6/39,SSwithin and SSbetween,第二节,第十一章 平均数的变异分析:ANOVA,7/39,实验、族系与比较错误率,实验误差率(experiment-wise error rate;EWE)统计的决策,是以整个实验的型I错误率维持一定(例如.05)的情况下,导出各次决策所犯的型I错误率为何 族系误差率(familywis
4、e error rate; FWE)将每一个被检验的效果(例如主要效果、交互效果)的统计考验的型I错误率维持一定,导出各次决策所犯的型I错误率比较错误率(comparison-wise error rate)将型I错误率设定于每一次的统计考验,均有相同的犯第一类型错误的机率实验与族系误差率为了维持整体的水平为.05,必须降低各次考验的水平,第二节,第十一章 平均数的变异分析:ANOVA,8/39,固定效果模式与随机效果模式,固定效果模式(fixed effect model)当一个研究的自变项的水平个数(k组),包括了该变项所有可能的水平数(K组),也就是样本的水平数等于母体的水平数(K=k)
5、 。例如比较大学四个年级学生的旷课次数,此时自变项为年级,具有四个水平,而母体亦为四个年级。随机效果模式(random effect model)研究所取用的自变项,只包含特定的一些水平,而并非包括所有可能的类别,即样本的水平数小于母体的水平数(Kk) 。例如教育学者比较不同地区的学校教学方法的成效有所不同,因此随机选取几个地区的一些学校共四所(自变项),该研究所关心的四个水平,可以说是随机自教学方法的母体中,随机取用得来的。,第二节,第十一章 平均数的变异分析:ANOVA,9/39,变异量拆解,SStotal=SSb+SSwSStotal:依变项观察值的变异。全体样本在依变项得分的变异情形,
6、即总离均差平方和)SSb导因于独变项影响的变异 (组间离均差平方和,sum of squares between groups)SSw导因于独变项以外的变异(随机变异)(组内离均差平方和,sum of squares within groups)各离均差平方和平均化后,得到均方和(MS),即为变异数的概念,第二节,第十一章 平均数的变异分析:ANOVA,10/39,F ratio,两个变异数的比值称为F统计量F统计量的机率分配为F分配F值越大,表示研究者关心的组平均数的分散情形较误差变异来得大若大于临界值,研究者即可获得拒绝H0的结论,第二节,第十一章 平均数的变异分析:ANOVA,11/39
7、,变异数分析摘要表,变异数分析的结果可以整理成摘要表形式,第二节,第十一章 平均数的变异分析:ANOVA,12/39,相依样本的变异数分析,相依样本设计(correlated sample design)进行变异数分析检验时,独变项的不同水平的受试者并非独立无关的个体,而是具有关联的样本基本形式重复量数设计(repeated measured design; RM)指同一个受试者重复接受不同的实验处理或进行多次测量的变异数分析,称为RM分析。配对样本设计(randomized block design, RB)指具有配对关系的样本接受不同的实验处理的变异数分析,每一个配对称为一个区组(bloc
8、k)又称为随机区组设计(randomized blocked design),第二节,第十一章 平均数的变异分析:ANOVA,13/39,单因子相依样本设计的资料形式,独变项分组平均数表示实验或分组效果(p个独变项各水平下的分组平均数)区组平均数(横列上区组平均数)反应该区组的平均水平,也就是区组同质性所造成在依变项上的水平高低细格效果每一个细格只有一个观察值,因此没有细格内变异,没有交互效果细格间的变异视为随机误差,细格效果,第二节,第十一章 平均数的变异分析:ANOVA,14/39,F考验与摘要表,第二节,第十一章 平均数的变异分析:ANOVA,15/39,ANOVA的基本假设,(一)常态
9、性假设变异数分析需处理超过三个以上的平均数,须假设样本是抽取自常态化母群体,当样本数越大,常态化的假设越不易违反。(二)变异数同质性假设多个样本平均数的比较,必须建立在样本的其他参数保持恒定的基础上,如果样本的变异数不同质,将造成推论上的偏误。也就是样本变异数同质性假设(homogeneity of variance)。(三)可加性假设变异数分析牵涉到变异量的拆解,因此,各种变异来源的变异量须相互独立,且可以进行累积与加减,称为可加性(additivity)假设。在进行加总时,系使用离均差平方和,而非变异数本身。(四)球面性假设(sphericity)适用于相依样本的变异数分析,系指不同水平的
10、同一组样本,在依变项上的得分,两两配对相减所得的差的变异数必须相等(同质)。也就是说,不同的受试者在不同水平间配对或重复测量,其变动情形应具有一致性。,第二节,第十一章 平均数的变异分析:ANOVA,16/39,2(omega square)量数,类似于回归分析的R2定义式2量数为组间变异与总变异的比值表示依变项变异量能被独变项解释的百分比亦即独变项与依变项的关联强度样本估计式:,第二节,第十一章 平均数的变异分析:ANOVA,17/39,2量数的判断,2量数的特性数值介于0到1之间,越接近1表示关联越强2量数值分布为以.05到.06为众数的正偏态分配,达到.1以上者,即属于高强度的独变项效果
11、一般期刊上所发表的实证论文的,也仅多在.06左右Cohen(1988)建议下列的判断准则,第二节,第十一章 平均数的变异分析:ANOVA,18/39,2 (eta square)量数,2是回归分析当中的R2,除了作为X对Y解释强度的指标外,经常也被视为效果量的指标样本数小时,为母体的偏估计数,需以下式进行调整,以得到不偏估计数(Wherry, 1931)净2 (partial 2 )量数扣除了其他效果项的影响后的关联强度量数,第二节,第十一章 平均数的变异分析:ANOVA,19/39,效果量系数,效果量(size of effect)系数用来衡量独变项强度的统计量。D量数最简单的效果量指平均数
12、之间的差异程度平均数间差异越大,表示独变项的强度越强f量数适用于当平均数数目大于2时,第三节,第十一章 平均数的变异分析:ANOVA,20/39,关联强度分析,统计显著性(statistical significance) 基于机率理论的观点,说明独变项效果相对于随机变化的一种统计意义的检验 例如利用F考验来决定独变项效果的统计意义 实务显著性(practical significance)反应独变项效果在真实世界的强度意义常用2 、 2、f量数表示也称为临床显著性(clinical significance),第二节,第十一章 平均数的变异分析:ANOVA,21/39,整体考验与多重比较,整
13、体考验(overall test)当变异数分析F考验值达显著水平,即推翻了平均数相等的虚无假设,亦即表示至少有两组平均数之间有显著差异存在。多个平均数整体效果(overall effect)达显著水平当整体考验显著后必须检验哪几个平均数之间显著有所不同,即进行多重比较(multiple comparison)来检验。 多重比较在进行F考验之前进行,称为事前比较(priori comparisons),在获得显著的F值之后所进行的多重比较,称为事后比较(posteriori comparisons)。,第三节,第十一章 平均数的变异分析:ANOVA,22/39,多重比较问题,第一类型错误膨胀问题
14、当比较次数越多,犯下决策错误的可能性就更高多重比较的统计原理多以族系错误率(FWE)的控制为主,期能使整体的错误率维持在一定的水平之下变异数同质假设问题多个平均数的比较必须在变异数同质假设维系的情况下才有相同的标准误如果各组变异数不同质时,多重比较的显著性考验还必须对变异数不同质进行调整处理,第三节,第十一章 平均数的变异分析:ANOVA,23/39,事前比较,时机在进行研究之前,研究者即基于理论的推理或个人特定的需求,事先另行建立研究假设,以便能够进行特定的两两样本平均数的考验事前比较所处理的是个别比较的假设考验,在显著水平的处理上,属于比较面显著水平,而不需考虑实验面的显著水平可直接应用t
15、考验,针对特定的水平,进行平均数差异考验,第三节,第十一章 平均数的变异分析:ANOVA,24/39,事后比较,变异数同质时(当各组样本数相同时)Tukeys HSD法:将所有的配对比较视为一体,使整个研究的第一类型错误维持衡定,第一类型错误是一种实验误差(experiment-wise error)LSD法又称为Fisher担保t检定(Fishers protected t-test),表示这个t检定是以考验达到显著之后所进行的后续考验,同时也在F考验的误差估计下所进行,第三节,第十一章 平均数的变异分析:ANOVA,25/39,HSD法,HSD法原理在常态性、同质性假设成立下,各组人数相等
16、的一种以族系误差率的控制为原则的多重比较程序称为诚实显著差异(Honestly Significant Difference)所谓诚实,就是在凸显LSD法并没有考虑到实验与族系面误差的问题 代价是降低了统计考验的检定力。以HSD法所得到的显著性,会比没有考虑型一错误膨胀问题的检定方法来的高(例如如果比较次数为三次,HSD的p值为会是LSD法的三倍) Kramer则将Tukey的方法加以延伸至各组样本数不相等的情况下,由于原理相同,故合称为Tukey-Kramer法,第三节,第十一章 平均数的变异分析:ANOVA,26/39,Newman-Keuls Methed,原理及计算公式与Tukeys
17、HSD法相同,唯一不同的是临界值的使用N-K法考虑相比较的两个平均数在排列次序中相差的层级数r(the number of steps between ordered mean),作为自由度的依据,而非HSD的平均数个数k。由于此法也是利用t检定原理,因此在SPSS中称为S-N-K法(Student-Newman-Keuls法)HSD法对于平均数配对差异检验较N-K法严谨,但是HSD法的统计检定力则较N-K法为弱,第三节,第十一章 平均数的变异分析:ANOVA,27/39,Scheffes methed,原理一种以F考验为基础,适用于n不相等的多重比较技术此一方法对分配常态性与变异一致性两项假
18、定之违反颇不敏感,且所犯第一类型错误(type I error)的机率较小。可以说是各种方法中最严格、检定力最低的一种多重比较。Cohen(1996)甚至认为Scheffe执行前不一定要执行F整体考验,因为如果F考验不显著,Scheffe考验亦不会显著,但是如果F整体考验显著,那么Scheffe检定则可以协助研究者寻找出整体考验下的各种组合效果,第三节,第十一章 平均数的变异分析:ANOVA,28/39,变异数同质假定违反的多重比较,Dunnetts T3法 调整临界值来达成族系与实验面的错误机率,使型一机率控制在一定的水平下 表示有nj个人的第j组变异数,表示各平均数变异误估计数,第三节,第
19、十一章 平均数的变异分析:ANOVA,29/39,Games-Howell法,原理计算出调整自由度 后,直接与查自于Studentized range distribution的qcv临界值相比,来决定显著性当各组人数大于50时Games-Howell法所求出的机率估计会较T3法正确,类似于Dunnett另外提出的C法,第三节,第十一章 平均数的变异分析:ANOVA,30/39,Dunnett method,类似于Scheff法,适用于实验研究中当实验具有k个平均数,k-1个为实验控制,一个对照组,每一个实验组需与对照组比较,因此需进行k-1次配对比较,第一类型错误的设定,是以整体实验的成败为
20、考量,为一种experiment-wise error。杜纳法基于t分配的机率原理,检定k-1个实验组的平均数与单一控制组的平均数之间的差异显著性,属于非正交比较(non-orthogonal comparison)。,第三节,第十一章 平均数的变异分析:ANOVA,31/39,共变量分析,共变量分析Analysis of Covariance(ANCOVA)将一个典型的变异数分析中的各个量数,加入一个或多个连续性的共变项(即控制变项),以控制变项与依变项间的共变为基础,进行调整(correction),得到排除控制变项影响的单纯(pure)统计量的ANOVA检定,Y1,第四节,第十一章 平均
21、数的变异分析:ANOVA,32/39,单共变量分析的基本原理,共变量分析的目的将一个典型的变异数分析中的各个量数,加入一个或多个连续性的共变项(即控制变项),以控制变项与依变项间的共变为基础,进行调整(correction),得到排除控制变项影响的单纯(pure)统计量 单纯统计量指自变项与依变项的关系,因为先行去除控制变项与依变项的共变,因而不再存有该控制变项的影响,单纯的反映研究所关心的自变与依变关系。共变项也必需为连续变项研究中对于自变项或依变项具有干扰效应的变项实验研究中的前测(pretest)多可作为控制变项,第四节,第十一章 平均数的变异分析:ANOVA,33/39,混淆因子的控制
22、,变项关系的检验,除了具体明确的界定与陈述其关连或因果特质之外,常取决于研究者是否能够控制其他无关的干扰变项,减少分析过程的混淆因素。研究的控制程序控制(procedural control) 抽样过程尽可能的随机化、使研究程序标准化等等 实验控制(experimental control) 在研究过程中,即针对有可能造成干扰的变项加以测量,再利用实验设计的操弄与统计的方法,将该因素的效果以自变项的角色纳入分析 统计控制(statistical control) 以数学原理处理当控制变项与其他自变项对于依变项的影响,第四节,第十一章 平均数的变异分析:ANOVA,34/39,共变量分析的变异数
23、拆解,变异量拆解原理共变量分析的主要原理系将全体样本在依变项的得分的变异情形,先以回归原理排除共变项的影响,其余的纯净效果即可区分为导因于自变项影响的变异与导因于误差的变异两个部份线性回归原理共变量分析是以回归的原理,将控制变项以预测变项处理,计算依变项被该预测变项解释的比率。当依变项的变异量被控制变项可以解释的部份被计算出来后,剩余的依变项的变异即排除了控制变项的影响,而完全归因于自变项效果(实验处理)。,第四节,第十一章 平均数的变异分析:ANOVA,35/39,共变项的影响二:平均数调整,第四节,第十一章 平均数的变异分析:ANOVA,36/39,共变量分析对于平均数的调整图示,第四节,
24、第十一章 平均数的变异分析:ANOVA,37/39,回归同质假设,回归同质假设(assumption of homogeneity of regression) 共变项与依变项的关联性在各组内相同,第四节,第十一章 平均数的变异分析:ANOVA,38/39,ANCOVA检验方法,实际操作ANCOVA需使用型I平方和来检验共变项的效果回归同质性检验系检验共变项与独变项的交互作用是否显著SPSS中,可以自行调整模型,增加共变项与独变项的交互作用项,即可获得检验数值,第四节,第十一章 平均数的变异分析:ANOVA,39/39,Time for rest,Chapter 11 is done here. See you later!,