1、多元方差分析应用多元方差分析应用2010-05-2714:53一、种类:多元方差分析有两种,分别对应SPSS命令generallinermodel中的Uniavariate和Multiavariate。1、相对于一元、二元方差分析,存在有多个自变量的单因变量方差分析(Uniavariate)。2 、多个因变量和多个自变量之间的方差分析(Multiavariate)。二、适用条件:在多元方差分析中,当因变量彼此不相关时,使用第一种多元方差分析。当所研究的多因变量的方差分析中,因变量彼此相关时,使用第二种多元方差分析。三、多因变量方差分析:多自变量的单因变量方差分析与一元方差分析相似,参照一元方差
2、分析即可。这里主要涉及的是多因变量的方差分析。1、基本原理:当实验设计中同时存在多个因变量时,计算过程变得越来越复杂,但计算的逻辑思想与本质没变。单因变量方差分析检验的是一个因变量上,组间差异是否随机出现;多因变量方差分析则检验的是一群因变量的组合时,其组间差异情况。在多因变量方差分析中,会从多个因变量中根据组间差异最大化的原则生成一个新的因变量,这个新的因变量是多个因变量的线性组合;采用多因变量方法是为了避免I类错误膨胀;但大多数情况下,多因变量的效力都不如单因变量高。如,调查使用两种教科书的学生数学和物理技能进步情况,这时含有两个因变量,我们的假设是这两个因变量都受教科书的影响。我们就须进
3、行多元方差分析。我们通过比较误差方差/协方差矩阵与效应方差/协方差矩阵可得到多变量的F值(Wilkslambda),而不是单变量的F值。这里包含了协方差的原因在于:两个测量结果可能存在相关,这在进行统计学检验时我们必须考虑进去。很显然,如果对同一个因变量测量两次,我们根本得不到新信息,但如果测量两个相关的因变量,却可以得到一些新信息。但是新变量也含有一些重复的信息,这种重复的信息可在变量间的协方差中表现出来。2、应用举例:首先仍然是考查变量的分布(是否存在极端值、非正态性和方差不等性),并未发现有明显违反假定时,便可开始进行假设检验。Multiavariate中Option选项Estimate
4、sofeffectsize、ObservedPower和Homogeneitytests会运算出结果:BoxsM:协方差矩阵齐性检验;p0.05接受齐性同质假设。对违反正态很敏感,但样本均衡时,还是可以耐受的(robust)。LevenesTest:检验每个因变量在自变量不同水平的方差同质性;考察的是组间自变量的同质。结果显著,则违反方差同质的统计前提。球面假设(sphericity):重复测量设计中,只有因变量的方差/协方差矩阵是环状的,单因变量才适用。当球面假设前提违反,通常的解决是看多变量结果。Bartletts与Mauchlys球面假设检验。多元正态分布:每一个遵从,则组合变量也遵从。
5、多因变量方法对违反前提的大部分情况可以耐受。大多数多元检验统计量都是基于HE-1的行列式,这里H是假设平方和和差积矩阵,E-1是误差平方和相差积矩阵的逆矩阵。行列式是矩阵的广义方差或散布的度量,这个矩阵可以计算为矩阵的特征根的乘积,因为每一个特征根表述广义方差的一部分。实际上,提取特征根的过程可以视作对HE-1矩阵的主成份分析的过程。有各种各样的统计量适用于根据HE-1的特征值评价多元差异。MANOVA显示最通用的4种检验(一般情况下没有区别):PillaisTrace:方差齐性前提违反时更具耐受性,即为最佳选择(最保守的检验)。WilksLambda:自变量大于两组时常用Hotellings
6、Trace:自变量只有两组时常用RoysLargestRootEta-squared是因变量总方差被自变量解释的方差比率。统计效力ObservedPower会受样本容量影响。事后检验(post-hoctest):方差同质不满足时:Games-Howell,TamhanesT2,DunnettsT3,DunnettsC对特殊群体的IQ与一般人之间的IQ情况做统计检验时,还需要考虑阅读能力、数学才能、运动技巧等,就需要使用第二种多元方差分析。其实质是比较几个均值形心(均值交叉点)与正常人的均值形心是否存在差异,即检验几个均值交叉点与一个已知总体的期望均值交叉点是否有显著差异。这就是Hotellin
7、gsTrace检验。虽然4个判据的精确分布不同.它们可以转换成近似有分布的统计量,这些统计量的精确分布表是可用的。只有一个因变量时。所有4个判据与通常纳入成ANOVA的F统计量等效。当含多个因变量的单样本或两个独立样本时。被转换的统计量严格地与F分布一样。研究者所关心的两个因素:能力和强度。支配着多元判据的选择,也就是说,若差异存在,检验统计量应能反映出来,并且不必受偏离假定的影响。对于大多数实际情况,当组间差沿几个维度延伸时,依照能力逐渐降低.检验判据的顺序是PillaisTrace、WilksLambda、HotellingsTrace、RoysLargestRoot。PillaisTra
8、ce还是最强的判断依据。也就是说。基于它的显著性水平,即使违反假定时,也是相当正确的。这点很重要.因为.一个检验由于轻微违反协方差阵的齐性或多元正态假定,导致改变显著性水平,它的使用便受限制;WilksLambda是F的精确值。3、结果解释:如果总体多元变量检验具有显著性意义,我们就认为该效应有意义。但接下去的问题当然是判断是仅仅数学技能进步了,还是物理技能进步了,或者是两者都进步了。实际上,验证特定主效应和交互效应的多元检验具有统计学意义后,通常要进行单变量的F检验解释各自的效应。也就是,判断某个特定的因变量对总效应的贡献。4、注意事项:进行三变量多元方差分析与三变量之和的单变量方差分析验的
9、结果是存在差异的。变量相加的内在的逻辑思想是每个变量都含有研究变量的真值以及随机测量误差。通过将变量相加,所有测量的测量误差相加近似于0,于是变量之和也就越来越可靠(越来越接近与真实值之和)。这种情况下,对变量之和进行方差分析也是适宜的,也是十分敏感(有效力)的。但如果因变量本身是一个多维变量,这种相加便不合适。例如,假设因变量是由社会成功的四个指标组成的,每个指标都代表一个人生活中能够通过努力并达到的独立目标(如,职业成功,成功的事业,成功的家庭等等),如果将这些变量进行相加犹如将苹果与橘子相加,所得的结果不是其潜在的单维可靠指标。这样,在多元方差分析中,我们得将这些数据当成是多元变量指标。
10、重复实验设计如果在学年初与学年末测量数学与物理技能,我们进行多变量的重复测量。同样,这种设计的统计学检验逻辑思想也仅仅是单变量的推广。注意多元方差分析方法也常常用于检验含有多个水平因素的单变量重复测量。降阶F检验:依赖于过程中指定变量的顺序。残差分析:残差-观测值和预测模型之间的差异情况,它提高有关模型与假设的信息,其技术基本与回归分析所类似。即通过误差散点图、残差正态图、残差无趋势正态分布图进行分析。结果:首先通过球形检验(Mauchlystestofsphericity)的结果判断重复测量数据之间是否存在相关性,如存在相关性(P0.05),宜进行多元方差分析,或采用Greenhouse-Geisser的校正结果;通过计算个体间(between-subject)变异,可分析处理因素有无效应;计算个体内(within-subject)变异,可分析时间因素有无效应,时间与处理因素之间有无交互效应;使用重复测量数据多重比较配对的t检验法(Bonferroni法),可进行每个分组每个时间点上作用的两两比较;使用多元方差分析的方法,可进行每个时间点上每个分组之间作用的两两比较。