1、第八讲 方差分析,前几章我们讨论的都是一个总体或者两个总体的统计分析问题,但在实际工作中,我们还会经常碰到多个总体均值的比较问题,处理这类问题通常采用方差分析,本章主要内容,单因素试验的方差分析(one-way ANOVA) 两因素试验的方差分析(multiple ANOVA),一、单因素方差分析,试验指标试验中要考察的指标.,因 素影响试验指标的条件.,因素,可 控 因 素,不可控因素,水 平因素所处的状态.,单因素试验在一项试验中只有一个因素改变.,多因素试验在一项试验中有多个因素在改变.,数学模型,假设,单因素试验方差分析的数学模型,需要解决的问题,检验假设,数学模型的等价形式,例1 设
2、有三台机器,用来生产规格相同的铝合金薄 板.取样,测量薄板的厚度精确至千分之一厘米.得结 果如下表所示.,试验指标: 薄板的厚度,因素: 机器,水平: 不同的三台机器是因素的三个不同的水平,假定除机器这一因素外, 其他条件相同, 属于单因素试验.,试验目的: 考察各台机器所生产的薄板的厚度 有无显著的差异. 即考察机器这一因素对厚度有无 显著的影响.,将数据看成是来自三个总体的样本值。每一次测量看作是一个水平,在每一个水平下进行独立试验,结果是一个随机变量。,问题分析,检验假设,检验假设,等价于,检验假设,组间方差(不同水平-机器产品均值的离差平方和),组内方差(单台机器不同次试验测得均值的离
3、差平方和,二、平方和的分解,总平方和,总平均,组内平均,组间均方差和,组内均方差,单因素试验方差分析表,三、多重比较,方差分析拒绝 ,从而接受 时,认为各水平均值不全相等。多重比较是通过对各均值之间的配对比较来进一步检验到底那些均值之间有显著差异,AnalyzeCompared Means One-Way Anova Dependent List:选入需要分析的变量,可选入多个 结果变量(因变量)。 Factor:选入需要比较的分组因素, 只能选入一个。,基本操作,其他操作,【Post Hoc】多重比较检验 Equal Variances Assumed:当各组方差齐时可用的两两比较方法,共有
4、14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。 Equal Variances Not Assumed:当各组方差不齐时可用的两两比较方法,共有4种,其中以Dunnettss C法较常用。 Significance Level: 定义两两比较时的显著性水平,默认为0.05。,其他操作,【Options】选项 Statistics: 选择一些附加的统计分析项目,有统计描述 (Descriptive)和方差齐性检验(Homogeneity-of- variance)。 Means plot: 用各组均值做图,以直观的了解它们的差异。 Missing Values:分析中对缺失值的处
5、理方法,,其他操作,【Contrast钮】趋势检验和先验对比检验 Polynomial:趋势检验。 Coefficients框 :先验对比检验,这里按照分组变量升序给每组一个系数值,注意最终所有系数值相加应为0。如果不为0仍可检验,只不过结果是错的。,例1:有5种油菜品种,分别在4块试验田上种植,所得亩产量如表3所示(单位:).试问不同油菜品种对平均亩产影响是否显著?,例题分析,操作步骤1)定义两个变量: X1变量,取值1、2、3、4、5分别代表5个品种,标签为“品种”。 x2变量其值为亩产量,标签为“亩产量”。 2)按AnalyzeCompared Means One-Way Anova顺序
6、打开“单因素分析”主对话框。 3)从源变量框中选取x2入Dependent List框中;选取x1变量入Factor框中,单击“OK”运行。 4)输出结果及分析,单因素方差分析结果,说明: 第一列:方差来源;第二列:离差平方和;第三列:自由度; 第四列:均方;第五列:F值;第六列:显著值,是F统计量的P值。,检验两个因素的交互效应,对两个因素的每一 组合至少要做两次试验.,如果已知不存在交互作用,或已知交互作用对 试验的指标影响很小,则可以不考虑交互作用.,对两个因素的每一组合只做一次试验,也可以 对各因素的效应进行分析双因素无重复试验 的方差分析.,二、双因素无重复试验的方差分析,因素B,因
7、素A,假设,例:一火箭用四种燃料,三种推进器作射程试验. 每种燃料与每种推进器的组合各发射火箭两次,得 射程如下(以海里计).,试验指标: 射程,因素: 推进器和燃料,水平: 推进器有3个,燃料有4个,双因素试验,试验目的: 考察推进器和燃料两因素对射程有无显著的影响.,双因素无重复试验方差分析的数学模型,检验假设,记,因素A引起的离差平方和,因素B引起的离差平方和,随机误差平方和,表 双因素无重复试验的方差分析表,【Fixed Factors】 即固定因素,绝大多数要分析的因素都应该往里面选。,基本操作,AnalyzeGeneral Linear Model Univariate,【Depe
8、ndent】 即因变量, 观测值要选在里面,【Random Factors框】用于选入随机因素,【Covariate框】用于选入协方差分析时的协变量,基本操作,【WLS Weight框】 用于选入最小二乘法权重系数。,基本操作,【Model钮】 用于设置在模型中包含哪些主效应和交互因子, Full factorial:即分析所有的主效应和交互作用。 Custom:自定义模型Factors&Covariates:因素变量和协变量变 量名Build Term:该框用于选择进入模型的因 素交互作用级别,即是分析主效应、交 互作用,两 阶交互、三阶交互、还是全部 分析.,基本操作,Sum of squ
9、ares:选择方差分析模型类别,有1型到4型四种, Include intercept in model:用于选择是否在模型中包括截距,不用改动,默认即可。,基本操作,【Contrast钮】 用于对比检验,对各个控制变量不同水平下 的均值是否与某个检验值存在差异进行比较,检验值的指定有 Deviation:观测变量的均值 Simple:第一水平或最后一水平观测变量的均值 Difference:前一水平观测变量的均值 Helmert:后一水平观测变量的均值,基本操作,【Plots】因素变量交互作用图形分析,【Post Hoc】多重比较检验,【Save钮】 将模型拟合时产生的中间结果或参数保存为新
10、变量供继续分析时用,可保存的东西有预测值、残差、异常值诊断。,基本操作,【Options钮】选项 Estimated Marginal Means:估计边际均值Factor(s) and Factor Interactions:主效应与 交互作用的因素Display Means for:均值估计Compare main effects:比较主效应 Display:输出统计量 Significance leval:多重比较的显著性水平,基本操作,结果分析: (1)组间效应假设检验中的p值大于 0.05接受原假设,即各素之间没有 显著差别。 (2) 多重比较检验,从检验的p值来看各因素 两两之间有
11、没有显著的差别。,实例分析,操作步骤1:输入数据 C变量,取值1、2、3分别代表因素A的3个水平 ti变量,取值1、2、3、4分别代表因素B的4个水平 value变量其值为合金钢的强度,2 Analyze=General Lineal model=Univariate 3 Dependent Variable框:选入value 4 Fixed Factors框:选入c和ti 5 Model钮:单击 6 Custom单选钮:选中 7 Model框:选入c和ti,单击OK 8 OK,三、双因素等重复试验的方差分析,假设,记号,双因素试验方差分析的数学模型,检验假设,2. 研究统计特性;,检验步骤,1. 分解平方和;,3. 确定拒绝域.,双因素试验的方差分析表,