1、单因素实验,一、方差分析引例 二、方差分析的基本概念 三、方差分析基本原理 四、方差分析的几点说明,一、方差分析引例,产品开发工程师考虑能使一种新的合成纤维的抗拉强度增加的方案,这种纤维织出的布是用来缝制男士衬衫的,从以前的经验得知,抗拉强度受到棉花在纤维中所占的百分率的影响,开始,他预测增加棉花含量会增大强度,他还知道,如果成品布须具有他所希望的质量特性的话,棉花含量应该在10%到40%之间,工程师决定检验棉花百分率为五个水平的样本,水平是15%,20%,25%,30%,35%。同时,还,对每个棉花含量水平进行五次试验,于是得到了抗拉强度观测值表。我们知道该实验是单因素五个水平重复五次的实验
2、。从表中以及散点图中,得知, 第一:棉花含量影响抗拉强度 第二:含30%左右的棉花强度能使成品布的抗拉强度达到最大值 可是我们想要检验的是5个水平的棉花百分率的平均强度之间的差别,会检验五个均值都相,等的等式,使用t检验,这样就会有10对可能的配对,假设接受原假设的概率是1-a=0.95,各假设之间是独立的,则接受10个原假设的概率就是,,这会引起犯第一类错误的概,率增加。 于是提出了方差分析的方法。,二、方差分析的基本概念,(一)方差分析的定义 就是比较不同实验条件下样本均值间的差异。例如研究几种药物对某一种疾病的疗效,不同饲料对牲畜体重增长的效果等等。就是利用试验观测值总偏差的可分解性,将
3、不同条件所引起的偏差与试验误差分解开来,按照一定的规则进行比较,以确定条件偏差的影响程度及其相对大小。,(二)方差分析中的术语 因素与处理 水平与水平数 重复与重复数 因素的主效应和因素间的交互效应 条件误差与实验误差,(三)方差分析的分类 纯方差分析和协方差分析 单因素方差分析、双因素方差分析以及多因素方差分析 全面试验、非全面试验和系统分组试验 固定效应模型、随机效应模型和混合效应模型,把试验中由于因素水平的选取方法的不同带来差异的实验区分为不同的效应模型。 当实验中所有被考察因素的考察水平是明确地选定的,即其效应都是固定的,该模型的方差分析得出的推断仅适用于因素实际的水平。 当实验中所有
4、被考察因素的考察水平是随机地选取的,及其效应都是随机的,该方差分析的推断适用于所研究因素的全部水平。,当实验中被考察的因素多于两个,它的部分效应是固定的,另外部分又是随机的,即混合效应模型,三、方差分析的基本原理,为了简单说明问题,只分析固定效应模型 用 代表第i中处理下所得到的第j个观察值, 用线性统计模型 表示 其中i=1,2a,j=1,2n表示所有处理的共同参数,叫总均值; 第i种处理的唯一的一个参数,叫处理效应,也定义为总均值的偏差 ; 是随机误差,我们的目标是要检验各处理或水平对实验有无影响并去估计它们的影响程度。 提出原假设,备择假设,在提出原假设时,有,第i个处理的均值,(i=1
5、,2a),于是可以得到:,另外一个等价的假设,这样检验处理均值的等式等价于检验处理效应,是否为0,就是用方差分析,方差分析来源于把总变异性分解为它的分量,总平方和,可以等于,其中,表示第i个处理的观察值的总和,表示第i个处理的观察值的平均值,表示全部观察值的总和,表示全部观察值的总平均值 即,i=1,2,.a N=an 于是,度量的是处理均值之间,度量的是处理内部观测值与处理均值之间也就是随机误差,处理平方和的自由度是a-1,误差平方和的自由度的N-a,而总平方和的自由度是N-1,由无偏性可以证明出 处理均值之间没有差别时,处理的均方误差和随机误差的均方误差都可以用来估计总体方差。于是检验处理
6、均值之间是否有差异可以用比较,来实现。,所以构造一个含有两个均方误差的一个统计量来检验处理均值之间的差异。,有,服从 自由度为a-1与N-a的F分布,就否定原假设,所以方差分析是一种检验同方差的若干个正态总体的均值是否相等的统计分析方法。 单因素方差分析的一般步骤:第一:提出原假设和备择假设第二:计算各个平方和和各自的自由度,算出 F统计量的值 第三:查临界值第四:判断第五:列方差分析表,变差来源,平方和,自由度,均方,处理之间,a-1,误差,N-a,总和,N-1,单因素试验的随机效应模型的a个水平是在总体 随机选取的,平方和的分解式还是一致的,检验 关于各处理水平效应的差异的假设是没有意义的
7、 所以,检验,如果原假设成立,则处理是一样的,如果不成立,则处理之间存在差异,还是检验F统计量,四:方差分析的几点说明,(一)方差分析的基本假设条件 (二)方差分析与方差检验 (三)方差分析的线性变换 (四)多重比较 (五)样本量的原则 (六)方差分析的回归分析方法 (七)方差分析的非参数方法 (八)重复度量,(一)方差分析的基本假设条件 第一:正态性 模型中的误差满足均值为0,方差为 的正态分布,而检验正态性假设有残差直方图法和正态概率图法。 第二:方差齐性,检验方差齐性的方法有: 巴特莱法 极差比值法 平均极值法 (二)方差分析与方差检验 方差分析是各正态总体均值齐性的一种统计检验 方法,
8、而方差检验是各总体方差齐性的各种统计 检验方法的总称,,(三)方差分析的线性变换 由于受到观测值的计量单位的不同和观测值数目 多少的影响,在进行方差分析时可能造成计算工 作量的大幅增加,为了便于统计量F值的计算, 可以对原数据进行适当地线性变换,也就是,可以证明线性变换不会改变统计量F,对于多因素场合、系统分组场合,甚至对于重复 数不等试验场合,检验统计量都不会因线性变换 而改变。 (四)多重比较 也就是判断哪些水平之间有显著差别,哪些水平 之间没有显著差别,进一步比较同一因素下各水 平之间的显著性方法,第一:多重比较Scheffe法 设被考察因素的水平个数为a,而被考察因 素的第i水平下的重
9、复数为 ,被检验的统 计量为d.统计量d是一个形如 的关 于处理均值的线性组合式,其中 满足 ,称线性组合式 为一个对照,检验统计量 式中的 分别为误差均方及其自由度 当 时,否定对照 =0的原假设。为了说明 这一问题,举个例子 在开始的引例中,假设感兴趣的对照是 和 。对照的检验 统计值是 和 ,由 于,所以 , 结论 是 等于0,所以可以说没有强有力的证据说处理均值1和3作为一组和以 处理均值4和5为一组之间有差异,同样的道理可 以说处理1和4的平均抗拉强度之间有显著性差异。 第二:最小显著性差异法(LSD) 检验,可以用t统计量 有 称为最小显著性差异当,就可以判断总体均值,在显著水平a
10、下有差异的,第三:多重极差检验法 比较全体均值差异的一个被广泛使用的方 法是Duncan在1955年研究的多重极差检验 法。首先将被考察因素的a个处理均值按 递增顺序排列,计算每一个均值的标准误 差 ,其次计算最小显著性极差,是,可以由Duncan的显著性极差表可得,再次,比较判断,将最大的平均值与最小的平均值的差与最小显著性极差DR进行比较。,第四:多重比较Tukey法,(五)样本量的选择 在任何一试验设计中,一个重大的决策就是样本 量的选择,也就是试验的重复次数。 特性曲线是一特定样本量的统计检验犯第二类错 误的概率对某一个参数的曲线图,该参数反映的 是原假设不成立的程度。,图v画出了第二
11、类错误概率对参数 其中,的图形。,举例说明,(六)方差分析的回归处理方法 事实上,任一方差分析模型都可以用回归方程表 示,为了说明这种关系,假设有一个a=3的单因 素方差分析模型。 word,(七)方差分析的非参数方法 当正态性假定不能认为是合理的情况下,实验者 希望有不依赖于正态性假定的检验法来代替方差 分析的F检验法,运用Kruskal-Wallis检验法可以 解决这一问题,首先将观察值 按升序排列,然 后将每一观察值用它的秩(名次) 来代替, 最小的观察值的秩是1,如果有相同的观察值用 平均秩表示。,令 表示第i种处理的秩和,检验统计量,以及,如果,用观察值的秩替换观察值的方法叫做秩变换,(八)重复度量 在社会科学和行为科学的试验中,实验的单位经 常是人,因为经验、受教育、或背景的差异,不 同的人对同一处理的响应是不同的。利用设计来 控制人与人之间的这种变异性是很有可能的,这 种设计对于每一个人用a种处理的每一种,这类 设计叫做重复度量设计。,处理,对 象,处理总和,1,2,.,n,1,2,.,a,对象总和,.,.,.,.,.,单因素设计的方差分析等价于随机化完全区组设 计的分析,