1、第六章 单因素方差分析,陈细香 2007-12-10,2,教学要求,了解方差分析的意义掌握方差分析的方法,3,教学内容,第一节 方差分析的基本原理第二节 单因素方差分析第三节 多重比较第四节 方差分析应具备的条件,4,教学内容,第一节 方差分析的基本原理一、方差分析的概念二、方差分析的意义三、方差分析的基本原理,5,方差分析的概念,方差分析( Analysis Of Variance, ANOVA)又称变量分析或F检验,比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体的检验方法。方差分析是由英国著名统计学家R.A.Fisher于1923年提出的。,方差分析的基本原理
2、,6,方差分析的最终统计推断和假设检验均依靠F分布,所以适当了解一下F分布的特点十分有益。,F分布,F分布是英国统计学家Fisher和Snedecor提出的。 为了表示对Fisher的尊重, Snedecor将其命名为F分布。 方差分析也主要是由Fisher推导出来的,也叫F检验。,7,优:可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。缺:只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。,方差分析优缺点,方差分析的基本原理,8,方差分析的意义,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。,方差分析的基本原理,
3、9,方差分析中的术语,因素水平主效应交互效应,处理固定因素随机因素误差,方差分析的基本原理,10,方差分析中的术语,因素:可能影响试验结果,且在试验中被考查的原因或原因组合。有时也可称为因子。例如温度、湿度、药物种类等。水平:因素在试验或观测中所处的状态。例如温度的不同值,药物的不同浓度等。,方差分析的基本原理,11,方差分析中的术语,主效应:反映一个因素各水平的平均数之差异的一种度量。一个因子第i水平上所有数据的平均与全部数据的平均之差,称为该因子第i水平的主效应。交互效应:由两个或更多因素之间水平搭配而产生的差异的一种度量。,方差分析的基本原理,12,方差分析中的术语,处理:实验中实施的因
4、子水平的一个组合。固定因素:该因素的水平可准确控制,且水平固定后,其效应也固定。例如温度,化学药物的浓度,动植物的品系,等等。随机因素:该因素的水平不能严格控制,或虽水平能控制,但其效应仍为随机变量。例如动物的窝别(遗传因素的组合),农家肥的效果等等。,方差分析的基本原理,13,方差分析中的术语,误差:除了实验中所考虑的因素之外,其他原因所引起的实验结果的变化。它可分为系统误差和随机误差:,方差分析的基本原理,系统误差:误差的组成部分,在对同一被测量的多次测试中,它保持不变或按某种规律变化。它的原因可为已知,也可为未知,但均应尽量消除。,随机误差:误差的组成部分,在对同一被测量的多次测试中,它
5、受偶然因素的影响而以不可预知的方式变化。它无法消除或修正。,14,计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。,方差分析的基本原理,方差分析的基本原理,15,教学内容,第二节 单因素方差分析一、不同处理效应与不同模型二、平方和及自由度的分解三、简化计算四、单因素方差分析的步骤五、单因素方差分析的应用实例,单因素方差分析,xij,表6-1 每组具n个观测值的a组样本符号表,17,不同处理效应与不同模型,单因素方差分析,18,平方和及自由度的分解,方差分析的基本思想,就是将总变差分解为各构
6、成部分之和,然后对它们作统计检验。,单因素方差分析,平方和及自由度的分解,方差与标准差都可以用来度量样本的变异程度。在方差分析中是用样本方差即均方(mean squares)来度量资料的变异程度的。表6-1中全部观察值的总变异可以用总均方来度量,处理间变异和处理内变异分别用处理间均方和处理内均方来度量。,平方和及自由度的分解,将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。这种分解是通过将总均方式中的分子 称为总离均差平方和,简称为总平方和,分解成处理间平方和与处理内平方和两部分;将总均方式中的分母称为总自由度,分解成处理间自由度与处理内自由度两部分来实现的。
7、, 总平方和的分解 在表6-1中,反映全部观察值总变异的总平方和是各观察值与总平均数的离均差平方和,记为SST。即,22,平方和及自由度的分解,单因素方差分析,23,平方和及自由度的分解,单因素方差分析,由于,24,平方和及自由度的分解,单因素方差分析,其中称为处理间平方和,记为SSA,即而称为处理内平方和或误差平方和,记为SSe,即,26,平方和及自由度的分解,单因素方差分析,用符号表示,上式可写成:SST = SSA + SSe 其中符号的意义为:SST:总平方和;SSA:处理间平方和;SSe:误差平方和,或处理内平方和。,(二)总自由度的分解,在计算总平方和时,资料中的各个观察值要受 这
8、一条件约束,总自由度等于资料中观察值的总个数减一,即an-1。 总自由度记为dfT,则 dfT =an-1 。 在计算处理间平方和时,各处理均数要受 这一条件的约束,故处理间自由度为处理数减一,即a-1。 处理间自由度记为dfA ,则dfA=a-1。,在计算处理内平方和时,要受a个条件的约束,即 ,i=1,2,.a。故处理内自由度为资料中观察值的总个数减a,即an-a。 处理内自由度记为dfe,则dfe=an-a=a(n-1)。 因为 an-1=(a-1)+(an-a)=(a-1)+a(n-1) 所以 dfT= dfA+ dfe综合以上各式得:,29,平方和及自由度的分解,它们的自由度分别为a
9、n1, a1和a(n1),即自由度也作了相应分解:an 1 = a 1 + a(n 1),单因素方差分析,dfT,dfA,dfe,30,平方和及自由度的分解,令 称为误差均方 称为处理间均方,单因素方差分析,31,简化计算,单因素方差分析,32,简化计算,单因素方差分析,其中 通常称为校正项(correction),用C表示,33,单因素方差分析的步骤,单因素方差分析,34,建立原假设“H0:各组平均数相等”构造统计量“F组间均方组内均方” 在计算组间均方时,使用自由度为(a-1),计算组内均方时,使用自由度为a(n-1)。F满足第一自由度为(a-1),第二自由度为a(n-1)的F分布。查表。
10、推断:若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。结论。,单因素方差分析,35,单因素方差分析的应用实例,单因素方差分析,36,例6.1p104例8.1,单因素方差分析,单因素方差分析,表6-2 5个小麦品系株高(cm)调查结果,单因素方差分析,39,计算SST、SSA 、 SSe,单因素方差分析,40,单因素方差分析,41,单因素方差分析,42,单因素方差分析,43,将以上结果列成方差分析表,单因素方差分析,44,作业10/12,p1178.2,45,第六章 单因素方差分析,陈细香 2007-12-17,46,Spss操作,株高,47,48,49,Excel操作,株高,5
11、0,51,52,53,54,55,Excel操作,将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。右表列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。现需要在显著性水平a=0.05下检验这些百分比的均值有无显著的差异。设各总体服从正态分布,且方差相同。,56,57,58,59,教学要求,了解方差分析的意义掌握方差分析的方法,60,教学内容,第一节 方差分析的基本原理第二节 单因素方差分析第三节 多重比较第四节 方差分析应具备的条件,61,第三节 多重比较,拒绝H0时,并不意味着所有处理间均存在差异。为弄清哪些处理间有差异,需对所有水平作一对一的比较,
12、即多重比较。常用的多重比较方法有以下几种:,62,方差分析的基本原理,63,多重比较一、LSD法二、Duncan检验,多重比较,64,LSD法,最小显著差数(LSD)法:实际就是用t检验对所有平均数作一对一对的检验。一般情况下各水平重复数n相等,用MSe作为2的估计量,可得:,多重比较,65,LSD法,多重比较,66,LSD法,统计量为:,多重比较,67,LSD法,因此当 时,差异显著。t分位数的自由度df = a(n-1)。,多重比较,68,LSD法,多重比较,即为最小显著差数,记为LSD。,69,LSD法,所有比较仅需计算一个LSD,应用很方便。但由于又回到了多次重复使用t检验的方法,会大
13、大增加犯第一类错误的概率。为了克服这一缺点,人们提出了多重范围检验的思想:即把平均数按大小排列后,对离得远的平均数采用较大的临界值R。这一类的方法主要有Duncan法和Newman-Keul法。后者又称为q法。现介绍如下:,多重比较,70,Duncan检验,1把需比较的a个平均数从大到小排好: 2求出各对差值,并列成表:3求临界值:4对差值表采用适当的R进行比较。,多重比较,表 a个均值间的差值表,72,多重比较临界值表,多重比较,73,Duncan检验,差值表中每条对角线上的k值是相同的,可使用同一个临界值R。差值大于R0.05,标以“*”; 大于 R0.01则标“*”。,多重比较,74,例
14、6.2p104例8.1,单因素方差分析,75,方差分析表,单因素方差分析,76,Duncan检验,多重比较,77,表 5个均值间的差值表,多重比较,多重比较临界值表,多重比较,查表,查表,79,表 5个均值间的差值表,多重比较,*,*,*,*,*,*,*,*,*,80,81,85,86,例6.3单因素方差分析,下表为某职业病防治院对 31名石棉矿工中的石棉肺患者、可疑患者和非患者进行了肺活量(L)测定的数据,问三组石棉矿工的肺活量有无差别?,肺活量,87,88,89,90,91,92,上述基本结果表明:F=84.544, P=0.0000.001, 说明三组矿工的用力肺活量有极其显著的差异。,93,94,95,96,97,98,多重比较结果表明:各组之间(1与2,1与3,2与3组之间)均存在极其显著的差异(P=0.0000.001)。,99,教学内容,第四节 方差分析应具备的条件一、方差分析应满足三个条件二、多个方差齐性检验,方差分析应具备的条件,100,方差分析应满足三个条件,可加性正态性方差齐性,方差分析应具备的条件,101,多个方差齐性检验,方差齐性。即要求所有处理随机误差的方差都要相等,换句话说不同处理不能影响随机误差的方差。巴勒特(Bartlett)检验,方差分析应具备的条件,102,作业17/12,p1178.3,OK!,