收藏 分享(赏)

多因素试验设计与方差分析—沉毅.ppt

上传人:sjmd695 文档编号:5948726 上传时间:2019-03-21 格式:PPT 页数:63 大小:448KB
下载 相关 举报
多因素试验设计与方差分析—沉毅.ppt_第1页
第1页 / 共63页
多因素试验设计与方差分析—沉毅.ppt_第2页
第2页 / 共63页
多因素试验设计与方差分析—沉毅.ppt_第3页
第3页 / 共63页
多因素试验设计与方差分析—沉毅.ppt_第4页
第4页 / 共63页
多因素试验设计与方差分析—沉毅.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

1、多因素试验设计与方差分析,浙江大学医学院公共卫生系 流行病与卫生统计教研室 沈 毅,实验三要素:,统计模型:,效应值=总平均效应+处理效应+随机误差效应,效应值-总平均效应=处理效应+随机误差效应,不同药物作用后小白鼠肉瘤的瘤重(g),一个简单的例子:,总平均值,效应值=总平均效应+处理效应+随机误差效应,效应值-总平均效应=处理效应+随机误差效应,方差分析的基本思想 方差分析(analysis of variance ANOVA)在一个分类变量(自变量) 不同水平下或是在多个分类变量的水平组合下测量一个连续反应变量 (应变量),将这个反应变量的总效应分解为由分类变量引起的效应 (即主效应,如

2、A,B分别表示由于分类变量A和B的不同水平引起的 变异)或分类变量的组合产生的效应(即交互效应,如A*B表示A和B 的交互作用,或嵌套效应;如B(A)表示B的效应嵌套在A之下), 和随机误差效应;同时将总自由度分解为对应的各部分自由度之和。 方差分析的统计量为F值,F值服从自由度1=k-1,2=N-k的F分布,在 一定的显著水平下,如果F大于F临界值,说明该分类变量有统计学意 义,即由处理引起的效应不为零,这就是方差分析的基本思想。,其中为总体均数;表示因素Ai各水平对试验结果的影响大小, 即因素Ai的效应,ik 为随机误差效应,,基本模型:,方差分析中离均差平方和的分解:总变异=处理间变异+

3、误差,析因设计试验的方差分析 正交设计试验的方差分析 裂区试验设计的方差分析 系统分组(嵌套)设计的方差分析,第一节 析因试验设计的方差分析,一、析因试验设计的意义和方差分析模型1、析因试验的意义凡同时具有两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorial design)实验。析因试验设计不仅可以分析作每个因素的主效应,而且可分析因素间的交互效应,还可以从各因素各水平的全面组合中挑选出最优试验条件或最优试验条件的方向,能够提供较多的信息,缩小随机误差。,2、方差分析模型析因设计实验的方差分析可以同时分析这些处理因素的主效应,以及因素间的交互效应(i

4、nteraction)。以两因素析因试验设计为例,其数学模型为:,所谓固定效应模型是指实验者设计时特别选定因素A的a个水平与因素B的b个水平。试验结果的推论只适用于因素A与B实际所用的水平。随机效应模型是指所有因素A的诸水平与因素B的诸水平是从更大总体中随机选取的,试验结果的推论对于被研究总体的所有水平都有效。混合模型是指一个为固定因素,另一个为随机因素,实验结果分别按固定因素、随机因素推论。在实际工作中,由于固定效应模型是最为多见的,下节中只给出固定效应模型实例的SAS程序。,二、析因试验设计方差分析的SAS程序,程序7-1 DATA EX7_1; DO A=0 TO 1; DO B=0 T

5、O 1; DO I1 TO 3; INPUT X; OUTPUT; END; END; END; CARDS; 0.8 0.9 0.7 0.9 1.1 1.0 1.3 1.2 1.1 2.1 2.2 2.0 ;,PROC ANOVA; CLASS A B; MODEL XA B A* B; MEANS A B A*B; RUN;QUIT;,三、程序说明和结果解释,在数据步中,用三重循环语句建立数据集,第1、2个循环语句为读入A、B两因素的分类值,第3个循环语句是控制在各水平组合下的重复数(即每种组合下的样本例数),在过程步中,用ANOVA过程作两因素的方差分析,CLASS语句指明A、B为分类变

6、量,MODEL语句指明X为因变量,因素a、b及其一级交互作用a*b为自变量,在 SAS中产生交互作用的因素之间以“*”号连接,MEANS语句用于求均数及标准差,以便根据均数大小,寻找最佳试验条件。(如为含区组因素的析因设计,只需在model语句的等号右侧加上表示区组因素的变量名即可)。 输出结果如下:,此22的析因试验设计的SAS程序可推广到多因素、多水平的析因试验设计,例如某析因设计中涉及三因素A、B、C,并要判断其两两交互作用是否有意义,只需将MODEL语句改为 MODEL XA B C A*B A*C B*C;即可。两因素间的交互作用(如A*B,A*C,B*C)为一级交互作用,三因素及以

7、上因素间交互作用为二级或高级交互作用;由于因素间二级以上的交互作用有时在专业意义上难以解释,所以,实际分析中,一般仅考虑一级交互作用。,第二节 正交试验设计资料的方差分析,一、正交试验设计的基本概念正交试验设计(orthogonal experimental design)是利用“正交表”科学地安排多因素试验的一种方法。正交设计所安排的试验代表性极强,因而,不仅试验次数少,而且便于分析推断出最佳试验方案,在作正交设计时,要根据具体情况选择合适的正交表。正交表是一种特殊的表格,正交表的一般表示方法为Ln(pr),这里L表示正交表;下标n表示正交表的行数,也是试验次数;r表示正交表的列数,p表示各

8、因素的水平数。,正交表的构造有如下特点: (1)表中任一列,不同数字出现的次数相同,而这些数字代表了因素取的水平,这就是说任何一列所包含的各种水平数相同。如表L8(27)中不同数字“1”、“2”在每一列中出现的次数都是4;表L9(34)中的数字“1”、“2”、“3”在每一列中出现的次数都是3次,这一性质表明了正交表的均衡性。 (2)表中任何两列同一行的两个数字组成的所有可能数对,其出现的次数相同。如表L8(27)的任两列中,同一行的所有可能的数对有(1,1)、(1,2)、(2,1)、(2,2),它们各出现2次。这一性质表明了正交表的正交性,正因为正交表具有以上两种性质,所以,安排的试验具有均匀

9、分散、整齐可比的特点。,由于这种均衡设计的特点,使得它只须使用较少的、有代表性的处理组合数就可达到试验目的,从而节省了总的试验次数。对于每种组合条件下无重复试验的正交设计,在选取正交表时至少要空出一列以估计误差。一般正交试验时,正交表的选用与表头设计详见有关参考书籍,这里不赘述。正交试验设计方差分析与析因设计的方差分析相同,可参看表7-1。在多数情况下,正交设计是按固定效应模型来计算F值的。,二、无重复正交试验设计资料的方差分析,例7-2研究四种因素对钉螺产卵数(Y)的影响,每一因素分为两水平:温度A(A15,A210),含氧量B(B10.5,B25.0),含水量 C(C110,C230),p

10、H值D(D16.0,D28.0)。采用L8(27)正交表,数据如下(见表7-3):,1、SAS程序如下: 程序7-2 DATA EX7_2; INPUT A B C D Y; CARDS; 1 1 1 1 86 1 1 2 2 95 1 2 1 2 91 1 2 2 1 94 2 1 1 2 91 2 1 2 1 96 2 2 1 1 83 2 2 2 2 88 ; PROC ANOVA; CLASS A B C D; MODEL YA B C D A*B; MEANS A B C D A*B; RUN; QUIT;,三、有重复试验正交设计资料的方差分析,例7-3四种药物,每种药物有三水平:A

11、药(A12,A24,A35),B药(B10,B2l,B32),C药(C10,C2l,C33)及 D药(Dl0,D2l,D33)。问四种药物对淡色库蚊的50击倒时间有无差别?采用正交表L9(34),相同试验条件下均做4次重复。,1、 SAS程序程序7-3 DATA EX7_3;INPUT A B C D;DO I1 TO 4;INPUT Y; OUTPUT;END;CARDS;1 1 1 1 9.41 7.19 10.73 3.731 2 2 2 11.91 11.85 11.00 11.721 3 3 3 10.67 10.70 10.91 10.182 1 2 3 3.87 3.18 3.8

12、0 4.852 2 3 1 4.20 5.72 4.58 3.712 3 1 2 4.29 3.89 3.88 4.713 1 3 2 7.62 7.01 6.83 7.413 2 1 3 7.79 7.38 7.56 6.283 3 2 1 8.09 8.17 8.14 7.49;PROC ANOVA;CLASS A B C D;MODEL YA B C D;MEANS A B C D;RUN;QUIT;,2、程序说明与结果解释,以上结果表明,A、B、C三种药物的各水平组均数间的差别有统计学意义。平均灭蚊时间越短,则效果越好。根据MEANS语句的输出结果可知,A药第二水平(4)时,效果最佳。

13、,四、水平数不等的正交试验设计资料的方差分析,例7-4在啤酒生产中,要大麦不发芽,又要麦粒体内产生淀粉酶、蛋白酶。所以生产过程与加入能促进酶形成的赤霉素(G)有关,与能抑制大麦发芽的氨水浓度(N)和吸氨量(C)有关,与事先将大麦浸湿含水程度(W)有关。四个因素中,G、N、C都是四个水平,W是两个水平。根据因素及水平数可选用L16(4326)正交表作试验。排列及数据如表7-5所示:,1、 程序7-4 DATA EX7_4; INPUT G N C W X; CARDS; 1 1 1 1 11 1 2 2 2 11 1 3 3 2 11 1 4 4 1 16 2 1 2 1 9 2 2 1 2 1

14、6 2 3 4 2 16 2 4 3 1 21 3 1 3 2 11 3 2 4 1 12 3 3 1 1 10 3 4 2 2 12 4 1 4 2 16 4 2 3 1 13 4 3 2 1 20 4 4 1 2 18 ; PROC ANOVA; CLASS G N C W; MODEL X=G N C W; MEANS G N C W; RUN; QUIT;,第三节 裂区试验设计资料的方差分析,一、裂区试验设计的意义和方差分析模型1、裂区试验的意义裂区设计(split-plot design)也是一种两因素设计。这种设计最早应用于农业。在某些田间试验中,首先将选择好的田块分为几个大区。然

15、后再将每一大区分为若干个小区。在大区水平上施加处理因素A,在小区水平上施加处理因素B。假如A有 2个水平:a1、a2,B有3个水平:bl、b2、b3,就可将试验田块分为 2个大区,分别配置 a1、a2。将每个大区划分为三个小区,配置bl、b2、b3。这种设计框架如下:,从变异的角度分析,在这种设计中,因素B的变异性要小于因素A的变异性,因为因素A只是在大区上实施的,没有重复。故在配置因素时,应将主要因素作为B,配置在小区水平上,而重要性相对小一点的因素作为A,配置在大区水平上。,2、方差分析模型 裂区设计方差分析的数学模型为,二、裂区试验方差分析的SAS程序,例7-6 将10只家兔随机等分两组

16、,一组注射抗毒素,一组注射生理盐水作为对照。分组后,每只家兔取甲、乙两部位,分别注射低浓度毒素和高浓度毒素,观察指标为皮肤受损范围直径,结果如表7-7所示。试分析试验结果。 本题与嵌套设计类似,但B的各水平不随A水平的变化而变化,故为裂区设计,根据一级实验单位按照完全随机的方法分组,可判断为完全随机设计的裂区试验。,SAS程序为 程序7-5 DATA EX7_5; DO A=1 TO 2; DO I=1 TO 5; DO B=1 TO 2; INPUT X; OUTPUT; END; END; END; CARDS; 15.75 19.00 15.50 20.75 15.50 18.50 17

17、.00 20.50 16.50 20.00 18.25 22.25,18.50 21.50 19.75 23.50 21.50 24.75 20.75 23.75 ; PROC ANOVA; CLASS A B I; MODEL X= A A*I B A*B; TEST H=A E=A*I;RUN; QUIT;,三、程序说明和结果解释,在DATA步中用三重循环语句和INPUT语句来建立SAS数据集,第1、3循环语句分别读入A因素和B因素的分类值,第2个循环语句控制重复次数。在ANOVA过程步中,CLASS语句指明A、B和I为分类变量,MODEL语句指明了此模型包含了A主效应、A*I交互效应、B

18、主效应及A*B交互效应,TEST语句指明对A主效应检验时以A*I作为误差项(见表7-6一级单位F值的分母)。,第四节 系统分组(嵌套)设计资料的方差分析,一、系统分组(嵌套)设计资料的方差分析模型1、系统分组设计的意义系统分组设计又称嵌套设计(nested design),与析因设计不同的是,嵌套设计的处理不是按各因素各水平的全面组合,而是各因素按其隶属关系系统分组,各因素与各水平不形成交叉分组,分组时先按A的p个水平分成p组,然后不同的组再按B的水平来分组,一般不同的组的水平也不同,按A,B的水平分组后,再安排因素C,依此类推。,在析因试验设计中,各因素是基本平等的,而在系统分组设计中各因素

19、是不平等的。在作方差分析时,侧重于上一级分组因素,这体现在各因素的离均差平方和的计算上。以三因素系统分组设计为例,设A,B,C各因素的水平数依次为p,q,s,全部数据的平方和为甲,校正数为C,整个试验重复次数为r。令Qi(iA,B,C)为系统分组到第i级因素时所产生的一个量,它是各小组数据之和的平方之均数,而此时的全部小组数等于n1ni,例如分组到B因素时,共有pq个小组,即把B因素的q个水平分别嵌套在A因素p个水平之下,相当于B因素有pq个水平,但它们所产生的离均差平方和又包括了A因素的作用,待A因素的作用从其中离析出来后,便得到B因素所产生的变异,则三因素系统分组设计的方差分析见表7-8。

20、 上表中给出了两种模型下的F值的计算,系统分组设计中,随机效应的因素是比较多的,有的书中笼统地都按随机模型分析。,二、系统分组设计方差分析的SAS程序,例7-6为了试验某种抗菌药,对小白鼠进行试验。对一批小白鼠没有注射抗菌药(A1),另一批注射了抗菌药(A2),然后让它们被这种细菌感染,看成活率有无明显的不同。统计成活率时按小鼠性别分别统计。然后让活的小白鼠分别在A1和A2内部交配得第一代B1、第二代B2和第三代B3,按性别统计成活率()。得到试验结果如下(见表7-9):,程序7-6 DATA EX7_6; DO A=1 TO 2; DO B=1 TO 3; DO C=1 TO 2; DO I

21、1 TO 2; INPUT P; Y=ARSIN(SQRT(P/100); OUTPUT; END; END; END; END; CARDS; 28 19 33 27 15 11 26 22 26 20 18 11 56 51 62 60 48 44 66 61 70 65 49 55 ;,PROC GLM; CLASS A B C; MODEL YA B(A) C(A B)/SS1; TEST H=A E=B(A); TEST H=B(A) E=C(A B); RUN; QUIT; PROC NESTED; CLASS A B C; VAR Y; RUN; QUIT;,本例中A是固定效应,

22、B和C是随机效应的混合效应模型,,F值的计算同随机效应模型。SAS程序为,三、程序说明和结果解释,在DATA步中用四重循环语句建立SAS数据集,DATA步中赋值语句Y=ARSIN(SQRT(P/100),是对存活率作数据转换,因为一般认为率分布近似服从二项分布,故对存活率作平方根反正弦变换以满足方差分析的条件。GLM过程中MODEL语句Y=A B(A) C(A B)指明了B因素隶属于A,C因素隶属于A、B,对于系统分组,GLM过程中MODEL语句后只能选用SS1(计算结果与因素在该语句中顺序有关),不能选用SS3,两个TEST语句指明了A因素效应检验以B因素作为误差项,B因素效应检验以C因素作

23、为误差项。,NESTED过程是SAS提供的专门用于系统分组设计的方差分析,与上述的GLM过程完全等价,且程序的书写和结果的输出都比GLM过程简单。但NESTED过程仅适用于对因素已按主次排列(即其数据集必须是事先定义这些效应的分类变量或CLASS变量排序)的平衡资料的方差分析。对于不平衡资料,只能用GLM过程。输出结果如下:(GLM过程的输出结果),上述结果表明因素A不同水平的差异有统计学意义,即注射抗菌药后成活率显著地提高了。因素C不同水平的差异也有统计学意义,即公的和母的对这种细菌的抵抗能力有显著的差异。因素B的不同水平间差异无统计学意义,说明这种细菌的感染以及抗菌药的效力均没有遗传性。,

24、练习题,1、研究高锰酸盐处理后对甘蓝叶核黄素浓度测量结果的影响,试验分三天进行,每天安排一次22的析因处理,A因素为试样处理方式,B因素为试样重量,结果见下表。试进行方差分析。,2、用有机溶液提取某中药的有效成分,欲寻找浸出率的影响因素和适宜水平。选取因素及水平如下:因素A 溶液浓度:A170,A280;因素B 催化剂的量:B10.1,B20.2;因素C 溶剂的pH:C16.8,C27.2;因素D 温度:D180,D290。采用L8(27)正交表,考虑A与B的交互作用,试验结果如下:试分析四种因素对浸出率影响。,3、在一项培养基-接种试验中,研究者用两种培养基;三种接种方式观察细菌的干重产量。先将24个试验样品分成四个区组,并将每个区组中的样品随机分配到两种培养基(一级处理单位),再将每种培养基中的3个样品随机分配给三种接种方式(二级处理单位)。实验结果见表7-11,试对实验结果进行分析。,4、试验甲、乙、丙三种催化剂在不同温度下对某化合物的转化作用。由于各催化剂所要求的温度范围不同,将催化剂作为一级实验因素(I=3),温度作为二级实验因素(J=3),采用嵌套设计,每个处理重复2次(n=2),试验结果见表11-25,试做方差分析。,返回,返回,返回,表7-6 完全随机设计裂区试验的方差分析表,返回,返回,返回,返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 教育学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报