1、巢式嵌套设计的方差分析嵌套设计被称为巢式设计(nested design)或系统分组(hierarchal classification)的资料,有些教科书上称这类资料为组内又分亚组的分类资料。根据因素数的不同,套设计可分为二因素(二级) 、三因素(三级)等套设计。将全部 k 个因素按主次排列,依次称为 1 级,2 级 k 级因素,再将总离差平和及自由度进行分解,其基本思想与一般方差分析相同。所不同的是分解法有明显的区别,它侧重于主要因素,并且,第 i 级因素的显著与否,是分别用第 i 级与第 i+1 级因素的均方为分子和分母来构造F 统计量,并以 F 测验为其理论根据的。嵌套试验设计应用:(
2、1)情形一受试对象本身具有按其隶属关系进行分组再分组的各种因素。比如:选取某种植物 3 个品种(A ) ,在每一株内选取两片叶子(B) (嵌套在植株因素下的第二个因素) ,用取样器从每一片叶子上选取同样面积的两个样本(两次重复) ,称取湿重。不是把 B 因素的 2 个水平简单地看作是与 A 因素 3 个水平的全面组合,而是分别嵌套在A1、A2、A3 三个水平之下,相当于 B 因素有 6 个水平,但它们所产生的离差平和中又包含了A 因素的作用,一般来说, 它大于模型所提供的总误差,用它作为度量 A 因素作用大小的误差项,是严格考核 A 因素的一种措施。方差分析表:变异来源 自由度 平方和 均方
3、F 值 ProbFA df1=a-1 SS1=Q1-C MS1= SS1/df1 MS1/ MS2B(A) df2=a(b-1) SS2=Q2-Q1 MS2= SS2/df2 MS2/ MSeE dfe= (n-1)ab SSe=W-Q2 MSe= SSe/dfe总和 nab-1 SSt=W-C注:A 因素有 a 个水平,B 因素有 b 个水平,重复 n 次,总样本含量为 nab,全部数据之总和为 T,全部数据之平方和为 W,校正数为 C,Qi 为系统分组分到第 i 级因素时,各小组数据之和的平方均值的和。W= C= Q1= Q2=2ijkxnabT2nb12.in12.ijT(2)情形二受试
4、对象本身并非具有分组再分组的各种分组因素,而是各之间在专业上有主次之分。区分嵌套设计与析因设计的关键是看因素之间的地位是否平等,因素的地位平等则属于析因设计,不平等则属于嵌套设计。比如:为了研究某种抗菌药的效果,对小白鼠进行试验。考虑 3 个试验因素, 因素 A(用此抗菌药与否)可分为 A1(对照组不用抗菌药 )、A2(试验组用抗菌药 );因素 B(小白鼠代次)可分为B1(第 1 代) 、B2(第 2 代)、B3(第 3 代);因素 C(性别) 可分为 C1(雄性) 、C2(雌性)。让第 1 代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,让存活的小白鼠分别在各自的组内(
5、指对照组和试验组 )生产第二代,对于第 2 代重复上面的试验, , 3 因素各水平搭配下都重复次试验,每次都有足够数量的小白鼠(因为观测指标是存活率) ,有人进行了如下的设计并收集到如下的试验数据。由专业知识得知:3 因素的主次顺序为 ABC。试分析 3 因素对小白鼠存活率的影响。方差分析表:变异来源 自由度 平方和 均方 F 值 ProbFA df1=a-1 SS1=Q1-C MS1= SS1/df1 MS1/ MS2B(A) df2=a(b-1) SS2=Q2-Q1 MS2= SS2/df2 MS2/ MS3C(A B) df3=ab (c-1) SS3=Q3-Q2 MS3= SS3/df
6、3 MS3/ MSeE dfe=(n-1)abc SSe=W-Q3 MSe= SSe/dfe总和 nabc-1 SSt=W-C注:A 因素有 a 个水平,B 因素有 b 个水平,C 因素有 c 个水平,重复 n 次,总样本含量为nab,全部数据之总和为 T,全部数据之平和为 W,校正数为 C= ,Qi 为系统分组分到第 i 级nabcT2因素时,各小组数据之和的平方均值的和。注意:由于在嵌套设计中,两个因素之间不能自由交错地组成各种处理组合,因而,不能考察因素之间地交互作用。所以,凡是交互作用比较重要的试验,都不应采用这种设计。进行嵌套设计的方差分析的过程:nested、anova 或 GLM
7、,过程 nested 过程更简单一些,但它受数据中读取分组变量先后顺序的影响很大,应先用 SORT 过程按因素重要程度进行排序整理;过程 anova 或 GLM 不需要排序整理,且容易进行均值比较。平衡资料用过程 nested、anova或 GLM 三种过程做结果是一样的;若不是平衡资料,必须用过程 GLM。例 1 选取某种植物 3 个品种(Plant) ,在每一株内选取两片叶子( Leaf) (嵌套在植株因素下的第二个因素) ,用取样器从每一片叶子上选取同样面积的两个样本(两次重复) ,称取湿重。对以上结果进行方差分析。 (固定效应 Plant+随机效应 Leaf)解: SAS 程序如下:D
8、ata Nested;Input plant $ leaf wt ;Cards;a 1 12.1 a 1 12.1 b 1 14.4 b 1 14.4 c 1 23.1 c 1 23.4a 2 12.8 a 2 12.8 b 2 14.7 b 2 14.5 c 2 28.1 c 2 28.8;Proc Anova;Class plant leaf ;Model wt = plant leaf(plant);Test H = plant E = leaf(plant);Means plant / Duncan E = leaf(plant);Run;Proc Sort;By plant leaf
9、;Run;Proc Nested;Class plant leaf;Var wt;Run;输出结果见示例。例 2 在室内用 4 种培养液培养某植物,每种培养液培养 3 盆,每盆 4 株,一个月后测定其株高生长量(mm) 。试对以上结果进行方差分析。 (固定效应 +随机效应)Data amm;Do a =1 to 4;Do b = 1 to 3;Do rep = 1 to 4;Input y ;Output;End;End;End;Cards;50 55 40 35 35 35 30 40 45 40 40 5050 45 50 45 55 60 50 50 55 45 65 5585 60 9
10、0 85 65 70 80 65 70 70 70 7060 55 35 70 60 85 45 75 65 65 85 75;Proc Sort;By a b rep;Run;Proc nested;Class a b;Var y;Run;Proc anova; /*均数的多重比较 */Class a b;Model y=a b(a);Test h=a e=b(a);Means a /duncan e=b(a);Run;结果:例 3 为了研究某种抗菌药的效果,对小白鼠进行试验。考虑 3 个试验因素, 因素 A(用此抗菌药与否)可分为 A1(对照组不用抗菌药 )、A2(试验组用抗菌药 );因素
11、 B(小白鼠代次)可分为 B1(第 1代)、B2(第 2 代)、B3(第 3 代);因素 C(性别) 可分为 C1(雄性) 、C2(雌性)。让第 1 代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,让存活的小白鼠分别在各自的组内(指对照组和试验组)生产第二代,对于第 2 代重复上面的试验, , 3 因素各水平搭配下都重复次试验,每次都有足够数量的小白鼠(因为观测指标是存活率) ,有人进行了如下的设计并收集到如下的试验数据。由专业知识得知:3 因素的主次顺序为 ABC。试分析 3 因素对小白鼠存活率的影响。DATA abc;DO r=1 to 2;DO a=1 to 2;DO
12、 b=1 to 3;DO c=1 to 2;INPUT p ;y=ARSIN(SQRT(p/100);OUTPUT;END;END;END;END;CARDS;28 33 15 26 26 18 56 62 48 66 70 4919 27 11 22 20 11 51 60 44 61 65 55;PROC SORT;BY a b c r;RUN;PROC NESTED;CLASS a b c;VAR y;RUN;PROC GLM;CLASS a b c;MODEL y=a b(a) c(a b);TEST H=a E=b(a);TEST H=b(a) E=c(a b);Means a/duncan E=b(a);RUN;例 4 鸡的试验 试验统计学P134区靖祥