收藏 分享(赏)

第十四章 不完全区组设计和统计分析习题.doc

上传人:cjc2202537 文档编号:1211688 上传时间:2018-06-18 格式:DOC 页数:24 大小:751KB
下载 相关 举报
第十四章 不完全区组设计和统计分析习题.doc_第1页
第1页 / 共24页
第十四章 不完全区组设计和统计分析习题.doc_第2页
第2页 / 共24页
第十四章 不完全区组设计和统计分析习题.doc_第3页
第3页 / 共24页
第十四章 不完全区组设计和统计分析习题.doc_第4页
第4页 / 共24页
第十四章 不完全区组设计和统计分析习题.doc_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、第十四章 不完全区组设计和统计分析 293第十四章 不完全区组设计和统计分析第一节 不完全区组设计的主要类型一、田间试验常用设计的归类随着研究工作的发展,不论单因素还是多因素试验,供试处理数趋向于增多,尤其多因素试验。当然由于作物育种工作的发展,供试品种(系)数量迅速增加,因而单因素试验也需要扩展其容量。但增加处理数意味着要扩大区组,这在田间与实施局部控制原则是有矛盾的。区组变大意味着局部控制失效。因而在以往完全区组(complete block),每一区组包含全套处理的基础上,发展出了不完全区组(incomplete block)的概念,即一套处理分成几个区组,或一个区组并不包含全部处理,但

2、同样要通过区组实施地区控制。如第十三章所介绍的多因素试验首先通过将一些次要效应与区组混杂的方法发展了不完全区组的混杂设计。后来混杂的概念也被应用于单因素试验,从而发展出了一系列的不完全区组设计。概括以前各章已介绍的和本章将介绍的田间试验常用的随机排列的试验设计可进一步归类如下:A. 不实行局部控制 1.完全随机设计AA. 实行局部控制B. 完全区组 即每一区组内包含整套试验处理C. 一个方向的局部控制 2.随机区组设计CC. 二个方向的局部控制 3.拉丁方设计BB. 不完全区组 处理数增多时,完全区组的局部控制效能降低,通过缩小区组,即每一区组内只包含一部分处理来提高局部控制的效能。C. 用于

3、多因素试验D. 将试验效应和区组混杂E. 混杂主效 4.裂区设计、条区设计EE. 混杂交互作用 5.混杂设计DD. 将试验处理组合精简或精简后再采用混杂方法 6.部分重复设计CC. 主要用于单因素试验D. 试验处理数甚多,区组数为处理数的平方根或处理数为区组数的整倍数。E. 供试处理固定分组 7.重复内分组设计、分组内重复设计EE. 供试处理变动分组 8.格子设计DD. 试验处理数非区组数的整倍数 9.平衡不完全区组设计试验设计的种类远多于此,以上归类只是在农业科学试验中用到的一些类型,其中每类还会有多种具体的设计方法。以上 1、2、3、4、5、6 类设计和分析的方法已在第十二和十三两章说明,

4、其中 5、6 两类是适用于多因素试验的不完全区组设计,可以通过正交设计方法进第十四章 不完全区组设计和统计分析 294行。因而本章将侧重在单因子但具有大量处理时的不完全区组试验设计方面。农学类专业中这尤其与育种试验有关,因为育种过程的早、中期产量试验阶段有大量参试品系。二、重复内分组和分组内重复设计当供试品种数量较多时,最简单的一种不完全区组设计方法是仿照裂区设计的方法,将供试品种分为几个组,看作为主区,每个组内包含的各个品种看作为副区,重复若干次,主副区都按随机区组布置,这种设计称为重复内分组设计(block in replication)。该设计一般供试材料数量较大,以下为简便起见,举例中

5、的供试材料数均较小。例如 20 个品种,分为 4 组,每组包含 5 个品种,若重复 3 次,则田间布置可设计如图 14.1。重复 重复 重复区组 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12)4 20 11 10 17 7 5 15 9 19 12 33 18 15 8 16 6 2 13 8 17 13 12 19 13 9 18 8 1 12 7 16 15 25 16 12 6 20 10 3 14 6 20 14 41 17 14 7 19 9 4 11 10 18 11 5图 14.1 重复内分组设计的田间布置该例中重复内分组设计

6、的自由度分析如下:变 异 来 源 DF重 复 2组 间 3误 差 (Ea) 6组内品种间 16误 差 (Eb) 32总 59这时,组内品种间比较的误差将为: ;/32b各组平均数间比较的误差将为: ;5)(a不同组品种间比较的误差(仿照裂区的情况)将为: 。/5)(2/34abE由于 Ea 与 Eb 常取不同数值,E a 往往大于 Eb,例如 =3,若如此,则:b组内品种间比较的误差将为: /32b不同组品种间比较的误差将为: 。15514bba两者比值为: 。.7)(/154bb即不同组品种间比较的方差将比组内品种间比较的方差大 40%,因而像这种不完全区组设计的方法,并不能保证任何两个品种

7、间比较具有相近的精确度。和重复内分组相近的一种设计是如图 14.2 所示的分组内重复设计(replication in block),这种设计相当于将供试材料分组后放在连片土地上的几组随机区组试验,通过土地连片而进第十四章 不完全区组设计和统计分析 295行联合分析与比较。分组 1 分组 2 分组 3 分组 4区组 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12)19 16 18 13 15 11 5 4 1 8 9 818 19 17 12 11 14 3 5 2 7 10 716 20 19 15 12 13 1 3 5 10 6 920

8、 17 16 11 14 15 2 1 4 9 7 1017 18 20 14 13 12 4 2 3 6 8 6图 14.2 分组内重复设计重复内分组和分组内重复两种设计常用于育种工作产量试验的早期阶段,此时供试材料多而每份材料的种子不多,小区较小,选择强度较大。这两种设计,尤其前者也常用于进行群体遗传参数估计的试验,将供试材料随机分为若干组,每组作为一个样本,全试验包括有多个随机样本以提高遗传参数估计的精确度。三、格子设计为了克服重复内分组设计中组间品种比较和组内品种比较精确度悬殊的问题,对品种分组的方法可考虑从固定的分组改进为不固定的分组,使一个品种有机会和许多其他品种,甚至其他各个品种

9、都在同一区组中相遇过。这就是格子设计(lattice design)的基本出发点。(一) 格子设计的类别供试品种数为区组内品种数的平方,称为平方格子设计(squared lattice,区组内品种数为p,供试品种数为 p2);供试品种数为区组内品种数的立方,称为立方格子设计(cubic lattice,区组内品种数为 p,供试品种数为 p3);区组内品种数为 p,供试品种数为 p(p+1),称为矩形格子设计。植物育种工作中比较常用的是平方格子设计。(二) 平方格子设计按照同一重复内各区组在田间排列的方法可以分为:仿照随机区组式的(整个重复不必成方形)和仿照拉丁式的(整个重复内各区组联成方形)。

10、这两者又各因每一品种是否在不同区组中都相遇过而分为平衡与部分平衡两种情况。1. 仿照随机区组式的设计 按品种分组方法的变换次数有:(1) 简单格子设计(simple lattice) 品种分组方法为二种,试验重复次数为 2 或 2 的倍数。以九个品种为例,分组法如图 14.3 中重复和重复所示,即为简单格子设计。重复 重复 重复 重复(1) 1 2 3 (4) 1 4 7 (7) 1 5 9 (10) 1 6 8区组 (2) 4 5 6 (5) 2 5 8 (8) 2 6 7 (11) 2 4 9(3) 7 8 9 (6) 3 6 9 (9) 3 4 8 (12) 3 5 7图 14.3 33

11、 格子设计的分组方法(2) 三重格子设计(triple lattice) 品种分组方法为三种,即在简单格子设计二种分组方法的基础上再增加对角线分组一种,如图 14.3 中前面三个重复所示。重复次数为 3 或 3 的倍第十四章 不完全区组设计和统计分析 296数。(3) 四重格子设计(quadruple lattice)及其他部分平衡格子设计(partially balanced lattice) 以 55 格子设计为例,在三重格子设计的基础上,再增加对角线一组,称四重格子设计,如图 14.4 所示。供试品种数再增加,还可以继续增加分组方法的种数,一般除 66、1010不能超过三种分组,1212

12、 不能超过四种分组外,p 为 2 至 11 的其他数值都可以用任何分组方法获得部分平衡的格子设计。这里“平衡”指任何两个品种相遇的次数相等, “部分平衡”指均能两两相遇,但不一定具有相同的相遇次数。分组法 X 分组法 Y 分组法 Z 分组法 L区组 (1) 1 2 3 4 5 (6) 1 6 11 16 21 (11) 1 7 13 19 25 (16) 1 8 15 17 24(2) 6 7 8 9 10 (7) 2 7 12 17 22 (12) 2 8 14 20 21 (17) 2 9 11 18 25(3) 11 12 13 14 15 (8) 3 8 13 18 23 (13) 3

13、 9 15 16 22 (18) 3 10 12 19 21(4) 16 17 18 19 20 (9) 4 9 14 19 24 (14) 4 10 11 17 23 (19) 4 6 13 20 22(5) 21 22 23 24 25 (10) 5 10 15 20 25 (15) 5 6 12 18 24 (20) 5 7 14 16 23图 14.4 55 四重格子设计方法(4) 平衡格子设计(balanced lattice) 品种分组方法增加到使每一对品种都能在同一区组中相遇一次,这种格子设计称平衡格子设计。图 14.3 的四个重复就是 33 平衡格子设计。若 p 为一质数或质数

14、的指数函数,则平衡时的分组方法必为 p+1 个。当 p 为质数时,可以用简单对角线法写出其平衡分组。当 p=4、8、9 等时,可以参考文末所列参考书。平衡格子设计的最小重复次数为 p+1。这种设计的优点是各对品种间比较的精确性相对一致,分析方法也比部分平衡格子设计简单,但所需重复数太多,使用上受到限制。2. 仿照拉丁方的格子设计(1) 平衡格子方设计(balanced lattice square) 包括重复数 r=(p+1)/2,每对品种在行或列区组中共相遇一次;重复数 r=(p+1),每对品种在行及列区组中均相遇一次,亦即共相遇二次。这两种情况分别见图 14.5 和 14.6。 1 2 3

15、 1 6 84 5 6 9 2 47 8 9 5 7 3图 14.5 33 平衡格子方设计在行或列中相遇一次,r=(p+1)/2 1 5 9 13 1 2 3 4 1 11 16 62 6 10 14 6 5 8 7 12 2 5 153 7 11 15 11 12 9 10 14 8 3 94 8 12 16 16 15 14 13 7 13 10 4 1 7 12 14 1 10 15 88 2 13 11 9 2 7 1610 16 3 5 13 6 3 12第十四章 不完全区组设计和统计分析 29715 9 6 4 5 14 11 4图 14.6 44 平衡格子方设计在行及列中共相遇二

16、次,r=(p+1)(2) 部分平衡格子方设计(partially balanced lattice square),重复次数少于最小平衡重复数。与三重、四重格子设计类似,不一定每一对品种都在行或列区组中相遇。以上着重介绍了平方格子设计的各种类型。至于立方格子设计和矩形格子设计,这里不再一一列述,有兴趣的读者可参考 Goulden(1956)和 Cochran and Cox(1957)。在平方格子设计方面,为了克服供试品种数受 p2 的限制最近又发展了与矩形格子设计相近似的广义格子设计和简化广义格子设计等。格子设计比之重复内分组设计的优点是:考虑了供试品种间平衡比较的问题。但由于供试品种数多,

17、这常只能实施部分平衡,而事实上很难实施完全平衡,因为完全平衡所需的重复次数导致试验规模过大。育种工作中产量比较在早、中期阶段,因供试材料多需要考虑适合大量处理的设计,但这时每份材料的种子数少,一般不可能进行小区较大的精确试验,因而实际应用中部分平衡的格子设计已可满足要求。四、平衡不完全区组设计关于平衡设计,除上述平衡格子设计外,还有一类称为平衡不完全区组设计(balanced incomplete block design)。严格地说平衡格子设计亦是平衡不完全区组设计的一种,后者应是所有平衡的不完全区组设计的总称。但习惯上将如图 14.7 所示的一类设计专指为平衡不完全区组设计。这种设计的供试

18、处理数不多,不须按格子设计那样每一重复包含有区组大小为 k的 k 个区组,而可将各重复寓于全部区组之中,区组数与区组大小不一定相等,即全试验包括大小为 k 的区组共 t(处理数 )或 t 倍个。这种设计又可进一步分为 5 种类型,有的可以安排成重复的形式,有的存在重复但并不存在重复的形式。区组 (1) (2) (3) (4) (5) (6) (7)1 2 3 4 5 6 72 3 4 5 6 7 14 5 6 7 1 2 3图 14.7 一种平衡不完全区组设计图 14.7 便重复 3 次,但看不出成形的重复。图中处理数 t=7,区组大小 k=3,重复数 r=3,每对处理平衡相遇次数为 1 次。

19、平衡不完全区组设计要求区组内的条件相对很一致,在一些特殊的试验中常可采用这种设计。例如品尝试验,对于一个人的味觉来说,品尝的对象增加太多时鉴别差异的灵敏度便下降,因而每个人只能品尝一部分。图 14.7 的情况,若有 7 个水果品种供鉴评,每人品尝 3 个,请 7 位品尝家作鉴评,便共品尝 21 次,每个品种品尝 3 次。此处每位专家便是一个区组,每区组包含 3 个品种。这时尽管每人并未将 7 个品种全部鉴评过,但因是均衡的,每个品种至少和其他 6 个品种比较过 1 次。这一试验可增加至 14 位专家则每对品种相遇 2 次,21 位专家则相遇 3 次。因而可以请许多专家作出综合评判。平衡不完全区

20、组设计的处理数、区组大小、区组数、重复数不是任意的。有许多是特定的,所以需要逐个地加以研究。Cochran and Cox(1957)列出了每区组所含处理少于 10 时的五类不同的平衡不完全区组设计的方案,可供使用时参考。第十四章 不完全区组设计和统计分析 298第二节 重复内分组和分组内重复设计的统计分析一、重复内分组设计的统计分析重复内分组用于品种(系)试验时有二种情况。一是大量品种(系)间的比较目的在于选拔高产优系,这是一种固定模型试验;另一是从一个群体内随机抽出大量家系进行试验,通过供试的样本推论总体的情况,属随机模型试验。假定重复内分组设计的供试品种为 m=ab个,分 a 组,每组有

21、 b 个品种(系),重复 r 次,则重复内分组设计的线性模型为:(141)jklljkjjkl BAy其中, 为重复的效应,A k 为参试材料分组的效应, 为重复分组,即分组误差,B klj j为 k 分组内参试材料间的效应, 为参试材料的误差。固定模型时, ,jl kA0, , ;随机模型时 Ak ,B kl 0klBjk)(0, 2eNjkl)(0, 2N)(, 2N, , 。其方差分析的自由度分解及期望均方列于)(, 2Nj, jl,表 14.1。表 14.1 重复内分组设计的自由度及期望均方EMS变 异 来 源 DF MS固定模型 随机模型重 复 r-1 MS1 22abe 22abe

22、分组(区组,主区) a-1 MS2 Ar ABr重复分组(E a) (r-1)(a-1) MS3 2e 2e分组内品种(系) a(b-1) MS4 B r重复分组内品种(系)(E b) a(b-1)(r-1) MS5 2 2固定模型时分组间差异的测验,F=MS 2/MS3;分组内品种 (系)间差异的测验F=MS4/MS5。此时重复内分组设计着重在分组内品种间的比较,其(142)rESb分组间可以比较,其(143)a不同组品种间也可比较,但如前所述误差包括 Ea 及 Eb 两部分,其(144)rSE1)(在固定模型时品种(系)的平均数通常不作调整,因无严格依据。随机模型时分组间变异的测验:第十四

23、章 不完全区组设计和统计分析 299(145)4352MSF分组内变异的测验:F=MS4/MS5 (146)F=(MS2+MS5)/(MS3+MS4)时,其有效自由度可用 Satterthwaite 公式计算:(147)/()( 4232432 551 fSfS(147)中 fi 为各均方对应的自由度。由(145)及(146)的关系可分别估计出 及 。2AB在随机模型时由于分组是随机的,每一分组都是总体的一个样本,因而可假定各样本平均数相等,从而可以估计出各重复内各区组的效应,由之可对全试验各品种(系)的平均数作统一调整。二、分组内重复设计的统计分析分组内重复的设计的线性模型为:(148)jk

24、ljkljklBAy其中 为分组内重复间的效应。其他效应的符号同重复内分组设计。固定模型时,kj, , , ;随机模型时,A00lkB0kjjkl)(0, 2NAk ,B kl , 。其方差分析的自由度分解及期望均方)(, 2AN)(, 2BNjl,列于表 14.2。表 14.2 分组内重复设计的自由度及期望均方EMS变 异 来 源 DF MS固定模型 随机模型分 组 a-1 MS1 2Arb 22ABrbb分组内品种 a(b-1) MS2 B 分组内重复(区组) a(r-1) MS3 2 2重复组内品种(E) a(b-1)(r-1) MS4 固定模型时分组间差异的测验,F=MS 1/MS4;

25、分组内品种 (系)间差异的测验F=MS2/MS4。此时分组内重复设计着重在分组内品种间的比较,其(149)rES/分组间可以比较,其(1410)b/不同组品种间的比较,其(1411)EarSE)(1同样,固定模型时品种(系)的平均数通常不作调整,因无严格依据。随机模型时分组间差异的测验:第十四章 不完全区组设计和统计分析 300(1412)3241MSF其有效自由度按 Satterthwaite 公式。分组内品种间差异测验:F=MS2/MS4 (1413)由(1412)及(1413)测验 及 。2AB同样,在各分组品种(系)均为总体一随机样本的前题下,可假定分组平均数相等,从而对品种(系)平均

26、数作统一调整。重复内分组和分组内重复是目前品系产量早期比较试验较常用的设计,并常用于遗传参数的估计,尤其前者更为常用。关于这二种试验设计方差分析中平方和的计算方法,可参考第十二、十三两章的原则。此处不再一一详细说明。第三节 简单格子设计的统计分析第一节介绍了多种格子设计,本节将介绍简单格子设计的统计分析方法,作为一个入门,读者如需要采用更复杂的格子设计,可参考 Cochran & Cox(1957)和 Goulden(1956)。以下将先介绍简单格子设计分析的基本原理,然后带出二个例题。读者可将两者对照阅读,或者先看例题再读基本原理。一、简单格子设计分析的基本原理为说明方便起见,只以品种数较少

27、的情况为例。设有 9 个品种,重复 2 次的简单格子设计试验,这 9 个品种分别给以二位数的代号如下:1 2 3 11 12 134 5 6 21 22 237 8 9 31 32 33品种按横行、纵行分组,分别设置为一个重复,则其分组安排如下:重复 11 12 13 21 22 23 31 32 33重复 11 21 31 12 22 32 13 23 33由重复所得产量以 x 表示,重复以 y 表示,各品种总和以 t 表示,则可以将试验结果整理如表 14.3 的形式(虚线表示区组)。表 14.3 简单格子设计试验结果符号表x11 x12 x13 X1 y11 y12 y13 Y1 t11

28、t12 t13 T1x21 x22 x23 X2 y21 y22 y23 Y2 t21 t22 t23 T2x31 x32 x33 X3 y31 y32 y33 Y3 t31 t32 t33 T3X1 X2 X3 X Y1 Y2 Y3 Y T1 T2 T3 TX 组 Y 组 品种总和对品种总和符号表中横行总和可以看作为试验因子 A(X 分组)的效应,纵列为 B(Y 分组)的第十四章 不完全区组设计和统计分析 301效应。因而这 9 个品种的试验可假定看作为二个因子,每个因子各具 3 个级别的因子试验,并具有以下各项自由度:DFA 2B 2AB 4总 8由于重复中 A 因子的效应和区组效应混杂,

29、重复 中 B 因子与区组混杂,整个试验相当于一个虚拟的二因子部分混杂试验,其中混杂的效应是 A 与 B 主效。这种设计若将重复当作区组,那么整个试验可按随机区组的方法进行方差分析,其自由度为:DF重复 1品种 8误差 8总 17现在每一重复又划分为区组,要把区组的变异从误差中扣去以减小试验误差,故其自由度分析将为:DF重复 1区组(E b) 4品种 8区组内误差(E i) 4总 17然而,若由表 14.3 直接计算各部分平方和,即由 t11、t 12、t 33 计算品种平方和中包含有区组的效应,夸大了品种的效应;由 X1 、X 2 、X 3 ,Y 1 、Y 2 、Y 3 计算区组平方和则又包含

30、了品种的效应,夸大了区组的效应。这样再用减去法计算区组误差,又将缩小了误差变异,因而分析的关键在于设法从品种效应中扣去区组部分,从而得到可以共同比较的调整的品种平均数及品种平方和;并且要估计出消除去品种效应的区组间变异,从而获得一个无偏的试验误差估计,进行合理的统计推断。(一) 品种调整平均数的计算这里, 1=T1/6 为 A 因子第一级别的未调整平均数;t1=T1/6 为 B 因子第一级别的未调整平均数。现在,若能获得消去区组效应的 A、B 因子不同级别效应的估计值,就可以得到调整的品种平均数。设任一品种,例如品种 12 的未调整平均数为 v12,则:( 1-m)+( 2-m)+(v12-

31、1- 2+m) (1414)v12ttt其中,m 为全试验总平均数。第十四章 不完全区组设计和统计分析 302(1414)说明任一品种总的离均差为横行离均差、纵行离均差以及横行纵行互作效应三部分之和。令:A i 表示不包含区组效应 A 因子效应估计值;Bi 表示不包含区组效应 B 因子效应估计值。则 A 因子第一个级别的估计值 ,31YiB 因子第一个级别的估计值 Xi又令 Ab 表示与区组混杂的 A 因子效应估计值,Bb 表示与区组混杂的 B 因子效应估计值则 A 因子第一个级别的估计值 ,31bB 因子第一个级别的估计值 Y若 A0,B 0 分别表示 X 组及 Y 组综合在一起未调整的 A

32、 因子及 B 因子效应,则:(1415)10 在 第 一 级 别 即 为 2在 第 一 级 别 即 为 tBAbii现在求 A 及 B 的调整值,如果仅以 Ai 及 Bi 估计,则只用了一种分组的信息,另一种分组 Ab 及 Bb 中的信息没有利用;如果以 A0 及 B0 估计,则又含有区组的混杂效应在内。比较合理的方法是以 Ai、B i 及 Ab、B b 各分组所获得结果的可靠程度进行加权平均,这里 Ai、B i 效应没有区组效应在内,所以可用 衡量其可靠程度,其中 代表区组内误差的理论方差。21w2Ab、B b 效应混有区组效应,区组效应越大,A b、B b 估计 A 及 B 的可靠程度越小,所以可用衡量其可靠程度, 代表重复内区组间的理论方差(以小区为单位)。2)(1w(1416) wBAbii这 样当区组间没有真实差异时, ,A i、B i 和 Ab、B b 同等重要,故:2)(2bi所以 Ab、B b 不能弃去,否则使试验信息白白浪费,结果格子设计并不比随机区组有什么优越性。得到 A 及 B 的估计值后,可得:(1417)()( 调 整 时未 调 整 时 mBAvBmAv 00000

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 大学论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报