1、第四章 田间试验设计第一节 试验概述第二节 试验设计原理(重复、随机排列、局部控制)第三节 经典试验设计(完全随机、随机区组、拉丁方等)第四节 正交试验设计*(正交表及其种类、表头设计)本章内容要点提示:试验设计属于科学试验方法论的范畴,学习时要注意将试验误差和前一章作为随机变量介绍的误差联系起来,进一步区分田间试验研究和抽样分析的不同点;了解试验研究的程序和试验方案的内容,重点掌握试验误差的控制办法,特别是试验地土壤差异的控制技术;要在充分认识随机区组设计和拉丁方设计的田间排列、优势及其缺陷的基础上,理解其它各种试验设计与它们的联系和区别;对于正交设计,要熟悉正交表的类与型,熟练正交表的使用
2、方法(因素上列,处理成行)以及由正交拉丁方构造部分正交表的原理。涉及教材内容:第一章前三节,第二章前五节。作业布置:教材第二章第六、七、八节和第十三章第四节 P285P289、P294 内容自习。教材 P12 T2、 T3、 T4、 T5;P34 T2、 T3、 T4。 第一节 试验概述一、 试验研究的基本知识1、试验研究在科研中的地位。(1) 科学研究的基本过程。科研活动是人类认识世界,能动地改造世界的过程,任何一个领域的科研活动都不可能一下子全部完结,但对一个具体的研究课题而言,都是一个有始有终的过程,这个过程对于自然科学来讲,大体上包括以下四个阶段:调查研究 试验研究 解释或表达 选题
3、假说形成 假说验证 科技写作 什么叫“假说”?用已有的事实材料和科学原理为依据,对未知事物的猜测或假定性解释。假说及其形成作为科研活动的阶段之一,标志着科研方法的进步和完善,其价值在于研究工作可以它为基点,把研究方向朝四面八方铺开,尽可能地将它应用于各种具体情况而引伸出许多预期结果,来和客观实际结果作比较,从而提出试验或观察方法,恩格斯在自然辩证法中有过这样一句名言:“只要自然科学还在思维着,它的发展形式就是假说” 。哥伦布发现美州大陆就是为验证“地球是球体”这样一个假说而得到的意外发现。狭义相对论的提出,就是迈克尔逊等人为验证,光的传播介质是“以太”这样一个假说而导出了洛仑兹变换,这一变换经
4、爱因斯坦的头脑就成了新的发现线索。所以科研工作就以“假说形成”为时间界限分为前后两个阶段。假说形成前是科研工作的准备阶段,其方法主要调查研究。假说形成后的阶段是试验或观测阶段,这一阶段主要是试验研究,因此,实践检验真理在科研工作中就表现为试验验证假说。(2)什么叫试验研究?在尽可能排除外界影响,突出主要因素,并能细腻地观察到各种现象之间相互关系的条件下,使某种过程重演,以观察未知事实,验证假说。农业和生物学领域的试验研究方法有两类。田间试验以差异对比法为基础,在田间自然条件下,突出试验因素,排除次要因素,以观察比较不同试验处理的反应和效果。试验室或温室试验与田间试验相比,能够严格地控制一些在田
5、间条件下难以控制的试验条件,如光照、温湿度、土壤环境等,因而有助于深入研究作物的生长发育规律。2、试验研究与统计学统计学最主要的应用领域有两个:工农业生产和社会经济领域。田间试验的适当的设计与统计分析,是统计方法在农业中应用的直接形式。由于农业试验周期长,环境因素变异大,如不对试验的设计安排作精心考虑,并使用有力的统计分析方法,则得不出什么有用的结论,所以试验设计及其统计分析的发展,始自农业和生物方面的应用。尤其是试验设计的基本思想和方法,最初都是从田间试验开始发展起来的。如在 Australia 的一些较大的科研单位和试验站所进行的农业试验研究,大多较为庞杂,且耗时多年、试验设计与数据分析工
6、作做得非常严肃、认真。程序是:交计划任务 定研究方案 课题主持人 生统局统计专家 工人或试验员 报告分析结果 按时邮寄数据 这样严格的分工使研究人员集中精力从事自己的课题研究:熟悉自己研究范围内的基础知识及其更新和发展情况。统计学家则专门从事生物统计方面的学习和研究,并在各州农业厅设专门机构生物统计局,订有世界各国出版的与生物统计有关的杂志,每年还派人参加世界性的生统会议,也常有外国专家和学者去他们那里讲课或交流经验。我国统计学管理机构尚处于学会团体性质的阶段,如中国现场统计学会,定期开展学术活动,主办刊物数理统计与管理 。3、农业试验研究的一般程序选题计划实施总结(1)选定研究课题 当前生产
7、提出的实际问题; 生产进一步发展需要解决的理论和技术问题; 推广国内外先进经验; 科学发展上需要解决的理论问题。要求:第一,要深入生产实际,抓主要矛盾(找瓶颈) ;第二,要广泛搜集国内外有关资料。(2)拟订试验计划按统计学原理,设计和确定完成试验任务的方法和步骤。具体包括: 设计试验方案; 确定试验设计种类; 制订管理措施; 拟订观察项目、记载方法及标准。要求:第一,符合试验任务要求的精确度;第二,照顾需要和可能,做到多、快、好、省。(3)实施试验计划也就获取试验数据的过程。 根据方案做好准备工作; 科学布置田间试验; 有始有终地做好管理工作; 完成计划规定的观察记载任务。要求:贯彻单一差异原
8、则,减少误差,杜绝差错。(4)对试验数据进行统计分析,作出科学结论。首先是对所有数据进行整理,发现错误设法更正,无法更正又证明确是错误的观察值应剔除,其次是对所有数据按统计学原理进行分析,找出规律并确定可靠程度,最后作出总结,写出试验研究报告,如果学术价值较高还须进一步撰写学术论文,这就是“科技写作” 。二、 试验方案1、试验方案的内容:试验方案指试验中进行比较的一组试验处理的总称。试验方案是全部试验工作的核心,它是围绕研究课题,根据试验的目的和要求制订的,其内容包括试验因素、试验水平、试验指标和试验处理。分别介绍如下:试验因素在控制影响试验结果的其它条件的情况下,人为变动的一个或几个试验条件
9、。如品比试验、密度试验中的品种、密度即是。试验指标衡量试验因素效应的指示性状,如比较两个品种优劣的试验,试验指标就可以是产量或者是收获物中某一种经济性状。试验指标对试验(处理)因素效应的定量表达就是试验数据。试验水平试验因素从质或量的方面分成不同的等级,其中的每一个等级就是一个水平,如品比试验中的每一个品种就是从质的方面来策划分水平的,密度试验中的密度就是从量的方面来划分水平的。试验处理如试验中仅一个因素,则该因素的每一个水平就是一个试验处理;如果试验中包括两个或两个以上的因素,则试验处理就是这些因素各个水平的组合,简称组合或水平组合。例如有一特早熟扁豆栽培试验方案 ,A 因素为追肥,分花前追
10、肥与对照(不追肥)两个水平,B 因素为品种,分红花一号,白花二号,C 因素为密度,设四种株距(行距为 1.5M)即45cm、 70cm、 95cm、120cm ,重复 2 次,则水平组合数为 22416 个。2、因素效应及交互作用简单效应(其平均值就是主效应):试验因素的相对独立作用,即因素对性状的数量指标所起的增加减少的作用,简称主效。以某水稻品种施肥量为例,若亩施 N 肥由 10kg 增至 15kg 时,产量由 350kg 增加到 450kg,则效应就是施 N 肥单因素的不同水平引起的产量差异为 +100kg,这就是简单效应。交互作用(互作效应,简称互作)上例中,假定在增施 5kg 的同时
11、,再增施 5kg 复合肥,事先已知单纯增施 5kg 复合肥时,产量可望由 350kg 增加到 400kg,现这两个措施同时采用后,其结果无非是下列三种情况之一:等于 150kg:称两个因素无交互作用,称“零互作” 。大于 150kg,两个因素有类似正反馈的交互作用,称“正互作” 。小于 150kg:两个因素有类似负反馈的交互作用,称“负互作” 。3、确定试验方案的要点。抓主要矛盾,力求试验因素简单明确;因素过多时先选一、两个关键性因素进行试验,然后再作比较复杂的试验,这样先简后繁,结论明确;或者先做预备试验,再做能完成多元统计分析的模式试验。同一因素各水平间的差别要拉开档次;从量的方面划个水平
12、时,等比级数比等差级数好(旋转组合设计二者兼顾)每个因素所设水平数要适当;水平数太少了容易漏掉有用的信息,多了增加工作量。方案中要明确中心水平(处理) ;中心水平即预计结果可能最优的水平,其余水平都是围绕该水平展开设置(如回归设计) 。尽量排除非试验因素的限制,使其处于比较良好的状态,有助于因素效应的充分发挥;差异比较法必须建立在单一差异原则的基础上,以保证试验具有严密的可比性,这就要求:第一, 试验因素以外的其它条件相对一致,谨防干扰;第二, 试验处理中应设置作为比较标准的处理,也就是要有对照(CK) 。三、田间试验的种类和要求按任务不同的划分为两类:1、小区试验:即科研性试验,处理数目多,
13、小区面积小,准确度要求较高,研究多因素最好的水平组合。2、生产试验:即示范性试验,处理数少,小区面积大,准确度要求很高,验证小区试验结果的推广价值。按试验因素的多少,分为三类:1、单因素试验:只研究一个因素效应的试验。优点:设计简单明了,结果很直观;缺点:影响试验指标的因素很多时,结果有片面性。2、复因素试验:研究两个或两个以上因素效应的试验,其特点是说明问题较全面,可以研究各因素的主效应,也可以研究因素间的协同效应(或互作) ,试验效率比单因素试验高。3、综合试验:研究一定条件下各因素最优(或较优)组合的综合效应,并比较其实用价值的试验。特点是大多属生产试验,确定规范化栽培模式。田间试验的要
14、求有三个:1、试验条件的代表性(典型性)指试验条件应能代表拟推广试验结果的地区的自然条件和农业条件,既要有先进性,又要有实用性。2、试验数据的可靠性(正确性)包括数据的准确度和精确度两个方面,准确度指观察值 Y 与其相应真值 接近的程度,指标是 / (%),其值越小,准确度越大。但由于一般试验中,真值 为未知数,只能根据的样本标准误算得另一个指标,即 S / (%),这就是精确度,它反映观察值彼此接近的程度。3、试验结果的重演性(规律性)指在相同或相似条件下,再重复做类似试验时,应该能获得相同或相似的结果。由于田间试验的自然条件难以人为控制,即使重复同一试验,试验结果也会因为不同地区或不同年份
15、而有出入,完全相同不可能,但类似是完全应该的。第二节 试验设计原理一、试验误差的分类由于试验因素既有主效应,又有互作效应,因此,同一试验中各试验处理因其所含水平(组合)不同而出现不同的效应值,这种反映各试验处理真实效应的数值叫处理真值。而对于田间试验来讲,试验数据的各观察值由于受到许多非试验因素的干扰和影响,即包含了处理真值,又包含了使之偏离处理真值的试验因素效应,就叫做试验误差,也简称误差。按性质的不同,试验误差分两类。1、系统误差(片面误差)试验因素以外的其它条件明显不一致所产生的误差,其特点是:干扰因素始终朝一个方向影响试验结果,使观察值总是比处理真值偏大(或偏小) ,直接影响试验结果的
16、准确度 / (%); 可人为控制,即通过合理的试验设计消除掉(如设保护行或计产面积消除边际效应) , 使之不带进数据内,或者虽带进数据中(区组效应,如田间试验中的土壤肥力梯度趋向性差异或试验材料的顺序差异) ,但可以和试验因素效应一样能定量分析出来,故又可称之为系统因素效应。以两因素各二水平的 RCBD 实例展开讲G G G G4 (A 2B2) 3 2 12 (A 1B2) 1 4 31 (A 1B1) 2 3 4 3 (A 2B1) 4 1 2G G G G 肥力梯度可控因素 系统因素试验因素边际效应是指靠试验边缘生长的作物因占据较大的生长空间,其生长势或产量与行中作物出现较大的差异,有的
17、产量相差可达到一倍以上。2、偶然误差(随机误差)在严格控制试验条件相对一致后,仍不能消除的偶发性误差,简称机误,其特点是:干扰因素使观察值大于处理真值或小于处理真值的机会均等,即误差的符号可正可负,其取值是一个服从正态分布的随机变量,即可以定量估计 y 任一取值范围的概率(如果 、已知的话) ,直接影响的是试验结果的精确度 S / (%);不管怎样控制条件,这种误差均为只能减小而不可能彻底消除。一个成功的试验设计一方面要降低偶然误差,另一方面又要消除系统误差(如边际效应) ,或者使之能够明确、定量地分析出来,转化成区组效应,所以实际研究中所讲的“试验误差”仅剩下偶然误差(因此,又称其为剩余误差
18、) ,而把系统误差纳入到可控因素效应中去了。即:试验误差 系统误差 系统因素效应 转化成区组效应 (可控因素效应) 边际效应设保护行或计产面积消除掉 偶然误差 “剩余误差” 以实习指导中特早熟扁豆栽培试验的田间布置为例:保 护 行 保 护 行 保护行保 护 行 保护行 排 水 沟 保护行保 护 行 保护行 (前作为蔬菜) (前作为苗木) 这样一来,准确度和精确度就成了一回事,对试验误差的研究也就单纯指对偶然误差的概率分布进行研究了,并且和第二章所讲的关于随机变量的误差统一起来。只是对试验误差的概率分布研究不象第二章那样能够在总体参数已知条件下进行,而只能以数据的特征数 、S 代替 、 来进行,
19、即相当于以样本(一份或一组试验数据)去推断总体结果,比抽样研究复杂得多。二、试验设计三原则试验设计有广义、狭义之分广义的试验设计是指实施整个试验计划的方法,包括方案的确定,试验地、试验材料的选择,小区排列技术,数据的搜集整理和统计分析方法等等,它针对的是整个研究课题,如本章标题就要广义地理解。狭义的试验设计仅指实施试验方案的方法、即各重复区和试验小区的田间排列方法、针对的只是小区排列技术。如本节的标题就要狭义地理解。1、重复试验中同一处理种植的小区数即重复次数。如每一处理只种一个小区,叫一次重复;种 2 个小区,叫两次重复,依次类推。其作用有二:第一,估计试验误差(抽样误差)试验任一个处理的小
20、区观察值都是一个随机变量的取值,其真值 和 是未知数(或者说是待研究的) ,如果只有一个观察值 y,不仅无法估计 y- 的绝对数。就是 y- 取值范围的概率分布也无法计算,但如果有了重复观多值,虽然抽样误差 的绝对数还是无法计算,但 取值范围的概率分布却可以计算出来,这是因为 值虽然未知,但各处理样本标准差 S 可以算出,用它代替 计算就可以把 转化为标准化随机变量 t ,从而运用 t 分布计算任一取值区间的概率。概括地讲,重复是估计抽样误差 的必要条件。由于田间试验是以不同处理间的差异比较为基础,用任意两个处理的样本标准差代替总体标准差算得差数的样本标准误,就可以将差数的抽样误差转换为标准化
21、变量 t 来进行研究与分析。第二、降低试验误差(偶然误差)同名小区由于分散在试验地的不同位置,占据不同的试验材料和外界条件,因此,对于各试验小区之间出现的偶然误差就可以通过计算同名小区观察值的平均数 相互抵消一部分,且重复次数越多,误差正负相抵的机会也就越多。从数量上讲,因为抽样误差 的变异幅度 S 与重复次数n 的平方根成反比 (教材称“误差的大小与重复次数的平方根成反比”容易误导!应改为“概率尺(或标准误) 的大小与重复次数的平方根成反比 ”, (抽样)误差是随机变量, 只能描述其概率分布,而不能用表述常量的方式来对待它!) ,所以,重复次数 n 越多,算术平均数 的精确度 S / (%)
22、越高(数值越小 !)。2、随机排列重复只是估计试验误差的必要条件,还要加上随机排列才够得上充分,因为要使估计的各处理平均数 的误差没有偏性的话,试验中的每一个处理都必须有同等的机会被安排在任意一个试验小区内,即随机排列是估计抽样误差 的充分条件。随机不仅仅是一种要求,更是一种信仰。由于试验的每一个处理均有相同的重复次数,故随机的方法就是在每一个重复区所含的试验小区上随机排列各试验处理,方法可以抽签,按计算器或使用随机数字表。3、局部控制。单用重复也不是降低试验误差(系统误差)的充分条件,还必须实施局部控制,即分范围、分地段控制非试验因素,使之对重复区内各试验处理的影响趋于最大限度的一致。即重复
23、只是降低试验误差(转化系统误差)的必要条件,局部控制是降低试验误差(转化系统误差)的充分条件。按大范围的差异将试验地(或试验材料)划分成不同的等级叫做区组,一个区组安排一个重复,各区组内的试验小区再安排各处理,也就成了重复区组。由于区组比试验区小得多,只是其重复次数 n 的 1/n 倍,试验地或试验材料等条件容易一致,故同一区组所有处理间的差异符合单一差异原则,而不同区组间的差异则可利用统计分析方法从数据中定量分析出来,排除了系统误差对数据的影响,因此大幅度地控制土壤差异或试验材料差异往往靠局部控制。实施局部控制后能影响试验数据的就只有区组内的偶然误差了,与因增加重复而扩大试验规模(如增加试验
24、地或试验材料)可能导致的系统因素效应无关。综合重复、随机排列、局部控制三者的关系,图示如下:重复 随机排列 局部控制 估计抽样误差 转化系统误差 降低偶然误差 只剩偶然误差 第三节 经典试验设计一、完全随机设计1、小区排列方法试验的每一个处理(包括同名处理)安排在整个试验地各试验小区的机会均等。例如要检验三种剂量的生长素对小麦苗高的效果,包括对照(用水)在内,共 4 个处理,若用盆栽试验每盆小麦为一个单元(即试验小区) ,每处理重复 4 次,要 16 个盆 将全部 16 个盆拟出一个摆放顺序,臂如将其排成两行,编号为:1 2 3 4 5 6 7 8 16 15 14 13 12 11 10 9
25、 使用随机数字表(附表 1)将 16 个编号查出一个随机顺序,例如:14、13、9、8;12、11、6、5;2、7、1,15;3、4、10、6 再将 A、B、C、D 四个处理依上述连续的 4 个随机数字安排列各个盆栽小区,得:1C 2C 3D 4D 5B 6B 7C 8A 16D 15C 14A 13A 12B 11B 10D 9A2、优势与缺陷:处理数、重复数可以极其灵活(弹性大) ,尤其重复次数各处理可以不相同,便于充分列用试验材料,如上述 16 个盆安排 3 个处理或 5 个处理也可以,分别设 5、5、6 次重复或 3、3、3、3、4次重复就是了;统计分析很简单,即使缺区也不受影响;试验
26、误差自由度大,有利于估计处理效应显着性;未实施局部控制,不能分析区组效应,只能应用于试验环境相当一致,试验条件可人为控制的温室、网室实验室的盆钵试验,田间试验一般不能应用。配对数据差数相当于没有重复的完全随机设计试验结果,故不能做 AOV。产生于 19 世纪 80 年代的半条式对比法,属于安排仅一个处理和一个对照相比较试验方案,重复10-20 次,排列狭长小区(相邻的土肥条件最相似)的方式:AB BA AB BA同上一章介绍的配对(试验材料和试验小区各一个实例)设计基于同样的原理,具有分析精度高,统计方法和完全随机设计一样简单,但设计原理又和随机区组法相似。二、随机区组设计1、田间小区排列每个
27、区组安排一个重复,同一重复的所有处理(含 CK)在一个区组内必须出现而且仅仅出现一次,各处理在同一区组内的排列绝对随机。如一 8 品种,4 个重复的随机区组法排列如下(小区排列示意图不是田间种植图!):7 4 2 11 3 1 73 6 8 54 8 7 32 1 6 45 2 4 8 8 7 5 66 5 3 2 肥力梯度注:区组集中排列时,同名小区尽可能不在一条横线上,本例只有品种 1 在第二行小区位于一条线,随机排列数果尚好。还有就是小区长边与肥力梯度线平行。2、特点:能将试验地或试验材料之任意一个方向的差异引起的系统因素效应转化为区组效应(谓之与区组效应混杂) ,再通过 ANOVA 从
28、数据中定量分析出来,这就是单向控制作用。3、优势:弹性(伸缩性)大,处理数、重复数不受严格限制,单因素、复因素试验、综合试验都可采用;对试验地(材料)只要求区组内一致,不同区组也可以分散排列,甚至多地点排列或分年度进行,试验安排灵活性大;试验结果的准确度高 ,主要是单向控制作用带来的效果 ,其次是重复次数根据需要设置,使 S / (%) 符合精度要求;统计分析不复杂。4、缺陷当有局部控制效果的区组不能容纳一个重复的全部处理时,就只好改用不完全区组设计。因同一重复的所有处理必须排列在一起,故安排试验时,设置处理数目仍受到区组大小(容量)的限制 ,一般为 315 个。三、 拉丁方设计1、田间小区排
29、列:将一个重复的所有处理(含 CK)从两个方向排列成区组,各处理在横行区组和直行区组内都必须出现而且仅出现一次,所有处理在横、直行区组内都随机排列,方法是:选择标准方:统计上将第一横行,第一直行(列)的字母都按拉丁字母顺序排列的拉丁方。教材列出 44 至 88 共 5 种阶数的标准方,供选用(n = k) ;列随机:按顺序编排的列号使用随机数字表进行随机排序;行随机:在列随机的基础上,对整行(横行)进行随机排序;处理随机:将处理编号随机排序后依次代换拉丁字母。以 n = k = 5 所用 55 拉丁方为例,排列过程及其结果(也不等于田间种植图!)如下:1 2 3 4 5 1 4 5 3 21、
30、2、3、4、5 D、A 、E 、C、BA B C D E 1 A D E C B 5 E B A D CB A E C D 2 B C D E A 1 A D E C B C D A E B 3 C E B A D 2 B C D E AD E B A C 4 D A C B E 4 D A C B EE C D B A 5 E B A D C 3 C E B A D3 5 2 1 4 2 1 3 4 55 4 1 3 21 2 4 5 34 1 3 2 12、特点:把两个方向的试验地顺序差异转化为两个区组效应,再借助 ANOVA 从数据中分析出来,这就是双向控制作用。3、优势:可分析出两个方
31、向的系统误差,比随机区组设计还多一个方向的局部控制,因此 ,试验具有较高的精确度。4、缺陷:缺乏灵活性 ,因为各区组必须集中排列,不能分散,所以,要求选整块平坦的试验地,但并不要求试验地为正方形,恰恰因为小区长方形居多而要求长方形试验地;区组之间界线不能象随机区组法那样设走道,中部试验小区不容易接近,观察记载都不方便;缺乏弹性(伸缩性) ,即处理次数与重复次数必须相等。处理数增加,试验规模不必要的硬性扩大,因此,一般只适宜于处理数为 58 个的试验方案,少于 5 个,用单个拉丁方试验嫌误差自由度 dfe 太小,以 44 为例;用于 4 个处理的试验方案,dfe =15333 = 610 或 1
32、2,试验结果有可能因为 dfe 较小时,需要的 F0.05 偏大使得处理效应本来应该有的显著性测验不出来。只有采用两个 44 标准方分别进行随机排列后再随机代换同一组处理编号 1、2、3、4(内容相同) ,之后再进行田间布置,就可以既保留双向控制的优势,又增加了误差自由度,这就是复拉丁方设计,此时: dfe =(32 2)(82)(82 )(41)= 151 2 3 4 2 4 1 31 2 3 4 1 3 2 4A B C D 1 A C B D 3 C A D B A=1 3 1 2 4B C D A 2 B D C A 1 A C B D B=4 1 3 4 2C D A B 3 C A
33、 D B 2 B D C A C=3 4 2 3 1D A B C 4 D B A C 4 D B A C D=2 2 4 1 3四、裂区设计1、田间小区排列必定用于复因素试验,先将重复区按第一个因素分设的各个水平(主水平)划分小区,叫主区A B C D 1 B D A C 1 B D A C A=2 1 3 2 4B A D C 2 A C B D 4 D A C B B=1 4 1 3 2C D B A 3 D A C B 3 D A C B C=4 3 2 4 1D C A B 4 C B D A 2 A C B D D=3 2 4 1 3(main plot )或整区。再按第二个因素分
34、设的各个水平(副水平) ,把主区划分成更小的小区,叫副区(sub plot)或称裂区。重复区内各主水平(亦称主处理)的排列及主区内各副水平(亦称副处理)的排列都是随机进行的,对第二个因素而言,主区就是一个区组,但从试验的所有水平组合来看,主区仅是一个不完全区组。所以,裂区设计被教材归为不完全区组设计类型。但决不是说裂区设计只能用于两因素试验,三因素试验就一定要用再裂区设计,以前述特早熟扁豆栽培的三因素试验 224 方案为例,用 28 式裂区设计方案照样可以实施(图示稍后) 。其中,追肥 A1、A 2 被视为主处理,品种 B 与密度 C 两因素的 8 个水平组合B1C1、 B1C2、 B1C3、
35、B 1C4、 B2C1、B 2C2、B 2C3、B 2C4 被视为副处理,依次编号为1、2、3、4、5、6、7、8。保 护 行 保 护 行 7 6 1 8 4 2 5 3 8 3 1 5 2 7 6 41 3 6 2 5 7 8 4 5 2 7 1 4 6 8 3保护行保 护 行 保护行 排 水 沟 保护行保 护 行 保护行2、特点:由于副区之间比主区之间更为接近,占据的试验条件为一级,加之副处理的重复次数是主处理的若干倍(倍数即主水平数) ,因此,副水平之间的差异比较比主水平之间的差异比较更为精确,特别适宜于下列几种情况不下采用:、一个因素的各个水平比另一个因素各个水平需要更大的面积时将要求
36、面积大者作为主水平,如施肥、灌溉、耕作方式等;、一个因素的主效应比另一个因素的主效应更为重要,要求精度高时,或者两因素的交互作用研究比其主效更为重要时,将精度要求高的因素安排成副水平;、根据以往研究,知某因素的效应比另一些因素效应更大时,将可能表现更大差异的因素安排成主水平。鉴于此,裂区设计的主副水平的田间排列往往不局限于随机区组法,尤其是主水平数超过 4 个时(象 72 、73 式;62、63 式、52、53 式等) ,采用拉丁方排列更能提高其精确度。如施肥量与品种二因素重复 3 次的 36 式裂区设计,主处理就可排列成拉丁方。 3、优势:只要两因素的效应不是同等重要,要求的精确度不是一样高
37、的话,裂区设计比随机区组设计(就同一试验方案而言)的试验规模要小得多。如有一柑桔的灌溉与修剪二因素试验,定 3 次重复,灌溉为第一个因素分 a1、a 2、a 3 三个主水平,需要主区面积至少为 4 株树;修剪为第二因素,分 B1、B 2、B 3、B 44 个副水平,需要副区面积为 1 株树。若采用随机区组法设计,因受灌溉因素的限制,试验小区面积必须定为 4 株树,所有 34=12 个处理(水平组合)各安排一次就需 48 株树,重复 3 次,试验规模 483=144 株树。而采用裂区设计,所有 12 个水平组合(仅 12 株树)重复 3 次,试验规模 123=36 株树。两相比较,裂区设计的规模
38、仅为前者的 1/4,即副水平数的倒数倍。4、缺陷:统计分析方法比随机区组法和拉丁方设计都要复杂(尤其是三因素以上的再裂区设计更麻烦)只适宜安排两个或三个因素的试验。6 1 1 6 1 23 5 高 4 5 低 3 4 中4 2 2 3 5 63 5 4 2 4 56 4 低 6 3 中 6 3 高2 1 5 1 1 26 2 2 1 6 15 4 中 5 6 高 5 4 低1 3 4 3 3 2第四节 正交试验设计一、正交试验产生的必然性多因素多验随着因素数及其水平数的增加,处理数(水平组合数)呈几何级数的规律增加,例如:这里所列还只是一个重复的处理数目,采用经典试验设计实施局部控制将遇到空前
39、的困难,因为成百上千乃至成千上万的处理数目,全部付诸实施的话,试验规模实在太大了。唯一可行的办法是从众多的水平组合中挑选一部分组合来进行试验,这就是部分重复试验。被选来做试验(即部分实施)的那一部分水平组合叫不完全组合。第四章第一节讲到的综合试验的各个处理也只是方案中的一部分组合,但这部分组合是根据以往小区试验得出的预计试验结果较优的组合,其目的是进行示范,即检验小区试验结果大面积推广的可行性。而通常的多因素小区试验主要带科研性质,事先并没有多少附加知识,对各因素的主效应及其互作情况并不了解,所以,不完全组合的挑选就只有借助于正交表来进行。于是,我们将“正交试验”界定为:采用一种由数学领域的组
40、合理论推导而成的正交阵列表来安排的部分重复试验(即挑选不完全组合) ,并进而对其部分实施的试验结果进行统计分析的一种多因素试验方法。可见,正交试验的产生不是偶然的,它是经典试验设计发展到一定阶段后的必然产物 ,从随机区组法到拉丁方试验就已经孕育着正交试验的思想,再进一步发展成为正交试验自然是水到渠成的事情。教材对“正交试验”提法不很明确,笼统地称之为“部分重复试验” ,以强调它和完全实施的混杂设计或部分混杂设计的联系,由于是从挑选组合开始,正交试验设计应从广义的角度来理解,不妨称“不完全重复设计” 。二、正交表1、正交拉丁方将两个同阶拉丁方重叠起来后,如果其中一个拉丁方的每一个字母与另一个拉丁
41、方的各个字母必水平 因素 2 3 4 5 6 7 2 4 8 16 32 64 128 3 9 27 81 243 729 2187 4 16 64 256 1024 4096 16384 5 25 125 625 3125 15625 78125 相遇一次,而且只相遇一次,则称如此重叠起来的两个拉丁方互为正交拉丁方。如果 3 个或 3 个以上的同阶拉丁方重叠起来后,任意两个拉丁方均互为正交关系,则称它们为“两两正交” 。现已知道,kk 阶拉丁方(k 6,k3)最多可以有 k1 个两两正交的拉丁方(公理!) ,由这样的 k1 个两两正交的拉丁方重叠起来就构成正交拉丁方完全系(OLSCS) 。下
42、面写出 33、44、55 的 OLSCS:k1=2 k1=3 k1= 4A1 B2 C3 A11 B22 C33 D44 A111 B222 C333 D444 E555B3 C1 A2 B34 A43 D12 C21 B345 C451 D512 E123 A234C2 A3 B1 C42 D31 A24 B13 C524 D135 E241 A352 B413D23 C14 B41 A32 D253 E314 A425 B531 C142E432 A543 B154 C215 D3212、正交表的构造和性质用 OLSCS 可构造出通式为 L m2 (m m+1) 的正交表,如由 33 的
43、OLSCS 经过适当变换就可以得到正交表 L 32 (m 3+1) 即 L9(34),其构造过程如下:A B C D 1 2 3 4B1 B2 B3 B1 B2 B3 1 A1 B1 C1 D1 1 1 1 1 11 2 3 1 2 3 2 A1 B2 C2 D2 2 1 2 2 2A1 A1 B2 C3 A1 C1D1 C2D2 C3D3 3 A1 B3 C3 D3 3 1 3 3 34 5 6 4 5 6 4 A2 B1 C2 D3 4 2 1 2 3A2 B3 C1 A2 A2 C2D3 C3D1 C1D2 5 A2 B2 C3 D1 5 2 2 3 17 8 9 7 8 9 6 A2
44、B3 C1 D2 6 2 3 1 2A3 C2 A3 B1 A3 C3D2 C1D3 C2D1 7 A3 B1 C3 D2 7 3 1 3 2A、B、C C1、C2、C3 8 A3 B2 C1 D3 8 3 2 1 31、2、3 D1、D2、D3 9 A3 B3 C2 D1 9 3 3 2 1L m2 (m m+1) 型正交表 L9(34)的构造过程所得正交表记为 L9(34),其中 L 为正交表的代号,源自 Latin square 的第一个字母,9 为正交表的行数,一般用 k 表示,4 为正交表的列数,一般不 j 表示,3 指正交表各列水平数,一般用 m表示,所以正交的通式为 L k (
45、mj ),由 OLSCS 构造的 L m2 (m m+1) 只是其中的一部分。类似地,我们可根据 m =2、4、5、7、8 的各阶 OLSCS 构造出相应的正交表(见教材附表13P380):L4(23)、L 16(45)、L 25(56)、L 49(78)、L 64(89)但没有 m=6 的相同水平正交表,因为其 OLSCS 不存在!正交表所具备的两个性质被称为“正交性”:第一, 任意一列各水平出现次数相等;第二, 任意一列的每一水平与其它任何一列的各水平相遇在同一行(水平组合)中的次数相等。按照正交表的这个特点,我们用它挑选的“不完全组合” ,可以保证任意两因素的水平对子出现在同一水平组合(
46、处理)中的次数相等,所以,也就叫做正交组合,其包含的处理数目就是挑选组合所用正交表的行数 k。三、正交表的种类:1、相同水平的正交表:以上由 OLSCS 是构造的正交表是 L k ( mj ) 型中的一部分。另有一些相同水平的正交表如 L8(27)、L 16(215)、L 27(313)、L 64(421) 等,其构造必须用组合数学中的有限域理论来定义水平运算规则后进行,该理论用于构造所有 L k ( mj )型正交表只要求 m 为素数或素数幂,其通式不能写为 L m2 (m m+1),而只能以 L k ( mj )来表示。2、混合水平的正交表。由相同水平的正交表经过由水平对换取新的水平编号所得, 其通式为 L m2 (m