1、第九章 试验设计,试验设计(experimental design)是数理统计学的一个分支,是进行科学研究的重要工具。由于它与生产实践和科学研究紧密结合,在理论和方法上不断地丰富和发展,因而广泛地应用于各个领域。,第一节 试验设计概述,一、试验设计的意义 试验设计,广义理解是指试验研究课题设计,也就是整个试验计划的拟定。 狭义的理解是指试验单位(如动物试验的畜、禽)的选取、重复数目的确定及试验单位的分组。生物统计中的试验设计主要指狭义的试验设计。,试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。 试验设计的任务是在研究工作进行之前,根
2、据研究项目的需要,应用数理统计原理,作出周密安排,力求用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料,通过分析得出正确的结论,明确回答研究项目所提出的问题。如果设计不合理,不仅达不到试验的目的,甚至导致整个试验的失败。因此,能否合理地进行试验设计,关系到科研工作的成败。,二、试验的基本要求 (一)生物试验的特点 1、试验干扰因素多 首先是生物本身存在差异,这种差异是试验中误差的重要来源。2、试验具有复杂性 试验中所研究的各种试验对象,它们都有自己的生长发育规律和遗传特性,并与环境、饲养管理等条件密切相关,而且这些因素之间又相互影响,相互制约,共同作用于供试对象。3、试验周期长 生物完
3、成一个生活世代的时间较长,特别是大动物、单胎动物、具有明显季节性繁殖的动物更为突出。,(二)试验的基本要求1、试验目的要明确2、试验要有代表性 试验的代表性包括生物学和环境条件两个方面的代表性。生物学的代表性,是指作为主要研究对象的个体的代表性,并要有足够的数量。环境条件的代表性是指代表将来计划推广此项试验结果的地区的自然条件和生产条件及设备等。,3、试验结果要可靠 包括试验的准确性和试验的精确性。在进行试验的过程中,应严格执行各项试验要求,将非试验因素的干扰控制在最低水平,以避免系统误差,降低试验误差,提高试验的正确性。4、试验要能重演 重演性是指在相同条件下,重复进行同一试验,能够获得与原
4、试验相类似的结果,即试验结果必须经受得起再试验的检验。试验的目的在于能在生产实践中推广试验结果。为了保证试验结果的重演性,必须认真选择供试生物,严格把握试验过程中的各个环节,在有条件的情况下,进行多年或多点试验,以避免年份、地点、环境条件的不一致所带来的影响。,(三)试验的基本要素 1、处理因素 2、受试对象 3、处理效应,(四)试验的误差的来源 1、试验误差 试验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了实测值与真值的差异,这种差异在数值上的表现称为试验误差。 试验误差大致可分为两类,一类为系统误差(片面误差),它是由于试验处理以外的其它条件明显不一致所产生的
5、带有倾向性的或定向性的偏差;另一类为随机误差(抽样误差、偶然误差),它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实值之间的差异。,2、试验中误差的来源 试验误差的主要来源有: 、供试生物个体固有的差异 是指各处理的供试生物个体在遗传和生长发育上或多或少的差异性。 、试验条件不一致 、操作技术不一致 、随机因素引起的差异,3、降低试验误差的途径 、选择纯合一致的试验材料 、改进操作管理,使之标准化 、精心选择试验单位 、采用合理的试验设计,三、试验设计的基本原则,(一)重复 重复是指试验中同一处理实施在两个或两个以上的试验单位上。 设置重复的主要作用在于估计试验误差和降低试验误差。重
6、复次数多可以降低试验误差,样本标准误与标准差的关系是 ,即平均数抽样误差的大小与重复次数的平方根成反比,故重复次数多可以降低试验误差。,(二)随机化 随机化是指在对试验动物进行分组时必须使用随机的方法,使供试生物进入各试验组的机会相等,以避免试验分组时试验人员主观倾向的影响。这是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量。,(三)局部控制试验条件的局部一致性 局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。 在试验环境或试验单位差异大的情况下,根据局部控制的原则,可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非
7、处理因素尽量一致。每个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制原则能较好地降低试验误差。,以上所述重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher)三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。试验设计三原则的关系和作用见图8-1所示。,第二节 完全随机设计,完全随机设计(completely randomized design)是根据试验处理数将全部供试动物随机地分成若干组,然后再按组实施不
8、同处理的设计。 这种设计保证每头供试验动物都有相同机会接受任何一种处理,而不受试验人员主观倾向的影响。,随机分组的方法有抽签法和用随机数字表法,以用随机数字表法为好,因为随机数字表上所有的数字都是按随机抽样原理编制的,表中任何一个数字出现在任何一个位置都是完全随机的。 有些电脑及计算器均有此功能,用起来则更方便。,一、完全随机的分组方法,(一)两个处理比较的分组 【例8.1】 现有同品种、同性别、同年龄、体重相近的健康绵羊18只,试用完全随机的方法分成甲、乙两组。,首先将18只绵羊依次编为1,2,18号,然后从随机数字表中任意一个随机数字开始,向任一方向(左、右、上、下)连续抄下18个(两位)
9、数字,分别代表18只绵羊。令随机数字中的单数为甲组,双数为乙组。如从随机数字表()第12行第7列的16开始向右连续抄下18个随机数字填入表第二行。 随机分组结果:甲组:2 4 5 6 12 14 16乙组:1 3 7 8 9 10 11 13 15 17 18,甲组比乙组少4只,需要从乙组调整两只到甲组。仍用随机的方法进行调整。在前面18个随机数字后再接着抄下两个数字:71、23,分别除以11(调整时乙组的绵羊只数)、10(调整1只绵羊去甲组后乙组剩余的绵羊只数),余数为5、3,则把分配于乙组的第5只绵羊(9号)和余下10只的第3只绵羊(7号)分到甲组。调整后的甲、乙两组绵羊编号为:,(二)三
10、个以上处理比较的分组【例8.2】 设有同品种、同性别、体重相近的健康仔猪18头,按体重大小依次编为1、2、3、18号,试用完全随机的方法,把它们等分成甲、乙、丙三组。由随机数字表()第10列第2个数94开始,向下依次抄下18个数,填入下表第2横行。,一律以3(处理数)除各随机数字,若余数为1,即将该动物归于甲组;余数为2,归入乙组;商为0或余数为0,归入丙组。结果归入甲组者8头,乙组5头,丙组5头。 各组头数不等,应将甲组多余的2头调整1头给乙组、1头给丙组。调整甲组的2头动物仍然采用随机的方法。从随机数字25后面接下去抄二个数63、62,然后分别以8(甲组原分配8头)、7除之,得第一个余数为
11、7,第二个余数为6,则把原分配在甲组的8头仔猪中第7头仔猪即14号仔猪改为乙组;把甲组中余下的7头仔猪中的第6头仔猪即12号仔猪改为丙组。这样各组的仔猪数就相等了。调整后各组的仔猪编号如下:,以上是用完全随机的方法,将试验动物分为两组或三组的情形,若将试验动物分为四组、五组或更多的组,方法相同。,二、试验结果的统计分析,对于完全随机试验的统计分析,由于试验处理数不同,统计分析方法也不同。(一)处理数为2 两个处理的完全随机设计也就是非配对设计,对其试验结果进行统计分析时,无论实际所得资料两处理重复数相同与否均采用非配对设计的t检验法分析。(二)处理数大于2 若获得的资料各处理重复数相等,则采用
12、各处理重复数相等的单因素试验资料方差分析法分析;若获得的资料各处理重复数不等,则采用各处理重复数不等的单因素试验资料方差分析法分析。,三、完全随机设计的优缺点,(一)完全随机设计的主要优点1、设计容易 处理数与重复数都不受限制,适用于试验条件、环境、试验动物差异较小的试验。2、统计分析简单 无论所获得的试验资料各处理重复数相同与否,都可采用t检验或方差分析法进行统计分析。,(二)完全随机设计的主要缺点1、由于未应用试验设计三原则中的局部控制原则,非试验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。2、在试验条件、环境、试验动物差异较大时,不宜采用此种设计方法。,第三节 随机区组设计
13、,随机区组设计(randomized block design)也称为随机单位组(或窝组)设计。它是根据局部控制的原则,如将同窝、同性别、体重基本相同的动物划归一个单位组,每一单位组内的动物数等于处理数,并将各单位组的试验动物随机分配到各处理组,这种设计称为随机单位组设计。,随机单位组设计要求同一单位组内各头(只)试验动物尽可能一致,不同单位组间的试验动物允许存在差异,但每一单位组内试验动物的随机分组要独立进行,每种处理在一个单位组内只能出现一次。 例如,为了比较5种不同中草药饲料添加剂对猪增重的效果,从4头母猪所产的仔猪中,每窝选出性别相同、体重相近的仔猪各5头,共20头,组成4个单位组,设
14、计时每一单位组有仔猪5头,每头仔猪随机地喂给不同的饲料添加剂。这就是处理数为5,单位组数为4的随机单位组设计,一、随机单位组设计方法,(一)随机单位组设计的分组方法 在畜牧、水产等动物试验中,除把初始条件相同的动物如同窝仔畜划为同一单位组外,还可根据实际情况,把不同试验场、同一场内不同畜舍、不同池塘等划分为单位组。下面结合例子说明分组的方法。 【例8.3】 5种中草药饲料添加剂分别以A1、A2、A3、A4、A5表示,供试4窝仔猪分别按体重依次编号为:1-5号为第组,6-10号为第组,11-15号为第组,16-20为第组。试按随机单位组设计将试验仔猪分组。,先从随机数字表()第15行、第11列1
15、5开始,向下依次抄下16个随机数字(舍弃00),每抄4个数字留一空位,见表8-2第2行。 再将同一单位组内前4个随机数字依次除以5、4、3、2(最大数5为处理数),根据余数(余数为0者,以除数代之)确定每一单位组内各供试仔猪喂给的添加剂种类。 如第一单位组中,第一个余数是5,则将第1号仔猪喂给5种添加剂列于第5位的A5添加剂;第二个余数是2,则将第2号仔猪喂给剩下的4种添加剂A1、A2、A3、A4列于第二位的A2添加剂;第三个余数是3,则将第3号仔猪喂给剩下的3种添加剂A1、A3、A4列于第三位的A4添加剂。用同样方法一一确定其它单位组内各仔猪喂给的添加剂,结果见表8-3。,二、试验结果的统计
16、分析,(一)单因素随机单位组试验结果的统计分析 单因素随机单位组试验结果的统计分析采用方差分析法。分析时将单位组也看成一个因素,连同试验因素一起,按两因素单独观测值的方差分析法进行。这里需要说明的是,假定单位组因素与试验因素不存在交互作用。,若记试验处理因素为A,处理因素水平数为a;单位组因素为B,单位组数为b,对试验结果进行方差分析的数学模型为:,(i=1,2,a;j=1,2,b),平方和与自由度的划分式为:SST = SSA+SSB+SSedf T = dfA+dfB+dfe,对于【例8.3】,通过按表8-3试验动物分组结果进行试验后,各号仔猪增重结果列于表8-4。,因为FA F0.01(
17、4,12), FB F0.01(3,12),表明饲料添加剂对仔猪增重影响极显著,因而还需要对各不同饲料添加剂平均数间差异的显著性进行检验。 单位组间的变异,虽然F值已达到0.01显著水平,由于我们采取的是随机单位组设计,已将它从误差中分离出来,达到了局部控制的目的。单位组间的变异即使显著,一般也不作单位组间的多重比较。,均数标准误为:由dfe=12、秩次距k=2,3,4,5,查附表5得临界q值:q0.05、q0.01,并与相乘求得LSR值,列于表8-7。,由表8-6看出,除A5与A3,A1与A4之间差异不显著,A2与A1间差异显著外,其余平均数间差异极显著,说明采用A5、A3添加剂仔猪平均增重
18、极显著高于A2、A1、A4添加剂;A2显著高于A1、极显著高于A4;A4添加剂对仔猪增重效果最差。,(二)二因素随机单位组试验结果的统计分析,二因素随机区组设计试验每一观察值xijk的线性模型为: xijk = +i + j + ()ij + k +ijk(i=1,2,a; j=1,2,b; k= 1,2,n ) 二因素随机区组设计试验包含两个因素A、B,分别具有a、b个水平,两因素各水平组成ab个处理组合,每个处理组合随机分配在n个区组内,全部试验三项分组资料共得abn个观察值。,平方和与自由度的划分式为:SST =SSr+ SSt +SSedf T = dfr+ dft +dfe 其中:S
19、St=SSA+SSB+SSAB dft=dfA+dfB+dfAB 二因素随机区组试验得总变异平方和SST可分解为区组间平方和SSr处理平方和SSt和试验误差平方和SSe三部分。而处理间平方和SSt又进一步可分解为A因素的平方和SSA,A因素的平方和SSB和AB互作平方和SSAB,【例】为探讨微肥拌种和根外喷施对小麦的增产效应,某县农技站设计了一个微肥种类与施用方式的两因素三重复区组试验。试验处理及结果见下表。, 结果整理: 将试验结果按处理和区组作两项分组整理成8-9,在表8-9中计算出处理总和xij、区组总和xk及全试验总和T。 按微肥和施用方式整理成表8-10,计算出A因素(施肥方式)各水
20、平总和xi(TA)和B因素(微肥种类)各水平总和x.j.(TB),、列出方差分析表,进行F检验,按固定模型分析,区组间、微肥种类间、施用方式间、微肥种类施用方式间的互作差异均达到极显著,因而需进行多重比较。其中,对于施用方式,因只有两个水平,不必进行多重比较,所以只需对微肥种类、微肥种类施用方式间的互作进行多重比较。 单位组间的变异,虽然F值已达到0.01显著水平,由于我们采取的是随机单位组设计,已将它从误差中分离出来,达到了局部控制的目的。单位组间的变异即使显著,一般也不作单位组间的多重比较。,、多重比较: 微肥种类间比较 微肥种类施用方式间的互作分析,三、随机单位组设计的优缺点(一)随机单
21、位组设计的主要优点1、设计与分析方法简单易行。2、由于随机单位组设计体现了试验设计三原则,在对试验结果进行分析时,能将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,因而试验的精确性较高。3、把条件一致的供试动物分在同一单位组,再将同一单位组的供试动物随机分配到不同处理组内,加大了处理组之间的可比性。,(二)随机单位组设计的主要缺点 当处理数目过多时,各单位组内的供试动物数数目也过多,要使各单位组内供试动物的初始条件一致将有一定难度,因而在随机单位组设计中,处理数以不超过20为宜,第四节 裂区设计,一、裂区设计的概念 裂区设计是多因素试验的一种形式。先将每一区组按第一因素的处理数划分
22、小区,称为主区,在主区里随机安排主处理;然后在主区内引进第二各因素的各个处理即副处理,就是主处理的小区内分设与副处理数相等的更小的小区,称为副区(又称裂区),在副区里随机安排副处理。由于这种设计将主区分裂为副区,故称为裂区设计。本节仅介绍二因素裂区设计。 裂区设计的特点是主处理分设在主区,副处理分设于主区内的副区,副区之间比主区之间的试验空间(条件)更为接近。因此进行统计分析时,可分别估算主区与副区的试验误差。,二、裂区设计的统计分析 在裂区试验中,对于主处理(i=1,2,a)、副处理(j=1,2,b)、区组 (k=1,2,n)的任一观察值xijk的线性模型为: xijkikikj()ijij
23、k上式中,ik和ijk分别为主区误差和副区误差;k为区组效应;i、j和()ij分别为主、副处理和主副交互作用。,设A和B两个试验因素,A因素为主处理,具有a各水平,B因素为副处理,具有b个水平,设n个区组,则试验共有abn个观察值。,裂区设计的平方和可分解为:,裂区设计的自由度可分解为:,具体计算时,裂区试验以副区为基本单位。,第五节 拉丁方设计,“拉丁方”的名字最初是由R、A、Fisher给出的。拉丁方设计(latin square design)是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计。 在拉丁方设计中,每一行或每一列都成为
24、一个完全单位组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,试验处理数=横行单位组数=直列单位组数=试验处理的重复数。 在对拉丁方设计试验结果进行统计分析时,由于能将横行、直列二个单位组间的变异从试验误差中分离出来,因而拉丁方设计的试验误差比随机单位组设计小,试验精确性比随机单位组设计高。,一、拉丁方简介(一)拉丁方 以n个拉丁字母A,B,C,为元素,作一个n阶方阵,若这n个拉丁方字母在这n阶方阵的每一行、每一列都出现、且只出现一次,则称该n阶方阵为nn阶拉丁方。例如:A B B AB A A B 为22阶拉丁方,22阶拉丁方只有这两个。,再如: A B CB C AC
25、A B为33阶拉丁方。,(二)常用拉丁方 试验设计中,最常用的有33,44,55,66,77,88阶拉丁方,见附表12。 标准型拉丁方 第一行与第一列的拉丁字母按自然顺序排列的拉丁方,叫标准型拉丁方。33阶标准型拉丁方只有上面介绍的1种,44阶标准型拉丁方有4种,55阶标准型拉丁方有56种。若变换标准型的行或列,可得到更多种的拉丁方,在进行拉丁方设计时,可选择一种标准型,随机改变其行列顺序后再使用;或从上述多种拉丁方中随机选择一种。,二、拉丁方设计方法在动物试验中,如果要控制来自两个方面的系统误差,且试验动物的数量又较少,则常采用拉丁方设计。下面结合具体例子说明拉丁方设计方法。【例8.4】 为
26、了研究5种不同饲料对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡群和产蛋期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组设置,以便控制这两个方面的系统误差。拉丁方设计步骤如下:,(一)选择拉丁方 选择拉丁方时应根据试验的处理数和横行、直列单位组数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。 此例因试验处理因素为温度,处理数为5;将鸡群作为直列单位组因素,直列单位组数为5;将产蛋期作为横行单位组因素,横行单位组数亦为5,即试验处理数、直列单位组数、横行单位组数均为5,则应选取55阶拉丁方。本例选取前面
27、列出的一个5 5标准型拉丁方,即:A B C D EB A D E CC E B A DD C E B AE D A C B,(二)随机排列 在选定拉丁方之后,如是非标准型时,则可直接按拉丁方中的字母安排试验方案。若是标准型拉丁方,还应按下列要求对横行、直列和试验处理的顺序进行随机排列。下面对选定的55标准型拉丁方进行随机排列。先从随机数字表()第22行、第8列97开始,向右连续抄录3个5位数,抄录时舍去“0”、“6以上的数”和重复出现的数,抄录的3个五位数字为:13542,41523,34521。然后将上面选定的55拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。,1、列随机 将拉
28、丁方的各直列顺序按13542顺序重排。2、行随机 再将直列重排后的拉丁方的各横行按41523顺序重排。,3、处理随机 即把5种不同温度按第三个5位数34521顺序排列:A=3,B=4,C=5,D=2,E=1,也就是说,在拉丁方中的A表示第3种温度,B表示第4种温度等,依次类推。从而得出55拉丁方设计,如表8-14所示(括号内的数字表示温度的编号 )。,三、试验结果的统计分析拉丁方设计试验结果的分析,是将两个单位组因素与试验因素一起,按三因素试验单独观测值的方差分析法进行,但应假定3个因素之间不存在交互作用。,将横行单位组因素记为A,直列单位组因素记为B,处理因素记为C,横行单位组数、直列单位组
29、数与处理数记为r,对拉丁方试验结果进行方差分析的数学模型为:,(i=j=k=1,2,r),式中:为总平均数; 为第i横行单位组效应; 为第j直列单位组效应, 为第k处理效应。 为随机误差,相互独立,且都服从N(0,2)。,注意:k不是独立的下标,因为i、j一经确定,k亦随之确定。,平方和与自由度划分式为:SST = SSA+SSB+SSC+SSedfT = dfA+dfB+dfc+dfe 现对表8-14的试验资料进行方差分析。 、结果整理将试验资料按横行、从列排列,并计算总和,见表815;试验处理的总和(Tt)和平均数,见表816。,【例8.4】的试验结果如表8-15所示。,、计算各项平方和与
30、自由度 矫正数 C=x2/r2=5492/52=12056.04 总平方和 ST =x 2ij(t)-C=232+212+192-12056.04= 12157-12056.04=100.96 行平方和 SS A =x 2i./r- C =(1082+1052+1042)/5-12056.04=27.36 列平方和 SS B =x 2.j/ r - C =(1092+1082+1062)/5-12056.04=22.16,处理平方和 SSt =x 2(t)/ r C=(1162+1142+1012)/5-12056.04=33.36 误差平方和 SS e= SS T- SS A- SS B-
31、SS t=100.96-33.36-27.36-22.16= 18.08 总自由度 dfT= r 2-1=52-1=24 横行自由度 dfA= r-1=5-1=4 直列自由度 dfB= r-1=5-1=4 处理自由度 dft= r-1=5-1=4 误差自由度 dfe=dfT-dfA-dfB-dft=(r-1)( r-2)=(5-1)(5-2)=12,、列出方差分析表,进行F检验,经F检验,产蛋期间和鸡群间差异显著,温度间差异极显著。因在拉丁方设计中,横行、直列单位组因素是为了控制和降低试验误差而设置的非试验因素,所以即使显著一般也不对单位组间进行多重比较。下面对不同温度平均产蛋量间作进行多重比
32、较。,、多重比较,多重比较结果表明:温度A、B、D平均产蛋量显著地高于E,即第3、4、2种温度的平均产蛋量显著高于第1种温度的平均产蛋量,其余之间差异不显著。第1种和第5种温度平均产蛋量最低。,四、拉丁方设计的优缺点(一)拉丁方设计的主要优点1、精确性高 拉丁方设计在不增加试验单位的情况下,比随机单位组设计多设置了一个单位组因素,能将横行和直列两个单位组间的变异从试验误差中分离出来,因而试验误差比随机单位组设计小,试验的精确性比随机单位组设计高。2、试验结果的分析简便,(二)拉丁方设计的主要缺点 因为在拉丁设计中,横行单位组数、直列单位组数、试验处理数与试验处理的重复数必须相等,所以处理数受到
33、一定限制。若处理数少,则重复数也少,估计试验误差的自由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列单位组数也多,导致试验工作量大,且同一单位组内试验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的试验。在采用4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于12,可采用“复拉丁方设计”,即同一个拉丁方试验重复进行数次,并将试验数据合并分析,以增加误差项的自由度。,第六节 正交设计,在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交设计就是安排多因素试验、寻求最优水平组合的一种
34、高效率试验设计方法。,一、正交设计的基本概念 正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。 如果试验方案包含各因素的全部水平组合,即进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。这是全面试验的优点。但全面试验包含的水平组合数较多,工作量大,由于受试验场地、试验动物、经费等限制而难于实施。,正交设计的基本特点是: 用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。正因为正交试验是用部分试验来代替全面试验,它不
35、可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。,3因素3水平的全面试验水平组合数为33=27,4因素3水平的全面试验水平组合数为34=81,5因素3水平的全面试验水平组合数为35=243,这在动物试验中是不可能做到的。如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。,二、正交表及其特性,(一) 正交表 正交表是正交设计的基本工具。在正交设
36、计中,安排试验和分析试验结果都要用正交表。 例如:表8-20是一张正交表,记号为L8(27),其中“L”代表正交表;括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个因素(包括互作);L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合、试验次数)。,2水平正交表有L4(23)、L16(215);3水平正交表有L9(34)、L27(213)等(详见附表及有关参考书)。,(二) 正交表的特性 任何一张正交表都有如下两个特性: 1、任一列中,不同数字出现的次数相等 例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)
37、中不同数字有1、2和3,它们各出现3次。 2、任两列中,同一横行所组成的数字对出现的次数相等 例如L8(27)中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9(34)中(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。,根据以上两个特性,我们用正交表安排的试验,具有均衡分散和整齐可比的特点。 均衡分散: 是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的。
38、因此代表性强,能够较好地反映全面试验的情况。,整齐可比: 是指每一个因素的各水平间具有可比性。因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。如在A、B、C 3个因素中,A因素的3个水平A1、A2、A3条件下各有B、C的3个不同水平,即:,(三) 正交表的类别 1、相同水平正交表 各列中出现的最大数字相同的正交表称为相同水平正交表。如L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。 2、混合水平正交表 各列中出现的最大数字
39、不完全相同的正交表称为混合水平正交表。如L8(424)表中有一列最大数字为4,有4列最大数字为2。也就是说该表可以安排一个4水平因素和4个2水平因素。再如L16(4423),L16(41212)等都混合水平正交表。,三、正交设计方法【例8.5】 在进行矿物质元素对架子猪补饲试验中,考察补饲配方、用量、食盐3个因素,每个因素都有3个水平。试安排一个正交试验方案。,正交设计一般有以下几个步骤: (一)、确定因素和水平 影响试验结果的因素很多,我们不可能把 所有影响因素通过一次试验都予以研究,应 根据实际经验和专业知识,定出各因素适宜 的水平,列出因素水平表。 【例8.5】的因素水平表如表8-21所
40、示。,(二)、选用合适的正交表 确定了因素及其水平后,根据因素、水平及需要考察的交互作用的多少来选择合适的正交表。选用正交表的原则是:既要能安排下试验的全部因素,又要使部分水平组合数(处理数)尽可能地少。 一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数(包括交互作用)应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计试验误差。若各因素及交互作用的自由度之和等于所选正交表总自由度,则可采用有重复正交试验来估计试验误差。,此例有3个3水平因素,若不考察交互作用,则各因素自由度之和为因素数个数(水平数1)=3(3-1)=6,
41、小于L9(34)总自由度9-1=8,故可以选用L9(34);若要考察交互作用,则应选用L27(313) (L18(37)没有相应的交互作用表),此时所安排的试验方案实际上是全面试验方案。,(三)、表头设计 正交表选好后,就可以进行表头设计。所谓表头设计,就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。 在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按该正交表的交互作用列表安排各因素与交互作用。,此例不考察交互作用,可将矿物质元素补饲配方(A)、用量(B)和食盐(C)依次安排在L9(34)的第1、2、3列上,第4列为空列,见表8-22。,(四)、列出试验方
42、案 把正交表中安排各因素的每个列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。表8-23就是例8.5 的正交试验方案。 根据表8-23,1号试验处理是A1B1C1,即配方I、用量15g、食盐为0;2号试验处理是A1B2C2,即配方II、用量25g、食盐为4g,;9号试验处理为A3B3C2,即配方III、用量20g、食盐4g。,(五)试验 正交试验方案作出后,就可以按试验方案进行试验。如果选用的正交表较小,各列都被安排了试验因素,对试验结果进行方查分析时,无法估算试验误差,若选用较大的正交表,则试验的处理组合数会急剧增加。 为了解决这个问题,可采用重复
43、试验或重复抽样的方法解决这一问题。重复抽样不同与重复试验,重复抽样是从同一次试验中抽取几个样品进行观测或测试,结果每个处理组合就可得到几个数据。,四、正交试验结果的统计分析 (一)正交试验结果的直观分析(P181-182)对例【8.5】用L9(34)安排试验方案后,各号试验只进行一次,试验结果(增重)列于表8-24。 1、逐列计算各因素同一水平之和 2、逐列计算个水平的平均数 3、逐列计算个水平平均数的极差 4、比较极差,确定各因子或交互作用对结果的影响 5、水平选优与组合选优,(二)正交试验结果的方差分析 根据各号试验处理是单独观测值还是有重复观测值,正交试验可分为单独观测值正交试验和有重复
44、观测值正交试验两种。 单独观测值正交试验结果的方差分析 对例【8.5】用L9(34)安排试验方案后,各号试验只进行一次,试验结果(增重)列于表8-24。试对其进行方差分析。,该次试验的9个观测值总变异由A因素、B因素、C因素及误差变异四部分组成,因而进行方差分析时平方和与自由度的划分式为:SST = SSA+SSB+SSC+SSedfT = dfA+dfB+dfC+dfe用n表示试验(处理)号数;a、b、c表示A、B、C因素各水平重复数;ka、kb、kc表示A、B、C因素的水平数。本例,n=9、a=b=c=3、 ka=kb=kc=3。,表8-24中,Ti为各因素同一水平试验指标(增重)之和。
45、如A因素第1水平T1=y1+y2+y3=63.4+68.9+64.9=197.2, A因素第2水平T2=y4+y5+y6=64.3+70.2+65.8=200.3, A因素第3水平T3=y7+y8+y9=71.4+69.5+73.7=214.6; B因素第1水平T1=y1+y4+y7=63.4+64.3+71.4=199.1, B因素第3水平T3=y3+y6+y9=64.9+65.8+73.7=204.4。 同理可求得C因素各水平试验指标之和。 为各因素同一水平试验指标的平均数。 如A因素第1水平=197.2/3=65.7333, A因素第2水平=200.3/3=66.7667, A因素第3水
46、平=214.6/3=71.5333。 同理可求得B、C因素各水平试验指标的平均数。,F检验结果表明,三个因素对增重的影响都不显著。究其原因可能是本例试验误差大且误差自由度小(仅为2),使检验的灵敏度低,从而掩盖了考察因素的显著性。 由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较。此时,可直观地从表8-24中选择平均数大的水平A3、B3、C2组合成最优水平组合A3B3C2。,上述无重复正交试验结果的方差分析,其误差是由“空列”来估计的。然而“空列”并不空,实际上是被未考察的交互作用所占据。这种误差既包含试验误差,也包含交互作用,称为模型误差。若交互作用不存在,用模型误差估计试验误
47、差是可行的;若因素间存在交互作用,则模型误差会夸大试验误差,有可能掩盖考察因素的显著性。这时,试验误差应通过重复试验值来估计。所以,进行正交试验最好能有二次以上的重复。正交试验的重复,可采用完全随机或随机单位组设计。,2、有重复观测值正交试验结果的方差分析 假定【例8.5】试验重复了两次,且重复采 用随机单位组设计,试验结果列于表8-26。 试对其进行方差分析。用n表示试验(处理)号数,r表示试验处理的重复数。a、b、c、ka、kb、kc的意义同上。此例n=9、r=2、a=b=c=3、ka=kb=dc=3,对于有重复、且重复采用随机单位组设计的正交试验,总变异可以划分为处理间、单位组间和误差变
48、异三部分,而处理间变异可进一步划分为A因素、B因素、C因素与模型误差变异四部分。,此时,平方和与自由度划分式为:SST=SSt+SSr+SSe2dfT=dft+dfr+dfe2而 SSt=SSA+SSB+SSC+SSe1dft=dfA+dfB+dfC+dfe1于是 SST=SSA+SSB+SSC+SSr+SSe1+SSe2 dfT=dfA+dfB+dfC+dfr+dfe1+dfe2式中:SSr为单位组间平方和;SSe1为模型误差平方和;SSe2为试验误差平方和;SSt为处理间平方和;dfr、dfe1、dfe2 、dft为相应自由度。注意,对于重复采用完全随机设计的正交试验,在平方和与自由度划分
49、式中无SSr、dfr项。,首先检验MSe1与MSe2差异的显著性,若经F检验不显著,则可将其平方和与自由度分别合并,计算出合并的误差均方,进行F检验与多重比较,以提高分析的精度;若F检验显著,说明存在交互作用,二者不能合并,此时只能以MSe2进行F检验与多重比较。 本例MSe1/ MSe21,MSe1与MSe2差异不显著,故将误差平方和与自由度分别合并计算出合并的误差均方MSe,即MSe=(SSe1+ SSe2)/(dfe1+ dfe2)=(15.2012+315.6845)/(2+8)=33.09,并用合并的误差均方MSe进行F检验与多重比较。F检验结果表明,矿物质元素配方对架子猪增得有显著影响,另外两个因素作用不显著;二个单位组间差异极显著。,3、 A因素各水平平均数的多重比较,