1、第七章 单因素试验结果的统计分析,单因素随机区组试验结果的方差分析 单因素拉丁方试验结果的统计分析 缺区估计原理及方法,7.1 单因素随机区组试验结果的方差分析,设有A和B两个因素,A因素有k个处理,B因素有n个处理,每一组合仅有1个观察值,则全试验共有nk个观察值,其资料类型如下表:,组合内只有单个观察值的两向分组资料,试验因素: 区组因素:,由于这类试验往往只研究因素A的处理效应,而划分区组是为提高试验精确度而采用的局部控制手段,它不是一个真正的试验因素,故属单因素试验。,单因素随机区组试验:,A因素( k个处理),B因素( n个区组),一、单因素随机区组的线性模型和期望均方,其中, 为样
2、本平均数;为第i处理效应(i=1,2, , k ); 为第j区组效应(j=1,2, , n); 为随机误差,且相互独立,遵从 分布。,并满足,对于k个处理、n个区组的单因素随机区组试验(数据结构见表) ,样本中每一个观察值的线性模型为:,表7.1 单因素随机区组资料的方差分析和期望均方,二、单因素随机区组试验结果分析示例,【例7.1】有一烤烟品种产量比较试验,供试品种有A、B、C、D、E、F共六个品种,其中D为对照,采用随机区组设计,四次重复,小区计产面积60其田间排列和小区产量如下图,试作分析。,1、试验数据的整理表7.2 品种和区组两向表,2、自由度与平方和的分解 自由度的分解: 总自由度
3、 dfT=nk-1=46-1=23 区组自由度 dfb=n-1=4-1=3 处理自由度 dft=k-1=6-1=5 误差自由度 dfe=(n-1)(k-1)=(4-1)(6-1)=15,矫正数 C=T2/nk=(399.2)2/(4 6)=6640.03,SSe=SST-SSb-SSt=57.05-2.68-52.38=1.99,平方和的分解:,3、方差分析及F测验,表7.3 表7.2资料的方差分析及F测验,区组间的方差分析与F测验对于区组项的变异在一般情况下,试验只需将他从误差中分离出来,并不一定要作F测验。应该指出,如果区组间的F值达到了显著水平,并不意味着试验的可靠性差,而正好说明由于采
4、用了区组设计 (局部控制),把区组间的变异从误差中排除,从而降低了误差,提高了试验的精确度。,4、品种间的多重比较,LSD0.01=Sd t0.01=0.74 (kg/60m2),(1) 最小显著差数法(LSD),以小区平均数为比较标准,查附表3 ,当df=15时,t0.05=2.131, t0.01=2.947,LSD0.05=Sd t0.05=0.53 (kg/60m2),因而得到各品种与对照品种(D)的差数及其显著性于下表:表7.4 考烟品种小区平均产量与差异显著性(LSD),推论:以上比较表明,只有B品种的产量极显著地高于对照种D,F、 C品种皆与对照种无显著差异, A 、E品种极显著
5、地低于对照种。,以亩产量为比较标准,cf = 666.67/试验小区的计产面积(以平方米为单位),cf = 6000/试验小区的计产面积(以平方尺为单位),将试验小区的平均产量折算成亩产量,通常需扩大cf倍,LSD0.01=Sd t0.01 = 8.19(kg/亩),因本试验的小区面积为60m2,,故:cf=666.67/60=11.1倍,,差数标准误也应扩大11.1倍,即:,LSD0.05=Sd t0.05 = 5.92 (kg/亩),烤烟品种亩产量与亩产量比较的差异显著性,推论:比较结果表明,B品种极显著地高于对照种,F、C品种与对照种无显著差异,A、E品种极显著低于对照种。,以小区总产量
6、为比较标准,差数标准误,LSD0.01=Sdt0.01=1.022.947=3.01 (kg/460m2),LSD0.05=Sd t0.05=1.022.131=2.17(kg/460m2),烤烟品种的小区总产及其差异显著性,(2)最小显著极差法(LSR),当df=15,k=2、3、6时,由附表6可查出相应5%、1%的SSR值,根据公式:,如果我们的试验目的在于不仅要测验各品种与对照相的差异显著性,而且要测验各品种相互比较的差异显著性,此时应选用SSR法。,以小区平均数为比较标准,品种标准误,即可求得各k的最小显著极差值(LSR),见表7.5.表7.5 烤烟品种新复极差测验的最小显著极差(LS
7、R),表7.6 烤烟品种产量的新复极差测验,a,b,b,b,c,d,A,A,A,B,D,C,B,B,推论:以上结果表明,考烟品种B的产量,显著高于其他品种,并极显著地高于D、A、E品种。F、C、D品种之间没有显著的差异,但均极显著地高于A、E品种。,品种标准误,品种标准误,以亩产量为比较标准,以小区总产量为比较标准,拉丁方试验设计在纵横两向皆成区组。因此在总变异中要扣除行区组间变异、列区组间变异和处理间变异后,剩余的部分才是试验误差。所以,在试验结果的统计分析上拉丁方设计要比随机区组设计多一项区组间变异,试验的结果比随机区组更准确。,7.2 单因素拉丁方试验结果的方差分析,一、拉丁方设计的线性
8、模型与期望均方假定以 代表拉丁方的 i 横行、j 纵行的交叉观察值,再以 t 代表处理,则样本中任一观察值的线性模型为:,其中, 为样本平均数;为第 i行区组的效应;为第 j列区组的效应;为第 l处理的效应;为随机误差,且相互独立,遵从 分布。,、 、 间彼此独立,没有互作,并且满足:,表7.7 kk拉丁方设计的方差分析与期望均方,横行区组间 k-1 SSa Msa,纵行区组间 k-1 SSb MSb,处理间 k-1 SSt MSt,试验误差 (k-1)(k-2) SSe MSe,总变异 k2 1 SST,二、试验结果的分析示例,【例7.2】有A、B、 C、 D、 E 五个水稻品种作比较试验,
9、其中E 为对照种,采用55拉丁方设计,小区计产面积20,其田间排列和小区产量如下表,试作分析。,列 区 组 D 21.0 B 19.2 C 19.6 A 13.2 E 16.0 行 A 14.0 D 20.0 E 14.0 C 19.4 B 18.2 区 E 15.2 C 19.4 D 20.0 B 18.6 A 13.6 组 C 20.2 A 15.8 B 19.6 E 14.4 D 19.4 B 17.8 E 17.8 A 17.2 D 21.2 C 20.2,表7.8 水稻品种比较55拉丁方试验的田间排列和小区产量,列 区 组 Ta D 21.0 B 19.2 C 19.6 A 13.2
10、 E 16.0 89.0 行 A 14.0 D 20.0 E 14.0 C 19.4 B 18.2 85.0 区 E 15.2 C 19.4 D 20.0 B 18.6 A 13.6 86.8 组 C 20.2 A 15.8 B 19.6 E 14.4 D 19.4 89.4 B 17.8 E 17.8 A 17.2 D 21.2 C 20.2 94.2Tb 88.2 92.2 90.4 86.8 87.4 T= 455,1、试验数据的整理,横向区组和纵向区组两向表,表7.9 水稻各品种的小区总和、小区平均和亩产量(kg),A 13.2+14.0+13.6+15.8+17.2=73.8 14.
11、76 491.95,B 19.2+18.2+18.6+19.6+17.4=93.4 18.68 622.60,C 19.6+19.4+19.4+20.2+20.2=98.8 19.76 658.60,D 21.0+20.0+20.0+19.4+21.2=101.6 20.32 677.27,E 16.0+14.0+15.2+14.4+17.8=77.4 15.48 515.95,矫正数 : C=T2/k2=4552/(55)=7921,横向区组: dfa=k-1=5-1=4,总变异 : dfT=k2 1=52-1=24,2、自由度与平方和的分解,纵行区组 : dfb=k-1=5-1=4,品 种
12、: dft=k-1=5-1=4,误 差: dfe=(k-1)(k-2)=(5-1)(5-2)=12,3、方差分析与F测验,表7.10 水稻品种比较试验的方差分析,由于 F=29.9F0.01 故应接受HA,即各供试品种的产量之间是有极显著差异的。因此需进一步对品种作多重比较。, 对区组间通常可以不必进行F测验与多重比较, 对品种间作F测验:,4、品种间的多重比较以小区平均数作比较单位(1)最小显著差数法(LSD)差数的标准误,查附表3,当df=12时,t0.05=2.179,t0.01=3.055, LSD0.05=0.652.179=1.41(kg) LSD0.01=0.653.055=1.
13、99(kg),表7.11 水稻品种小区平均产量与对照种的差异显著性,推论: 测验结果表明,D、C、B三品种的产量均极显著地高于对照种。,(2)最小显著极差法(SSR),当df=12, k=2、3、4、5时,由附表6可查出相应的5%,1%临界SSR值,,平均数的标准误,可求得各k的最小显著极差值LSR,所得结果列于下表:,根据公式:,表7.12 水稻品种新复极差测验的最小显著极差,表7.13 水稻品比试验的新复极差测验,推论:D品种显著高于B、E、A品种,C与D之间、B与C之间差异均不显著。D、C、B三品种极显著地高于E、A品种。,a,a,b,b,c,c,A,A,A,B,B,7.3 缺区估计 一
14、、缺区估计的需要,在田间试验中,由于某种意外因素的影响,使某些小区的性状观察值发生丢失的现象,称为缺区。,试验中若有缺区,则试验结果就会丧失均衡性,方差分析也因此不能按原计划进行。,在试验中对缺区的处理,通常有两种:,某一区组的缺区较多,应考虑放弃这一区组;如果某一处理的缺区较多,则应考虑不要这一处理。,如果整个试验只有个别缺区,而取消一个处理又会严重影响试验结果的分析,这时可考虑应用统计方法“补上”缺区的相应估计值。这种“补上”并不能增加任何试验信息,仅是为了便于分析。,二、缺区估计的基本原理,缺区估计的原理是最小二乘法,即取误差项平方和为最小值的方法来估计。,一个小区的观察值发生缺失,要估
15、计出相应小区的最可能的值或最可信的值,从统计学的观点看,实际上就是误差为零的值。添加误差为零的值进行分析,不会改变误差的平方和,从而又能保证误差的无偏估计。,对缺区进行估计,应首先找出相应于有关设计的误差效应表达式; 令估计值的误差效应为0 ,即可计算出相应的估计值。,单因素随机区组试验的线性模型为:,且满足 , ,,线性模型的误差项总和必等于零,但任一观察值的误差则不一定等于零。,现假定有缺值 ,则要求将该 添进资料后能满足上述模型中误差项总和等于零的条件。因此缺值 的误差值必须等于零。,即,其中:,区组数;,处理数;,缺区所在的处理总和(不含缺区);,缺区所在的区组总和(不含缺区);,全试
16、验总和(不含缺区)。,根据拉丁方设计的线性模型,缺区估计值应满足下式:,其中,,全试验的的总和(不含缺区),缺区所在处理的总和(不含缺区),缺区所在纵行区组的总和(不含缺区),缺区所在横行区组的总和(不含缺区),试验处理数,三、缺一个小区的随机区组试验结果分析示例,【例7.3】假设在例7.1中,烤烟品种C在第 区组中的试验数据缺失,试作分析。,区 组 品种 品种和 Tt. A 15.3 14.9 16.2 16.2 62.6B 18.0 17.6 18.0 18.3 72.5C 16.6 x32 17.6 17.8 52.0+x32D 16.4 17.3 17.3 17.8 68.8E 13.
17、7 13.6 13.9 14.0 55.2F 17.0 17.6 18.2 17.5 70.3 区组总和 97.0 81.0+x32 101.8 101.6 381.4+x32(Tr.),表7.14 烤烟品种随机区组试验缺一区产量的试验结果,根据公式:,可得:,将估计出的缺值x32=17.0置入缺区所在的位置,即可按常规方法进行方差分析,分析过程同未发生缺值一样,但由于试验本身少了一个小区,因而在进行方差分析时,误差项和总变异项的自由度都应比常规分析减少1。,表7.15 考烟品种比较试验(缺失一区)方差分析表,对于缺区估计资料的多重比较,一般采用t测验.,当非缺区处理比较时:,如本例A、B、D、E、F品种之间的比较:,如本例C品种同其他品种比较:,当缺区处理和非缺区处理间比较时:,