1、生物统计与试验设计 1 / 5 pengjiguangZJU 生物统计与试验设计 -作业三 彭继光 3090100060 植物保护 1对没有截距项的一元回归模型 = 1 + 称之为过原点回归( regression through the origin)。记 = 1或 = 1, 其中 1和 1为回归参数两个不同的估计值。试证明 : (1)如果通过相应的样本回归模型可得到通常的的正规方程组 = 0 = 0 则可以得到 1的两个不同的估计值: 1 = /, 1 = ()/(2)。 证明 : = ( 1) = () (1) = 1 = 0 = 1 1 = / = ( 1) = () 1 (2) =
2、0 1 = (i)/(2) (2)在基本假设 E() = 0下, 1与 1均为无偏估计量。 证明 : E() = ( 1) = () 1() = 0 1 = ()()= E(1) = E() = = 1 1为 1无偏估计量 E(1) = E()(2) ) = E(1 + )(2) ) = E(1 2 + 2 ) = E(1 + 2) = E(1) = 1 1为 1无偏估计量 (3)回归方程 = 1通常不会经过均值点 ( , ) 但回归方程 = 1则相反。 证明 : 当 X = 时, = 1 = ()(2) = () ()(2)当且仅当 1 = 2 = = 时, = = 此时 = 1通过 均值点
3、( , ) 生物统计与试验设计 2 / 5 pengjiguangZJU 回归方程 = 1通常不会经过均值点( , ) = 1 = (/) ,当 = 0时, = 恒成立 回归方程 = 1通常会经过均值点( , ) 2正在研究四台机器产生的金属零件的表面光沽度安排的试验有三个操作者,每个操作者选择两个样品进行测验。由于机器所处的位置不同,每台机器要求不同的操作者。操作者随机选定,资料如表。 机器 1 2 3 4 操作者 1 2 3 1 2 3 1 2 3 1 2 3 样品 1 79 94 46 92 86 76 85 53 46 36 40 62 样品 2 62 74 57 99 79 68 7
4、5 56 57 53 56 47 (1)这是个什么试验设计? Two-way Nested Designs(双因素巢式设计 ) (2)写出分析该试验资料的线性模型,并定义模型的各项效应。 Y = + + () + ( + ,2 + 2) 是总体均值 ; i是机器因素的第 i 个水平的效应, = 0 , i=1,2,3,4; j(i) 是机器因素 的 第 i 个水平中 操作者 因素 的 第 j 个水平效应,j(i)N(0, 2), j=1,2,3; ijk是残差效应,独立正态随机变量 ijkN(0, 2), k=1,2; (3)为分析各项效应的显著性、比较不同机器间金属零件的表面光沽度的差异,写
5、出分析的 SAS 程序(注:不需要计算,只需写出分析的 SAS 程序)。 Date surf; input A B Y ; datalines; 1 1 79 2 1 92 3 1 85 4 1 36 1 1 62 2 1 99 3 1 75 4 1 53 1 2 94 2 2 86 3 2 53 4 2 40 1 2 74 2 2 79 3 2 56 4 2 56 1 3 46 2 3 76 3 3 46 4 3 62 1 3 57 2 3 68 3 3 57 4 3 47 ; PROC GLM; Class A B; 生物统计与试验设计 3 / 5 pengjiguangZJU MODEL
6、 Y=A B(A); Random B(A)/Test; Means A/Tukey; Run; 3为研究水稻某一病虫害发病时期与植株累积降雨量的关系,调查得到了下列样本数据资料 : 编号 1 2 3 4 5 6 7 8 9 累计降雨量 (X) 34.5 35.8 38.2 33.1 43.2 29.2 30.7 39.3 30.7 发病时期 (Y) 12 7 9 16 -1 3 9 2 13 用 SAS 统计分析软件,分别对两个不同回归模型进行统计分析,分析结果如下: 生物统计与试验设计 4 / 5 pengjiguangZJU 采用第一个线性回归模型的分析结果 采用第二个线性回归模型的分析
7、结果 根据以上分析结果,写出分析上述数据的 SAS 程序; Data Rain; input X Y ; Datalines; 34.5 12 35.8 7 38.2 9 33.1 16 43.2 -1 29.2 3 30.7 9 39.3 2 30.7 13 ; Proc reg; Model Y=X/All; Run; Model Y=X/Noint; Run; 生物统计与试验设计 5 / 5 pengjiguangZJU 写出用于分析的两个模型,哪一个模型更合适,为什么? 模型一: = 0 + 1 + , = 1,2,9 模型二: = + , = 1,2,9 比较两个模型:模型二的 P-
8、value 比模型一小,决定系数 2比模型一大,而且模型一通过回归方程通过原点,参数更少;所以可以判断模型二更加合适。 ( 但是 简单从数据来看,两个模型都不是很合适,看不出发病时期 Y与累计降雨量 X不存在简单的一元一次线性回归关系;从数据可以看出当 X取得中间值时 Y有最大值,而 X取两边时 Y有最小值,初步判断为非线性回归,而且从结果来看决定系数 2也并不大,所以以上两个模型都不是很恰当。) 分别对以上 2 个线性回归模型,对线性关系的显著性作出统计推断; 模型一的 P-value=0.13470.05, 未达到显著水平, 线性关系 不显著 ; 模型二的 P-value=0.00720.05, 达到显著水平, 线性关系 显著; 写出最后得到的虫害发病时期对累积降雨量的回归方程;模型的决定系数是多少,有何统计含义? 最终 应该 采用 模型二 的 回归方程 模型二: Y = 0.20907X,决定系数 2 = 0.6152; 表示 发病时期 ( Y)对 累计降雨量 (X)的线性回归所能解释的变异占总变异的 61.52%