1、2.1 单因子试验 2.2 单因子方差分析 2.3 多重比较 2.4 效应模型 2.5 正态性检验 2.6 方差齐性检验,第二章 单因子试验设计,单因子试验是只包含一个试验因子的试验,也是最常见最简单的一种试验。单因子试验经常采用完全随机设计,或随机区组设计。它的数据分析要涉及到效应模型、参数估计、方差分析、多重比较、正态性检验、方差齐性检验等多种方法。这也是学习复因子试验的基础。我们从一个例子开始来介绍单因子试验。,2.1 单因子试验,例: 茶是一种大众饮品,它含有叶酸(一种维生素B),今要研究各地的绿茶中叶酸的含量是否有显著差异?问题中,绿茶是一个因子,用A表示。选定四个产地的绿茶,记为A
2、1, A2, A3, A4,它是因子A的四个水平。为测定试验误差,需要重复。各水平重复数相等的设计称为平衡设计. 各水平重复数不等的设计称为不平衡设计.如今我们选用不平衡设计,即A1, A2, A3, A4分别制作了7,5,6,6个样品,共有24个样品等待测试。,一个例子,随机化,这里一次测试就是一次试验,试验次序要随机化。,把试验结果“对号入坐”,填写试验结果。,单因子试验的一般概述,在一个试验中只考察一个因子A及其r个水平A1,A2, ,Ar 在水平Ai下重复mi次试验,总试验次数n= m1+m2 + mr记yij是第i个水平下的第j次重复试验的结果,这里 i 水平号,j 重复号 经过随机
3、化后,所得的n个试验结果列于表2.2.1 表2.2.1 单因子试验的数据,单因子试验的三项基本假定,A1.正态性:在水平i下的数据yi1, yi2, yimi是来自正态总体 的一个样本,i=1,2,r。 A2.方差齐性:r个正态总体的方差相等,即: 。 A3.随机性:所有数据yij都相互独立。,图2.2.1 单因子试验所涉及的多个正态总体,单因子试验中要研究的问题,r个水平均值 是否彼此相等? 这要用单因子方差分析方法来研究 假如r个均值不全相等,哪些均值间的差异是重要的? 这要用多重比较的方法来研究,单因子试验的统计模型,其中是因子A的第i个水平下第j次试验结果;是因子A的第i个水平的均值,
4、是待估参数;是因子A的第i个水平下第j次试验误差,它们是相互独立同分布 的随机变量。由此可知:,单因子试验的三项基本假定用到试验数据yij上去,可得到如下统计模型:,诸 的最小二乘估计,由于 ,诸 最小二乘法是使所有的偏差 的平方和,即四个产地绿茶的叶酸含量平均值为8.27,7.50,5.82,6.35,它是第i个水平下的平均值。 譬如,在例2.1.1中,由表2.1.2可得 .,达到最小,用微分法立即可得诸 的最小二乘估计是:,2.2 单因子方差分析,偏差平方和及其自由度,总平方和的分解公式,总平方和的分解公式,均方和,F检验,方差分析表,诸均值的参数估计,2.3 多重比较,多重比较方法,多重
5、比较方法,多重比较方法,在上例的均值比较中,各自的 t 用各自的 来计算:,1、最小显著差数法(LSD法),m 为重复数,S2e 为误差项的方差,多重比较方法,2、新复极差法(SSR法或称邓肯 q 检验),(1)计算抽样误差:,(2)计算比较标准:,多重比较方法,3、Tukey法(HSD法或称图基 q 检验),(1)计算抽样误差:,(2)计算比较标准:,2.4 效应模型,固定效应模型,固定效应模型(续),固定效应模型的统计分析,随机效应模型,随机效应模型的方差分析,方差分量的估计,2.5 正态性检验,在单因子方差分析中,对试验的结果有三项假定:(1)相互独立性;(2)正态性;(3)方差齐性。若
6、在试验过程中很好的实现随机化,则试验结果的相互独立性一般可以得到满足。而正态性和方差齐性则不太容易满足,需要另外寻求统计检验方法。若检验后正态性和方差齐性不能满足,还要寻求补救方法数据变换,使数据具有完全或近似正态性和方差齐性。,检验数据资料是否服从正态分布。 正态分布检验有多种方法: 1)偏度、峰度、Q-Q图、正态概率纸检验 2)卡方拟合优度检验 3)Shapiro-Wilk检验 4)经验分布拟合优度检验,1、正态分布检验,正态性检验,1)偏度、峰度、Q-Q图、正态概率纸检验比较直观,但有些粗略。 2)卡方拟合优度检验分组不同,拟合的结果可能不同。需要有足够大的样本含量。对于连续型变量的优度
7、拟合,卡方检验并不是理想的方法。,正态性检验,将数据排序后一分为二折返配对,计算差值,查系数表ak(n),构造W 统计量。 Shapiro-Wilk W 统计量,2、Shapiro-Wilk检验法(小样本 8n50),正态性检验,统计量W 的取值范围为0,1 在原假设 H0:数据服从正态分布下,统计量W 应该接近于1,反之应接近于0,在给定显著性水平下,使得:,其拒绝域为:,2、Shapiro-Wilk检验法(小样本 8n50),正态性检验,由样本计算得到经验分布函数Fn(x)与原假设指定的正态分布F0(x)之间的差异进行检验。 1)Kolmogorov-Smirnov D 统计量 比较实际频数与理论频数的累积概率间的差距,找出最大距离D,根据D 值来进行检验。,3、几种经验分布拟合优度检验(大样本 50),正态性检验,2)Cramer-von W 2 统计量,3)Anderson-Darling A 2 统计量,正态性检验,2.6 方差齐性检验,Bartlett 检验,Hartley 检验,