1、例1 某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表9-1所示。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),4组A B C D 比较次数m=,方差分析 (analysis of variance,ANOVA),讲授内容方差分析的基本思想及应用条件完全随机设计资料的方差分析
2、随机区组设计资料的方差分析重复测量资料的方差分析 多个样本均数间的多重比较,完全随机设计资料的方差分析,一、完全随机设计完全随机设计:(completely random design)是采用完全随机化的分组方法,将全部实验对象分配到g个处理组(水平组),各组分别接受不同的处理,实验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。,完全随机设计资料的方差分析,例1 某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的
3、降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表9-1所示。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?,二、变异分类与表达,完全随机设计资料的方差分析,记总均数为 ,各处理组均数为 ,总例数为Nnl+n2+ng,g为处理组数。,完全随机设计资料的方差分析,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),1总变异 全部测量值各不同,这种变异称为总变异。 总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。 总变异SS
4、总反映了所有测量值之间总的变异程度,完全随机设计资料的方差分析,完全随机设计资料的方差分析,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),完全随机设计资料的方差分析,2组内变异 同一处理组中的受试对象接受相同的处理,其测量值间各不相同。这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内, 表示随机误差(含个体差异和测量误差)的影响。又称误差变异,完全随机设计资料的方差分析,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),完全随机设计资料的方差分析,3组间变异 各处理组接受处理的水平不同,各组(i1,2,
5、g)的样本均数各不相同,这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示,记为SS组间,它反映了三组用药不同的影响(如处理确实有作用),同时也包括了随机误差,完全随机设计资料的方差分析,完全随机设计资料的方差分析,各组均数之间相差越悬殊,它们与总均数的差值越大,SS组间就越大,反之SS组间越小。SS组间反映了各间的变异程度。 存在组间变异的原因有: 随机误差(包括个体变异和测量误差) 不同处理水平可能对实验结果的影响。?,基本思想及应用条件,1、基本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过将可能由某因素所致
6、的变异与随机误差比较,据此推断该因素对测定结果有无影响。,完全随机设计资料的方差分析,基本思想:,完全随机设计资料的方差分析,变异程度除与离均差平方和的大小有关外,还与其自由度有关,将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(mean square,MS)。,完全随机设计资料的方差分析,如果各组样本的总体均数相等(H0:),即各处理组的样本来自相同总体,无处理因素的作用(处理效应),则组间变异同组内变异一样,只反映随机误差作用的大小。组间均方与组内均方的比值称为 F 统计量,完全随机设计资料的方差分析,基本思想及应用条件,1、基本思想:根据资料设计的类型及研究目的,可将总变
7、异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过将可能由某因素所致的变异与随机误差比较,据此推断该因素对测定结果有无影响。,完全随机设计资料的方差分析,F 值(Fisher)接近于l,就没有理由拒绝H0;反之,F 值越大,拒绝H0的理由越充分。数理统计的理论证明,当H0成立时,F 统计量服从F 分布。F 分布有两个自由度, 分子自由度为1,分母自由度为2,记为 。,完全随机设计资料的方差分析,完全随机设计资料的方差分析,方差分析的基本思想:根据实验设计类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,每部分的变异除有随机误差的作用外,还可能由某因素的作用(或某
8、几个因素的交互作用),如组间变异SS组间可由随机误差作用和处理因素的作用。通过比较不同变异来源的均方,借助F分布做出统计推断,推断各种研究因素对实验结果有无影响。,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),完全随机设计资料的方差分析,分析步骤(1)建立检验假设,确定检验水准H0:三个总体均数全相等,即1=2=3H1:三个总体均数不等或不全相等=0.05,完全随机设计资料的方差分析,本例是完全随机设计的实验结果,将总变异分解成组间变异和组内变异,并列方差分析表。,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),完全随机设计资料的方差分析,按表中的公式计算各离
9、均差平方和SS、自由度、均方MS 和F 值。,完全随机设计资料的方差分析,(3)确定P值,作出推断结论1=组间、2=组内 查F 界值表得P 值。 本例:1=31=2,2=603=57。查表得P 0.01。按=0.05水准,拒绝H0,接受H1,有统计学意义,可认为2型糖尿病患者治疗4周,其餐后2小时血糖的总体平均水平不全相同。,完全随机设计资料的方差分析,注意:方差分析的结果若拒绝H0,接受H1,不能说明各组总体均数两两间都有差别。如果要分析哪些两组间有差别,要进行多个均数间的多重比较(见本章第六节)。当g =2时,方差分析的结果与两样本均数比较的t 检验等价,有 。,完全随机设计资料的方差分析
10、,应用条件: 1)各样本是相互独立的随机样本 2)各样本来自正态总体 3)各处理组总体方差相等,即方差齐,完全随机设计资料在进行统计分析时,需根据数据的分布特征选择方法,对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-way ANOVA)或成组资料的t检验(g=2时);对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。,完全随机设计资料的方差分析,随机区组设计资料的方差分析,随机区组设计 随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响实验结果的非处理因素(如性别、体重、
11、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。,随机区组设计资料的方差分析,例2 先将同窝、同性别、体重接近的小白鼠的3只小白鼠配成一个区组,共配成10个区组。在每个区组内将3个动物随机分配到3个处理组中。,随机区组设计资料的方差分析,随机区组设计的特点是:同区组内的受试对象均衡,在每个区组内随机分配,且各处理组中受试对象数量相同,各处理组是均衡的。 统计分析时,将区组变异离均差平方和从组内离均差平和中分离出来,从而减小组内的离均差平方和(误差平方和),提高了统计检验效率。若将区组作为另一处理因素的不同水平,随机区组设计等同于无
12、重复观察的两因素设计。,随机区组设计资料的方差分析,符合随机区组设计的资料在统计分析时也需根据数据的分布特征选择分析方法,对于正态分布且方差齐同的资料,应采用两因素方差分析(two-way ANOVA)或配对t 检验(g =2)。当不满足方差分析和t 检验条件时,可对数据进行变换或采用随机区组设计资料的Friedman M检验。,随机区组设计资料的方差分析,变异分解按随机区组设计的试验结果用符号表示整理成表。第j (j1,2,n)区组的受试对象,接受第i (i1,2,g)种处理,实验结果用Xij表示,整理成表4-7形式。,随机区组设计资料的方差分析,随机区组设计资料的方差分析,(1) 总变异S
13、S总:反映所有观察值之间的变异,计算见公式。 (2) 处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理,计算见公式。 (3) 区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组,计算公式为,随机区组设计资料的方差分析,(4) 误差变异:完全由随机误差产生的变异,记为SS误差。,随机区组设计资料的方差分析,随机区组设计资料的方差分析,分析步骤(1)建立检验假设,确定检验水准 对于处理组, H0:三个总体均数全相等,即A、B、C三种方案的效果相同 H1:三个总体均数不全相等,即A、B、C三种方案的效果不全相同 对于区组, H0:十个总体均数全相等 H1:十个总体均数
14、不全相等 均取=0.05,随机区组设计资料的方差分析,(2)计算检验统计量,随机区组设计资料的方差分析,(2)计算检验统计量,随机区组设计资料的方差分析,1=2, 2=18查附表3的F 界值表,得F0.05(2,18)=3.55, F0.01(9,18)= 3.60,F32.64F0.01(2,18),P0.01。按a水准,拒绝H0,认为三种方案的处理效果不全相等。,随机区组设计资料的方差分析,注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较。当g =2时,随机区组设计方差分析与配对设计资料的t 检验等价 。,重
15、复测量设计资料的分析,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),完全随机设计资料的方差分析,按表中的公式计算各离均差平方和SS、自由度、均方MS 和F 值。,多个样本均数间的多重比较,当方差分析的结果为拒绝H0,接受H1时,只说明g个总体均数不全相等。若想进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较(multiple comparison)。 若用两两间比较用t 检验比较,将会加大犯类错误(把本无差别的两个总体均数判为有差别)的概率。,多个样本均数间的多重比较,常用的介绍三种多重比较方法:Bonfferoni t 检验 、Dunnett-t检
16、验和SNK-q检验。 Bonfferoni t 检验 (1)建立检验假设,确定检验水准H0:A=B,即任两对比组的总体均数相等H1:AB,即任两对比组的总体均数不等,多个样本均数间的多重比较,(2)计算检验统计量 (3)确定P 值,作出推断结论,多个样本均数间的多重比较,多个样本均数间的多重比较,Dunnett- t 检验 适用于g-1个实验组与一个对照组均数差别的多重比较 ,检验统计量为t, 亦称t检验。 计算公式为:=误差,多个样本均数间的多重比较,多个样本均数间的多重比较,对例2资料,本例也可用LSD-t检验,但一般用Dunnett-t 检验。 (1)建立检验假设,确定检验水准H0:T=
17、C,即任一实验组与对照组的总体均数相等H1:TC,即任一实验组的总体均数低于对照组的总体均数=0.05,多个样本均数间的多重比较,多个样本均数间的多重比较,(2)计算检验统计量,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),按表中的公式计算各离均差平方和SS、自由度、均方MS 和F 值。,完全随机设计资料的方差分析,SNK-q检验SNK(Student-Newman-Keuls)检验,亦称q检验,适用于多个样本均数两两之间的全面比较。检验统计量q的计算公式为:=误差,多个样本均数间的多重比较,多个样本均数间的多重比较,例 对例1资料中治疗4周后,餐后2小时血糖下降值的三组总体均数进行两两比较。(1)建立检验假设,确定检验水准 H0: i = j ,即任两对比较组的总体均数相等H1: ij ,即任两对比较组的总体均数不相等,多个样本均数间的多重比较,2型糖尿病患者治疗4周后餐后2小时血糖的下降量(mmol/L),多个样本均数间的多重比较,