收藏 分享(赏)

北大光华陈奇志老师saS课件8.pptx

上传人:ysd1539 文档编号:7949592 上传时间:2019-05-30 格式:PPTX 页数:118 大小:1.69MB
下载 相关 举报
北大光华陈奇志老师saS课件8.pptx_第1页
第1页 / 共118页
北大光华陈奇志老师saS课件8.pptx_第2页
第2页 / 共118页
北大光华陈奇志老师saS课件8.pptx_第3页
第3页 / 共118页
北大光华陈奇志老师saS课件8.pptx_第4页
第4页 / 共118页
北大光华陈奇志老师saS课件8.pptx_第5页
第5页 / 共118页
点击查看更多>>
资源描述

1、1,八、SAS系统 与方差分析,2,目 录,1. 单因素方差分析2. 多因素方差分析3. 均值估计与比较4. 非参数统计,3,方差分析(ANOVA),方差分析(Analysis of Variance,简记为 ANOVA)是分析试验数据的一种常用统计方法. 在方差分析中,我们把试验数据(响应变量)的总变差(总波动)分解为所考察因素(分类变量)的变差和由随机因素引起的变差,然后通过分析比较这些变差来推断哪些因素对指标(响应变量)影响最显著,哪些不显著. 对多个均值进行统计推断通常使用方差分析.,4,单因素方差分析,方差分析的问题与模型:为了比较不同配方和工艺条件对产品产量和质量的影响,往往需要进

2、行多个总体均值的比较.方差分析就是对两个或多个总体均值进行比较最常用的一种统计方法.例如有k种不同的工艺条件,在方差分析中也称每种工艺条件为一个水平,在每个水平下,例如在第i种水平下,产品产量的全体为一个总体,对此总体得到了产品产量的观测样本为Xi1, Xi2 , Xin.希望由此对不同水平下总体的均值进行比较.,5,单因素方差分析,假设观察到的Xij 可用以下的模型表示:Xij = i + ij ,1jn,1ik 其中i表示第i种水平下产量的均值,ij为第i种水平下产量的第j次观测值所包含的随机误差,在方差分析中为了得到有效的检验法还常假定ij 满足: ij 为相互独立的,即不同水平下观测的

3、样本是相互独立的; ij 都是正态分布的,且ij 的均值都为0,方差也相同.,6,单因素方差分析,在上面的模型中,观测到的数据的均值受一个因素不同水平的影响,即i依赖于因素的第i个水平,这类问题称为单因素问题,用以处理这类问题的统计方法称为单因素的方差分析.要分析的变量(指标)X称为因变量、响应变量或分析变量.比较不同水平下均值是否相同的问题就归为检验如下的假设:H0: 1 = 2 = .= k,H1: 1,2,.,k不全相等;,7,单因素方差分析,例(隔热试验的例子):为检验三种隔热材料的效果进行30次试验,每种10次.比较三种材料的平均温度变化是否一样.,对,8,单因素方差分析 方差分析模

4、型,在方差分析中:指标(或称因变量或响应变量):记录在各种试验条件下的观测结果;若干个因素(或称自变量或分类变量):设定观测的试验条件.分类变量的不同值又称为水平.,9,单因素方差分析 方差分解与统计检验,方差分析将观测到的响应变量的变差分解为由于分类变量不同水平产生的(组间)变差和随机误差(组内)进行分析.,10,单因素方差分析 方差分解与统计检验-观测数据,组均值,11,单因素方差分析 方差分解与统计检验,单因素数据的方差分析(均值模型)或(效应模型、线性模型)方差分解自由度分解,组间,组内,12,单因素方差分析 方差分解与统计检验,13,单因素方差分析 方差分解与统计检验,方差分解与检验

5、 -Total SS=SS(因素A)+Residual SSTotal DF=DF(A)+Residual DFMS(A)=SS(A)/DF(A) F(A)=MS(A)/Residual MS,14,单因素方差分析 验证方差模型的假定,方差分析模型的假定:,误差项 eij : 同方差、零均值相互独立正态分布 (eijN(0,2),常用残差的比较盒形图和残差分布QQ 图来验证这些假定.违反这些假定会使方差分析的检验失效.,15,单因素方差分析 例子-胶合板耐磨性试验,例1.1(胶合板耐磨性试验) 为了比较五种不同品牌的胶合板的质量,从每种品牌中随机抽取4个样品作耐磨性试验.记录了每次试验测量的板

6、材磨损数量,数据存放在数据集SASUSER.VENEER中(见下表).该数据集有两个变量:BRAND表示胶合板的品牌;WEAR表示测得的磨损数量.胶合板磨损数据品 牌 磨损数量(每个牌子四个样品)ACME 2.3, 2.1, 2.4, 2.5CHAMP 2.2, 2.3, 2.4, 2.6AJAX 2.2, 2.0, 1.9, 2.1TUFFY 2.4, 2.7, 2.6, 2.7XTRA 2.3, 2.5, 2.3, 2.4,16,单因素方差分析 例子-胶合板耐磨性试验,试用SAS菜单系统INSIGHT,分析家或用编程 方法检验五种不同品牌的胶合板的质量是否有 显著性差异?,在使用方差分析之

7、前,利用图形进行直观地比较结果是有益的 . 在Insight中打开SASUSER.VENEER,比较不同牌子的胶合板磨损数量:,17,单因素方差分析 用INSIGHT进行探索数据,选 分析(Analyze)盒形图/马赛克图(Box Plot/Mosaic Plot)(Y) 在弹出的对话窗选中品牌BRAND,点击X 选中磨损数量WEAR,点击Y 确定(OK)。 则在输出结果窗中给出5种不同牌子的盒形图.,18,单因素方差分析 用INSIGHT进行探索数据,19,单因素方差分析 用INSIGHT进行探索数据,为了更清楚地显示不同牌子的胶合板的均值和方差的信息,可在图形左下角的下拉菜单中选中:均值(

8、Means)、值(Values)和取消观测(Observations).从图上可以看出,五种牌子测试结果标准差的差异并不显著(菱形的高度差异不大),均值间有一定的差异.但在统计上差异是否显著还需要行方差分析.,20,单因素方差分析 用INSIGHT进行单因素方差分析,探索完数据以后,接着进行方差分析.在使用Insight进行方差分析时自变量X必须是列名型的。选 分析( Analyze)拟合(Fit)(X Y)在弹出的拟合窗选中自变量BRAND,点击X选中因变量 WEAR ,点击 Y 确定(OK) . 在随即显示的分析结果中包含若干个表:,第一个表提供拟合模型的一般信息:(1) WEAR = B

9、RAND表示这个分析是以WEAR为因变量,BRAND为自变量的线性模型;,21,单因素方差分析 用INSIGHT进行单因素方差分析,(2)响应分布是正态分布,因为这是缺省的分布,要这一分析成立,误差项应该是近似正态分布的.(3)关联函数提供数据中响应变量和模型中的响应变量间的联系.在这个例子中,因为在模型拟合前没有对响应变量进行任何变换,所以关联函数是恒等函数:g( )=.,22,单因素方差分析 用INSIGHT进行单因素方差分析,第二、第三张表提供自变量的取值水平的信息:即BRAND为列名型的,有五个水平,在设定标识变量的时侯,P_2、P_3、P_4、P_5和P_6分别为ACME、AJAX、

10、CHANP、 TUFFY和XTRA 五个牌子的标识变量.,23,单因素方差分析 用INSIGHT进行单因素方差分析,为了用一般线性模型来描述因变量Wear与自变量Brand(因素或分类变量)间的线性关系式,把分类变量Brand数量化,引入4个标识变量Z1, Z2,Z3,Z4,并令Brand Z1 Z2 Z3 Z4ACME 1 0 0 0AJAX 0 1 0 0CHANP 0 0 1 0TUFFY 0 0 0 1XTRA 0 0 0 0,24,单因素方差分析 用INSIGHT进行单因素方差分析,以下把方差分析模型写成一般线性模型:,(注意:k =),当取第i个水平时,即(zi1,zi(k-1)=

11、(0,1,0) (第i个元素为1的k-维向量).若用INSIGHT的记号,线性模型表为:,当取第i个水平时,即(_2,_k)=(0,1,0), (此例k=5,为第i个元素为1的维向量).,25,单因素方差分析 用INSIGHT进行单因素方差分析,第四张表给出响应变量均值关于自变量不同水平的模型方程式:若变量BRAND(牌子)为ACME,则P_2为1,其他为0;若牌子为AJAX,则P_3为1,其他为0,以此类推.由模型方程式可得出各品牌下磨损量均值的估计值.如品牌ACME的磨损量均值估计为 2.3750-0.05= 2.325;而品牌XTRA的磨损量均值为 2.3750.,26,单因素方差分析

12、用INSIGHT进行单因素方差分析,第五张表给出模型拟合的汇总信息:1、响应变量的均值(Mean of Response),即变量WEAR 20次试验结果的平均值2.3450;2、均方误差平方根(Root MSE)为误差项(假定误差项有等方差)的标准差的估计值。3、R平方是判定(决定)系数 (coefficient ofdetermination),阐明了自变量所能描述的变化在全部校正平方和中的比例。它的值总在0和1之间,若其值:,27,单因素方差分析 用INSIGHT进行单因素方差分析,1)接近于0,自变量(因素)不能说明指标数据的大部分变异;2)接近于1,自变量说明数据的变化中的一个相对较

13、大的比例.虽然希望R平方接近于1,但对R平方大小的判定还依赖于问题的具体内容。4、校正R平方(Aaj R-Sq)是类似于R平方的统计量,但它随模型中的参数的个数而修正,尤其在回归分析中比较拟合同一数据的不同模型时,校正R平方是有用的。,28,单因素方差分析 用INSIGHT进行单因素方差分析,第六张方差分析表包含对模型效果显著性的假设检验H0:1 = 2 = .= k1、一般,自由度(DF)可想象为独立信息源的个数. 模型自由度(Model DF)是处理数减1; 校正平方和的总自由度(C total)是样本容量20减1;,29,单因素方差分析 用INSIGHT进行单因素方差分析,2、模型平方和

14、(SS Model)汇总了组间差异;误差平方和(SS Error)汇总了组内差异;全部校正平方和(SS C-Total)= SSM + SSE。 3、均方(Mean Square)是由平方和被相应的自由度相除而得到的。F统计量 = 模型均方(MS Model)/ 误差均方(MS Error) 比较F统计量相应的p值,若p值 0.05 =,则拒绝原假设,反之则接受原假设。在这里,p值=0.0017小于0.05,所以拒绝原假设,即不同牌子的胶合板的磨损数量有显著差异。,30,单因素方差分析 用INSIGHT进行单因素方差分析,III型检验用于检验因素(自变量) brand对指标(响应变量)wear

15、的作用是否显著.单因素方差分析只考虑一个因素,故第七张表提供与第六张表本质相同的内容(就是第六张表的第一行).,31,单因素方差分析 用INSIGHT进行单因素方差分析,在参数估计表中,有关于不同水平下磨损数量差异的估计和检验:1、根据标识变量规定的方法,截距项的估计2.3750是对应牌子XTRA(该因素的最后一个水平)的磨损数量的均值,其后的 t 检验是检验这一均值是否为0(H0:k =0),32,单因素方差分析 用INSIGHT进行单因素方差分析,2、ACME后的估计-0.0500是牌子ACME与XTRA磨损量均值之差(1- k=1) 的估计值,其后的t检验也是检验这两个磨损量均值之差1是

16、否为0.由于p值为0.63130.05,所以ACME和XTRA两个牌子的磨损指数没有显著差异的.从这里我们还可以得到1的估计值为2.375-0.050=2.325.,33,单因素方差分析 用INSIGHT进行单因素方差分析,3、在表中还有容差(Tolerance)和方差膨胀因子(Variance inflation factors),在单因素方差分析中没有提供什么信息,在多元回归分析中将考察这些统计量.,再接下来的一行AJAX后的估计-0.325 是品牌AJAX与XTRA磨损量均值之差的估计值,并检验均值差是否为0.由于p值为0.00620.05,这说明这两个品牌的磨损量均值有显著差异.其余几

17、行也是估计和检验别的品牌与XTRA磨损量均值的差异.,34,单因素方差分析 用INSIGHT进行单因素方差分析-考察模型假定,在显示结果窗的底部有一个残差对预测值的散点图,这个图可以帮助校验模型的假定.从图中看出,残差有大体随机的散布,它表明等方差的假设并没问题.,35,单因素方差分析 用INSIGHT进行单因素方差分析-考察模型假定,为了验证残差为正态分布的假定,回到数据窗.可以看到残差和预测值已加到数据集之中,可以用分布Distribution(Y)来验证残差的正态性.选:1、分析(Analyze) 分布( Distribution)(Y),R_WEAR Y, OK;2、曲线(Curves

18、)分布检验(Test for Distribution) 选中正态在Test for Distribution表中看到,p值大于0.05,不能拒绝原假设,表明没有破坏正态性的假定.,36,单因素方差分析 用分析员应用作单因素方差分析,1、在分析员应用中打开SASUSER.VENEER;2、选 统计 方差分析 单向方差分析;3、在弹出的单向ANOVA窗中选模型的因变量和变量:BRANDIndependent,WEARDependent; 若要作图或进行多重比较,可点击Plots或Means.比如在这里我们点击Plots键,并选择绘制均值图,在均值图选项中条形高度选为2倍均值的标准差OKOK.,3

19、7,单因素方差分析 用分析员应用作单因素方差分析,38,单因素方差分析 用分析员应用作单因素方差分析,输出的方差分析表,汇总统计量及单个因素对指标作用是否显著的检验结果见下表.,汇总信息,方差分析表,因素效应 的检验,39,单因素方差分析 用分析员应用作单因素方差分析,因素Brank(品牌)各水平下磨损量的均值图,40,单因素方差分析 ANOVA和GLM过程的简单用法,PROC GLM DATA=数据集名;CLASS 变量名列;MODEL 因变量名列=自变量名列; RUN;,在SAS/STAT模块中提供多个PROC实现方差分析的功能:GLM:一般线性模型,有均值检验与比较功能;ANOVA:用于

20、均衡设计观测数据的方差分析;TTEST:两独立样本均值的比较. 其他:NESTED,VARCOMP,REG, CATMOD, NPAR1WAYPLAN,41,单因素方差分析 ANOVA和GLM过程的简单用法-例子,例1.1(胶合板磨损试验):为比较5种不同品牌产品的质量,每种抽取4个做磨损试验.试用编程的方法比较种品牌的质量有无显著差异. 解: proc anova data=veneer;class brand; model wear=brand;run; 或 proc glm data=veneer;class brand;model wear=brand;run;,(Anova11.sa

21、s),结论:由方差分析表或因素的效应检验结果可知:F=7.40,p=0.00170.05 故五种品牌的质量有显著差异.,42,单因素方差分析 ANOVA和GLM过程的简单用法-例子,例1.2(饲料对比试验):为比较种不同的饲料配方对养鸡增肥的效果,每种饲料配方各喂养10只小鸡,于60天后测量其重量.试用编程的方法比较种饲料配方对小鸡增肥的效果有无显著差异.,(Anova12.sas),data d12(drop=i);input type $ ;do i=1 to 10;input y ; output;end;cards; A 1073 1058 1071 1037 1066 1026 10

22、53 1049 1065 1051 B 1016 1058 1038 1042 1020 1045 1044 1061 1034 1049 C 1084 1069 1106 1078 1075 1090 1079 1094 1111 1092 ;,解:,43,单因素方差分析 ANOVA和GLM过程的简单用法-例子,proc anova data=d12;class type;model y=type;means type; run;,proc glm data=d12;class type;model y=type; run; quit;,ANOVA过程输出的方差分析表,44,单因素方差分析

23、ANOVA和GLM过程的简单用法-例子,ANOVA过程输出的各水平下均值的估计值,结论:饲料配方对小鸡增肥的效果有显著影响;且配方C对小鸡增肥的效果最好.,45,多因素方差分析,在上面介绍的单因素方差分析中,所研究的指标(因变量)只受一个因素(自变量)不同水平的影响。但在一些实际问题中,影响指标(因变量)的因素(自变量)不止一个,这就要考虑两个或多个因素的问题.另这些因素间还可能存在交互作用,即这些因素的水平之间的不同搭配对指标可能有影响.,46,多因素方差分析 不存在交互作用的多因素方差分析,例2.1(驱虫剂药效试验):在数据集PESTCIDE中,记录了用五种不同配方的驱虫剂在三个住宅中实验

24、的结果,变量PCTLOSS记录了驱虫剂使用一周后药效损耗的百分比,这是衡量驱虫剂持续使用效果的主要标志,分类变量BLOCK和BLEND分别表示该实验所在的住宅和驱虫剂的代号。确定哪种驱虫剂最长效是实验的主要目的。但是因为环境条件不同一种驱虫剂在不同的住宅可能有不同的效果。若将不同驱虫剂使用于不同的住宅,则会将驱虫剂不同的差异与住宅不同的影响混淆在一起,无法区分出好的驱虫剂,为此可在每个住宅的不同房间随机地试用一种驱虫剂。试用方差分析将驱虫剂不同和住宅不同的影响区分开来。这种实验方式又称随机化实验。每个住宅称为一个区组。,47,多因素方差分析 不存在交互作用的多因素方差分析,48,多因素方差分析

25、 不存在交互作用的多因素方差分析,较为一般的是考虑有重复观测的情形。若第一个因素A有l个水平,第二个因素B有m水平。在因素A的第i个水平和因素B的第j个水平下进行了多次观测,记为 Xijk,1kn,对Xijk考虑以下模型:Xijk = + i + j + ijk ,(1kn ,1il , 1jm ) 其中表示总平均的效应,i 和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应,ijk为误差,同样这里的误差也假定它是独立的并且是等方差的正态分布。以上模型中假设两因素没有存在交互作用.,49,多因素方差分析 不存在交互作用的多因素方差分析,为了说明因素A对指标有无显著影响,就是要检验如下

26、假设:H0:1 =2 = =l =0 ,H1:1,2 ,l不全等于0;为了说明因素B对指标有无显著影响,就是要检验如下假设:H0:1 =2 = =m =0 ,H1:1,2 ,m不全等于0; 而模型无显著效果是指以上两个假设的原假设同时成立。,50,多因素方差分析 用Insight作多因素方差分析并进行说明,1、在Insight中打开PESTCIDE;2、由于在Insight中,要求方差分析中的自变量必须是列名型的,故先把变量BLOCK的测量水平由区间型改为列名型;3、分析(Analyze)拟合(Fit)(X Y),规定分类变量(因素)BLOCKX,BLENDX,规定响应变量(指标)PCTLOS

27、S Y;在随即显示的分析结果中的几张表的含义与单因素方差分析相应的表的功能是类似的:,51,多因素方差分析 用Insight作多因素方差分析并进行说明,第一张表提供了模型的一般信息.,第二张表列举了作为分类变量的BLOCK和BLEND的水平的信息:,52,多因素方差分析 用Insight作多因素方差分析并进行说明,第三张参数信息表给出了标识变量P_i的定义:当BLOCK=1时,P_2=1,而P_3=0,P_4=0;否则P_2=0, 而某个P_i=1(i=3或4).其他类似;当BLEND=A时,P_5=1,而其余P_i=0(i=6,7,8,9);否则P_5=0,而某个P_i=1 (i=6).其他

28、类似.,当BLOCK=2,BLEND=C时,P31,P71, 其余的Pi=0(i=2,4,5,6,8,9),53,多因素方差分析 用Insight作多因素方差分析并进行说明,第四张表给出了模型方程:利用参数信息表中标识变量的定义可以推算出在各个因素不同水平下变量PCTLOSS均值的估计信息。,比如当BLOCK=1,BLEND=A时,变量PCTLOSS均值的估计值为19.16-0.8-1.8333=16.5267.当BLOCK=3,BLEND=E时,变量PCTLOSS均值的估计值为19.16.,54,多因素方差分析 用Insight作多因素方差分析并进行说明,两因素方差分析对应的一般线性模型为(

29、l=3,m=5):,55,多因素方差分析 用Insight作多因素方差分析并进行说明,第五张拟合汇总表中: 提供了变量PCTLOSS的全部观测的样本均值为17.54,判定系数为0.6538等;,比如当BLOCK=1,BLEND=A时,变量PCTLOSS均值的估计值为19.16-0.8-1.8333=16.5267.,56,多因素方差分析 用Insight作多因素方差分析并进行说明,在第六张方差分析表中:检验模型显著性的F统计量为2.52,相应的p值为0.1133 0.05=;所以无法拒绝BLEND和BLOCK对分析变量(指标)PCTLOSS无显著影响的假设,即模型是不显著的.,57,多因素方差

30、分析 用Insight作多因素方差分析并进行说明,在第七张型(各因素效应)检验表中:进一步将模型平方和分解为属于BLOCK和BLEND的平方和。在模型显著的情况下常需要进一步分析两个因素是否都有显著影响或者只有一个因素是显著的,这时就需要用到这张表提供的信息。在这里两个因素的p值都大于0.05,再一次说明了这两个因素对指标PCTLOSS都无显著影响。,58,多因素方差分析 用Insight作多因素方差分析并进行说明,第九张表为参数(均值或效应)的估计表.,59,多因素方差分析 用Insight作多因素方差分析并进行说明,第九张参数估计表(l=3,m=5):参数估计表也是根据标识变量的定义,对参

31、数或不同水平下参数之差进行估计和检验.例如第一行是对BLOCK=3,BLEND=E水平下均值35(lm)的估计和检验;第二行是BLOCK=1,BLEND=E水平下的均值15与BLOCK=3, BLEND=E水平下的均值35之差15的估计与检验.根据t 统计量的p值来检验两个水平下均值是否有显著差异.,60,多因素方差分析 用Insight作多因素方差分析并进行说明,考察模型假定:在显示窗的底部有一个残差对预测值的散点图,可以象单因素分析一样考察残差分布的正态性假定.,61,多因素方差分析 用分析员应用作多因素方差分析,在分析员应用环境下调入数据后,选:统计方差分析(ANOVA)因子方差分析,P

32、CTLOSS Dependent,BLEND、BLOCK Independent;若要得到用图形表示的两个因素不同水平下均值和标准差的信息,可按 Plots键,在Means Plots框中选上Plots Dependent Means for Main Effects(作主效应响应均值图)。,62,多因素方差分析 用编程作多因素方差分析,data pestcide;input block blend $ pctloss ;cards; 1 B 18.2 1 A 16.3 1 C 17.0 1 E 18.3 1 D 15.1 2 A 16.5 2 E 18.3 2 B 19.2 2 C 18.1

33、 2 D 16.0 3 B 17.1 3 D 17.8 3 C 17.3 3 E 19.8 3 A 17.5 ;,Proc anova data=pestcide;class block blend;model pctloss= block blend; Run; Quit; (anova21.sas),63,多因素方差分析 用编程作多因素方差分析,由方差分析表可得出 模型的均方 MSM=2.2006667误差的均方 MSE=0.874(作为2的估计) F 统计量的值为2.52 ,相应的显著性概率值p=0.11330.05, 这表明在=0.05的水平下不能否定Block和Bland对指标没有显

34、著影响的假设(i=0且j=0).,64,多因素方差分析 用编程作多因素方差分析,由各因素效应检验的结果可得出 检验H0:1 =2 = =l =0 ,F 统计量的值为0.94,相应的显著性概率值p=0.42890.05, 这表明在=0.05的水平下不能否定Block对指标没有显著影响的假设. 检验H0:1 =2 = =m =0 ,F 统计量的值为3.31 ,相应的显著性概率值p=0.07050.05, 这表明在=0.05的水平下不能否定Bland对指标没有显著影响的假设. 两个因素中Bland比Block重要些(0.070.42),65,多因素方差分析 存在交互作用的多因素方差分析,在多因素的问

35、题中,例如考察添加剂和工艺条件对产品产量的影响,不同的添加剂会要求不同的工艺条件,在一种工艺条件下有效的添加剂,在另一种工艺条件下可能是完全无效的.这种现象,就是两者对产量的影响不是两者效果的简单叠加,而是两种因素不同水平之间的搭配对产量有影响.在方差分析中称为两个因素存在交互作用.,66,多因素方差分析 存在交互作用的多因素方差分析例2.2,例2.2(肥料和种子对产量的影响):在数据集DST.FCTORIAL中,记录了不同的种子处理方法和不同施肥水平对农作物产量的影响.变量YIELD表示产量,METHOD和VARIETY分别表示处理方法和施肥水平.关心的是这两个因素对产量的影响,在这个例子中

36、,不同的种子处理方法对不同的施肥水平可能有不同的反应,所以要考虑存在交互作用的模型.,67,多因素方差分析 存在交互作用的多因素方差分析,对于存在交互作用的观测 Xijk,采用以下的模型:Xijk = + i + j + ij + ijk , (1kn,1il,1jm ) 其中表示平均的效应,i 和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应,ij 表示因素A的第i个水平和因素B的第j个水平交互作用的附加效应.ijk为误差,这里也假定它是独立的并且是等方差的正态分布.,68,多因素方差分析 存在交互作用的多因素方差分析,为了说明交互作用有无显著影响,就是要检验如下假设:H0:11

37、 =12 = =lm = 0 ,H1:11 、12 、 、lm不全为零;所以在多因素方差分析中,在多因素无交互作用方差分析所作检验的基础上,还要加上对有无交互作用的检验.,69,多因素方差分析 用分析员应用作多因素方差分析例2.2,在分析员应用环境下调入数据后,选: 1、统计方差分析因子方差分析,YIELDDependent,METHOD、VARIETYIndependent; 2、点击Model,在弹出的建模菜单中选:点 Standard Models选Effects up to 2-way interactions。注意表示交互作用的VARIETY*METHOD加入了模型效应拦。显示的结果

38、也包含方差分析表和汇总信息。,70,多因素方差分析 用分析员应用作多因素方差分析例2.2,方差分析表,汇总信息,型检验表 -各因素效 应的检验,71,多因素方差分析 用分析员应用作多因素方差分析例2.2,处理方法和施肥水平的产量均值图,72,多因素方差分析 用编程作多因素方差分析例2.2,(anova22.sas),data fctorial;input method $ variety yield ;cards;A 1 22.1 A 1 24.1 A 1 19.1 A 1 22.1 A 1 25.1C 5 14.3 C 5 21.3 C 5 6.3 C 5 7.8 C 5 13.8; pro

39、c anova data= fctorial;class method variety ;model yield= method variety method* variety ;means method|variety; run; quit;,73,多因素方差分析 用编程作多因素方差分析例2.2,74,多因素方差分析 用编程作多因素方差分析例2.2,75,多因素方差分析 用编程作多因素方差分析例2.2,结论: (1)由方差分析表可得出:F 统计量的值为4.87,相应的显著性概率值p0.00010.05, 这表明在=0.05的水平下有足够证据否定两因素及交互作用对指标没有显著影响的假设.(2)

40、 由各因素效应检验的结果可得出: 对因素METHOD检验H0:1 =2 = =l =0 (l=3) F 统计量的值为24.25,相应的显著性概率值pA 0.00010.05, 这表明在=0.05的水平下有足够证据否定因素A对指标没有显著影响的假设(即因素A对指标影响显著).,76,多因素方差分析 用编程作多因素方差分析例2.2, 对因素VARIETY检验H0:1=m=0 (m=5) F 统计量的值为0.14,相应的显著性概率值pB=0.9648 0.05, 这表明在=0.05的水平下不能否定因素VARIETY对指标没有显著影响的假设(即对指标没有影响显著). 检验H0:11 =12 = =lm

41、 = 0 ,F 统计量的值为2.38,相应的显著性概率值pA*B=0.0241 0.05, 这表明在=0.05的水平下可以否定两因素的交互作用对指标没有显著影响的假设(即有交互作用).,77,多因素方差分析 用编程作多因素方差分析例2.2,(3) 因交互效应METHOD*AARIETY对指标的影响显著,寻找最佳生产条件时:比较因素METHOD各水平的均值,最大者(23.01)即为从因素METHOD中选出最佳的生产水平(A);比较METHOD*AARIETY各水平的均值,最大者(25.9667)即选出最佳的生产水平(A*4); 则最佳的生产条件为:处理方法为A,且施肥水平为第4种,其产量均值为2

42、5.9667.,78,多因素方差分析 用编程作多因素方差分析例2.3,(anova23.sas),例2.3(橡胶配方试验):在某种橡胶配方中,考虑了三种不同的促进剂(A),四种不同份量的氧化锌(B),相同的配方试验两次,测得指标(300%的定强)如下表:,B1 B2 B3 B4 A1 31,33 34,36 35,36 39,38 A2 33,34 36,37 37,39 38,41 A3 35,37 37,38 39,40 42,44,试问:因素,以及它们的交互作用对指标有无显著的影响?什么是主要矛盾?最佳的生产条件是什么?,79,多因素方差分析 用编程作多因素方差分析例2.3,(anova

43、23.sas),解: () 首先生成数据集D23.,Data d23(drop=i);infile datalines dlm= , ;do a=A1 A2, A3;do b= B1, B2, B3, B4;do i=1,2;input y ; output;end; end;end;datalines ;31,33 34,36 35,36 39,3833,34 36,37 37,39 38,4135,37 37,38 39,40 42,44;,80,多因素方差分析 用编程作多因素方差分析例2.3,(2) 调用ANOVA过程(或GLM)进行方差分析.,proc anova data=d23;

44、/* 或proc glm data=d23;*/class a b;model y=a|b; /* 等价于 model a b a*b; */means a | b; run; quit;,(anova23.sas),方 差 分 析 表,81,多因素方差分析 用编程作多因素方差分析例2.3,因素各水平均值的估计值,汇总统计量,主效应和交互 效应的平方和 及检验.,82,多因素方差分析 用编程作多因素方差分析例2.3,83,多因素方差分析 用编程作多因素方差分析例2.3,结论: (1)由方差分析表可得出:F 统计量的值为12.06,相应的显著性概率值p0.00010.05, 这表明在=0.05的

45、水平下有足够证据否定两因素及交互作用对指标没有显著影响的假设.(2) 由各因素效应检验的结果可得出: 对因素A检验H0:1 =2 = =l =0 (l=3) ,F 统计量的值为19.40,相应的显著性概率值pA=0.00020.05, 这表明在=0.05的水平下有足够证据否定因素A对指标没有显著影响的假设(即因素A对指标影响显著).,84,多因素方差分析 用编程作多因素方差分析例2.3, 对因素B检验H0:1=2=m=0 (m=4) ,F 统计量的值为30.20,相应的显著性概率值pB0.00010.05, 这表明在=0.05的水平下有足够证据否定因素B对指标没有显著影响的假设(即因素A对指标

46、影响显著). 检验H0:11 =12 = =lm = 0 ,F 统计量的值为0.54,相应的显著性概率值pA*B=0.76650.05, 这表明在=0.05的水平下不能否定因素A和B的交互作用对指标没有显著影响的假设(即没有交互作用).,85,多因素方差分析 用编程作多因素方差分析例2.3, 因为pB 0.0001pA =0.0002,这表明在两个因素中因素B比因素A重要些.(3) 因交互效应A*B对指标的影响不显著,寻找 最佳生产条件时:比较因素A各水平的均值,由最大值(39)即可从因素A中选出最佳的生产水平(A3);比较因素B各水平的均值,由最大值(40.333)即可从因素B中选出最佳的生

47、产水平(B4); 则最佳的生产条件为A3,B4(均值为43).,86,均值估计与比较 概 述,在方差分析中,不论是单因素或多因素的实验结果,都是检验关于参数的一个整体的假设.若原假设被拒绝,表明某个因素各个水平下的响应有显著差异或因素间存在交互影响,但并不了解某两个水平下响应是否有差异.所以在方差分析后,还常需要对各水平下响应的均值进行估计和比较.,87,均值估计与比较 用分析员应用进行均值比较-单因素方差分析的均值比较, 在分析员应用中打开 VENNER; 统计 方差分析 单向方差分析,BRAND Independent, WEAR Dependent; 点击Means键 Comparisons: 在主效应栏选BRAND,在弹出的比较方法菜单中选择一种比较法,例如Tukeys HSD Add;,88,均值估计与比较 用分析员应用进行均值比较-单因素方差分析的均值比较,89,均值估计与比较 使用Tucky的诚实显著差异(HSD)检验法的结果,它先提示这一检验法是控制整体的第一类错误的,但它的第二类错误一般比REGWQ方法要高。然后指出根据所用的方法,均值间显著差异最小值为0.3152,即不同水平间均值之差超过0.3152,就表明这两个水平下的均值是有显著差异的。在接着的一张表中,不同水平下响应变量的均值自大至小排成一列,无显著效应的水平在左侧用同一字母标出。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报