收藏 分享(赏)

概率论与数理统计第九章 方差分析.doc

上传人:eco 文档编号:5686024 上传时间:2019-03-12 格式:DOC 页数:21 大小:480.50KB
下载 相关 举报
概率论与数理统计第九章 方差分析.doc_第1页
第1页 / 共21页
概率论与数理统计第九章 方差分析.doc_第2页
第2页 / 共21页
概率论与数理统计第九章 方差分析.doc_第3页
第3页 / 共21页
概率论与数理统计第九章 方差分析.doc_第4页
第4页 / 共21页
概率论与数理统计第九章 方差分析.doc_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、第九章 方差分析在生产过程和科学实验中,我们经常遇到这样的问题:影响产品产量、质量的因素很多.例如,在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等.我们需要通过观察或试验来判断哪些因素对产品的产量、质量有显著的影响.方差分析(Analysis of variance)就是用来解决这类问题的一种有效方法.它是在 20 世纪 20 年代由英国统计学家费舍尔首先使用到农业试验上去的.后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面.第一节 单因素试验的方差分析在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素.因素可分为两类,一类是

2、人们可以控制的;一类是人们不能控制的.例如,原料成分、反应温度、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的.以下我们所说的因素都是可控因素,因素所处的状态称为该因素的水平.如果在一项试验中只有一个因素在改变,这样的试验称为单因素试验,如果多于一个因素在改变,就称为多因素试验.本节通过实例来讨论单因素试验.1.数学模型例 9.1 某试验室对钢锭模进行选材试验.其方法是将试件加热到 700后,投入到20的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好.试验结果如表 9-1.表 9-1材质分类试验号A1 A2 A3 A41 160 158 146 1512 16

3、1 164 155 1523 165 164 160 1534 168 170 162 1575 170 175 164 1606 172 166 1687 180 1748 182试验的目的是确定 4 种生铁试件的抗热疲劳性能是否有显著差异.这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4 种不同的材质表示钢锭模的 4 个水平,这项试验叫做 4 水平单因素试验.例 9.2 考察一种人造纤维在不同温度的水中浸泡后的缩水率,在 40,50,90的水中分别进行 4 次试验.得到该种纤维在每次试验中的缩水率如表 92.试问浸泡水的温度对缩水率有无显著的影响?表 9-2 (% )温度试验号4

4、0 50 60 70 80 901 4.3 6.1 10.0 6.5 9.3 9.52 7.8 7.3 4.8 8.3 8.7 8.83 3.2 4.2 5.4 8.6 7.2 11.44 6.5 4.1 9.6 8.2 10.1 7.8这里试验指标是人造纤维的缩水率,温度是因素,这项试验为 6 水平单因素试验.单因素试验的一般数学模型为:因素 A 有 s 个水平 A1,A 2,A s,在水平Aj(j=1,2,s)下进行 nj(nj2)次独立试验,得到如表 9-3 的结果:表 9-3水平观测值A1 A2 As样本总和样本均值总体均值x11 x12 x1sx21 x22 x2s 1n2n snT

5、1 T2 Ts xx x 1 2 s假定:各水平 Aj(j=1,2,s)下的样本 xijN( j, 2),i=1,2,nj,j=1,2,s,且相互独立.故 xij- j 可看成随机误差,它们是试验中无法控制的各种因素所引起的,记 xij- j= ij,则(9.1) .,)0(,1;,12不ij jijjij snx其中 j 与 2 均为未知参数.(9.1)式称为单因素试验方差分析的数学模型. 方差分析的任务是对于模型(9.1) ,检验 s 个总体 N( , 2),N( s, 2)的均值是否相等,即检验假设(9.2)012:;,sH 不.为将问题(9.2)写成便于讨论的形式,采用记号 = ,1s

6、jn其中 n= , 表示 , 2, s 的加权平均, 称为总平均.1sj j= j- , j=1,2,s, j 表示水平 Aj 下的总体平均值与总平均的差异.习惯上将 j 称为水平 Aj 的效应.利用这些记号,模型(9.1)可改写成:xij=+j+ij,xij 可分解成总平均、水平 Aj 的效应及随机误差三部分之和(9.1)120,().1,2;1,2.sjij ij jnNins 各 相 互 独 立假设(9.2)等价于假设(9.2)012:0;,sH 不.2.平方和分解我们寻找适当的统计量,对参数作假设检验.下面从平方和的分解着手,导出假设检验(9.2)的检验统计量.记ST= , (9.3)

7、21()jnsijix这里 ,S T 能反应全部试验数据之间的差异.又称为总变差.1jnsijxxAj 下的样本均值 . (9.4)1jnjijx注意到,2222()()()()()(ijijjjijjjijjjxxxx 而 1 11)j jn ns sijj jijji jix = 11()0.jnsjijj x记 SE= , (9.5)21()jnsijjixSE 称为误差平方和;记 SA= , (9.6)2211()()jnssj jjixnxSA 称为因素 A 的效应平方和.于是ST=SE+SA. (9.7)利用 ij 可更清楚地看到 SE,SA 的含义,记1jnsij为随机误差的总平

8、均, j=1,2,s.1jnjij于是SE= ; (9.8)2211()()j jnns sij ijji jixSA= . (9.9)2211()()ssj jj 平方和的分解公式(9.7)说明.总平方和分解成误差平方和与因素 A 的效应平方和.(9.8)式说明 SE 完全是由随机波动引起的.而(9.9)式说明 SA 除随机误差外还含有各水平的效应 j,当 j 不全为零时,S A 主要反映了这些效应的差异 .若 H0 成立,各水平的效应为零,S A 中也只含随机误差,因而 SA 与 SE 相比较相对于某一显著性水平来说不应太大.方差分析的目的是研究 SA 相对于 SE 有多大,若 SA 比

9、SE 显著地大,这表明各水平对指标的影响有显著差异.故需研究与 SA/SE 有关的统计量.3.假设检验问题当 H0 成立时,设 xijN( , 2)(i=1,2,nj;j =1,2,s)且相互独立,利用抽样分布的有关定理,我们有, (9.10)21)As, (9.11)(ESnF= F(s-1,n-s). (9.12)(1AEs于是,对于给定的显著性水平 (0FA=3.583F0.05(5,18)=2.77,故浸泡水的温度对缩水率有显著影响,但不能说有高度显著的影响.本节的方差分析是在这两项假设下,检验各个正态总体均值是否相等.一是正态性假设,假定数据服从正态分布;二是等方差性假设,假定各正态

10、总体方差相等.由大数定律及中心极限定理,以及多年来的方差分析应用,知正态性和等方差性这两项假设是合理的.第二节 双因素试验的方差分析进行某一项试验,当影响指标的因素不是一个而是多个时,要分析各因素的作用是否显著,就要用到多因素的方差分析.本节就两个因素的方差分析作一简介.当有两个因素时,除每个因素的影响之外,还有这两个因素的搭配问题.如表 9-7 中的两组试验结果,都有两个因素 A 和 B,每个因素取两个水平.表 9-7(a) 表 9-7(b)A1 A2B1B230 5070 90表 9-7(a)中,无论 B 在什么水平(B 1 还是 B2) ,水平 A2 下的结果总比 A1 下的高20;同样

11、地,无论 A 是什么水平,B 2 下的结果总比 B1 下的高 40.这说明 A 和 B 单独地各自影响结果,互相之间没有作用.表 9-7(b)中,当 B 为 B1 时,A 2 下的结果比 A1 的高,而且当 B 为 B2 时,A 1 下的结果比A2 的高;类似地,当 A 为 A1 时,B 2 下的结果比 B1 的高 70,而 A 为 A2 时,B 2 下的结果比B1 的高 30.这表明 A 的作用与 B 所取的水平有关,而 B 的作用也与 A 所取的水平有关.即 A和 B 不仅各自对结果有影响,而且它们的搭配方式也有影响.我们把这种影响称作因素 A和 B 的交互作用,记作 AB.在双因素试验的

12、方差分析中,我们不仅要检验水平 A 和 B 的作用,还要检验它们的交互作用.1.双因素等重复试验的方差分析设有两个因素 A,B 作用于试验的指标,因素 A 有 r 个水平 A1,A2,Ar,因素 B 有 s 个水平 B1,B2,Bs,现对因素 A, B 的水平的每对组合(A i,Bj),i=1,2,r;j=1,2,s 都作 t(t2)A1 A2B1 B230 50100 80ABAB次试验(称为等重复试验) ,得到如表 9-8 的结果:表 9-8B1 B2 BsA1 x111, x112, x11t x121,x122, x12t x1s1, x1s2, x1stA2 x211, x212,

13、x21t x221,x222,x22t x2s1, x2s2, x2st Ar xr11, xr12, xr1t xr21, xr22, xr2t xrs1, xrs2, xrst设 xijkN( ij, 2), i=1,2,r; j=1,2,s; k=1,2,t,各 xijk 独立.这里 ij, 2 均为未知参数.或写为(9.16).,2,1),0( ,;2不ijkijkijijk tsj 记 = , , i=1,2,r,1rsijij1sijj, j=1,2,s,1rjij, i=1,2,r, , j=1,2,s,iijj.ijijij于是 ij= + i+ j+ ij. (9.17)称

14、为总平均, i 为水平 Ai 的效应, j 为水平 Bj 的效应, ij 为水平 Ai 和水平 Bj 的交互效应,这是由 Ai,Bj 搭配起来联合作用而引起的.易知=0, =0,1ri1sj=0, j=1,2,s,1rij=0, i=1,2,r,1sij这样(9.16)式可写成因素B因 素A(9.18) . ,2,1;,;,21),0(0,11不ijk sjirijsjri ijkijjiijk tkNx其中 , i, j, ij 及 2 都为未知参数.(9.18)式就是我们所要研究的双因素试验方差分析的数学模型.我们要检验因素A,B 及交互作用 AB 是否显著.要检验以下 3 个假设:.,:

15、,0210不rH .,:,210不s .,: ,01230不rsH 类似于单因素情况,对这些问题的检验方法也是建立在平方和分解上的.记,1rstijkijxxt, i=1,2,r; j=1,2,s,1tijijk, i=1,2,r,1sti ijkjxx, j=1,2,s,1rtj ijkiST= .21()rstijkijx不难验证 分别是 , i, j, ij 的无偏估计.,ijix由 ,()()()()ijkijkijijijijxxx1ir,1js,1kt得平方和的分解式:ST=SES AS BS AB, (9.19)其中SE= ,21()rstijkijijxSA= ,1()2rii

16、stxSB= ,21()sjjrtSAB= .21()rsijijijtxxSE 称为误差平方和,S A,S B 分别称为因素 A,B 的效应平方和,SAB 称为 A,B 交互效应平方和.当 H01: 1= 2= r=0 为真时,FA= F(r-1,rs(t-1);(1)()ESrst当假设 H02 为真时,FB= F(s-1,rs(t-1);()()Esrt当假设 H03 为真时,FAB= F(r-1)(s-1),rs(t-1).(1)(1)ABESSrsrt当给定显著性水平 后,假设 H01,H 02,H 03 的拒绝域分别为:(9.20)(,);1,(1).ABtsrFst经过上面的分析

17、和计算,可得出双因素试验的方差分析表 9-9.表 9-9方差来源 平方和 自由度 均方和 F 比因素 A SA r-1 1ASrFA= ES因素 B SB s-1 BsFB= ES交互作用 SAB (r-1)(s-1) (1)AABSrsFAB= E误差 SE rs(t-1) ()Et总和 ST rst-1在实际中,与单因素方差分析类似可按以下较简便的公式来计算 ST,S A,S B,S AB,SE.记 T= ,1rstijkijxTij= , i=1,2,r; j=1,2,s,1tjkTi= , i=1,2,r,1stjkjxTj= , j=1,2,s,1rtiki即有(9.21)21212

18、21,.rstTijkijrAisBjjrsAijABiETABTSxrstttTSttStrtS例 9.5 用不同的生产方法(不同的硫化时间和不同的加速剂)制造的硬橡胶的抗牵拉强度(以 kgcm-2 为单位)的观察数据如表 9-10 所示.试在显著水平 0.10 下分析不同的硫化时间(A) ,加速剂(B)以及它们的交互作用(AB)对抗牵拉强度有无显著影响.表 9-10加速剂140下硫化时间(秒) 甲 乙 丙40608039,3643,3737,4141,3542,3939,4040,3043,3636,38解 按题意,需检验假设 H01,H02,H03.r=s=3, t=2,T,Tij,Ti

19、,Tj的计算如表 9-11.表 9-11加速剂Tij硫化时间甲 乙 丙 Ti40608075 80 7876 81 7970 79 74233236223Tj 221 240 231 692ST= =178.44,21,rstijkijTxrstSA= =15.44,21risttSB= =30.11,21jjTrtrstSAB= =2.89,21sijABi SttSE=ST-SA-SB-SAB=130,得方差分析表 9-12.表 9-12方差来源 平方和 自由度 均方和 F 比因素 A(硫化时间)因素 B(加速剂)交互作用 AB误差15.4430.112.8913022497.7215.5

20、60.722514.44FA=0.53FB=1.04FAB=0.05总和 178.44由于 F0.10(2,9)=3.01FA,F0.10(2,9)FB,F0.10(4,9)=2.69FAB,因而接受假设 H01,H02,H03,即硫化时间、加速剂以及它们的交互作用对硬橡胶的抗牵拉强度的影响不显著.2.双因素无重复试验的方差分析在双因素试验中,如果对每一对水平的组合(A i,Bj)只做一次试验,即不重复试验,所得结果如表 9-13.表 9-13因素 B因素 AB1 B2 BsA1 A2Arx11 x12 x21 x22 xr1 xr2 x1sx2sxrs这时 =xijk,SE=0,SE 的自由

21、度为 0,故不能利用双因素等重复试验中的公式进行方差分析 .ij但是,如果我们认为 A,B 两因素无交互作用,或已知交互作用对试验指标影响很小,则可将 SAB 取作 SE,仍可利用等重复的双因素试验对因素 A,B 进行方差分析.对这种情况下的数学模型及统计分析表示如下:由(9.18)式, (9.22)112,0,(),;1,2,.ijijijrsijijkxNirjs 各 相 互 独 立要检验的假设有以下两个: .,:,0210不rH .,:,210不s 记 111,rs rijij ijixxxx平方和分解公式为:ST=SA+SB+SE, (9.23)其中 221 1(),(),rs sTi

22、j iij jxx2 211(),(),s rsBjEijijj ijSrSx 分别为总平方和、因素 A,B 的效应平方和和误差平方和.取显著性水平为 ,当 H01 成立时,FA= F(r-1),(r-1)(s-1),()AEsSH01 拒绝域为FAF (r-1),(r-1)(s-1). (9.24)当 H02 成立时,FB= F(s-1),(r-1)(s-1),(1)BESH02 拒绝域为FBF (s-1),(r-1)(s-1). (9.25)得方差分析表 9-14.表 9-14方差来源 平方和 自由度 均方和 F 比因素 A因素 B误差SASBSEr-1s-1(r-1)(s-1)SA= S

23、B=1rFA= ES1BSsSE= ()rFB= ES总和 ST rs-1例 9.6 测试某种钢不同含铜量在各种温度下的冲击值(单位:kgmcm -1) ,表 9-15 列出了试验的数据(冲击值) ,问试验温度、含铜量对钢的冲击值的影响是否显著?( =0.01)表 9-15铜含量冲击值试验温度0.2% 0.4% 0.8%200-20-4010.67.04.24.211.611.16.86.314.513.311.58.7解 由已知,r=4, s=3,需检验假设 H01,H02,经计算得方差分析表 9-16.表 9-16方差来源 平方和 自由度 均方和 F 比温度作用铜含量作用试验误差64.58

24、60.745.4332621.5330.370.90523.7933.56总和 130.75 11由于 F0.01(3,6)=9.78FA,拒绝 H01.F0.01(2,6)=10.92F B,拒绝 H02.检验结果表明,试验温度、含铜量对钢冲击值的影响是显著的.第三节 正交试验设计及其方差分析在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验) ,多因素试验由于要考虑的因素较多,当每个因素的水平数较

25、大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表正交表,来安排试验,通过少量的试验,获得满意的试验结果.1.正交试验设计的基本方法正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.正交表是预先编制好的一种表格.比如表 9-17 即为正交表 L4(23),其中字母 L 表示正交,它的 3 个数字有 3 种不同的含义:表 9-17列号试验号1 2 312341 1 11 2 22 1 22 2 1(1) L4(23)表的结构:有 4 行、3

26、列,表中出现 2 个反映水平的数码 1,2.列数L4 (2 3) 行数 水平数(2) L4(23)表的用法:做 4 次试验,最多可安排 2 水平的因素 3 个.最多能安排的因素数L4 (23) 试验次数 水平数(3) L4(23)表的效率:3 个 2 水平的因素.它的全面试验数为 23=8 次,使用正交表只需从 8 次试验中选出 4 次来做试验,效率是高的.L4 (23) 实际试验数 理论上的试验数正交表的特点:(1) 表中任一列,不同数字出现的次数相同.如正交表 L4(23)中,数字 1,2 在每列中均出现 2 次.(2) 表中任两列,其横向形成的有序数对出现的次数相同.如表 L4(2 3)

27、中任意两列,数字 1,2 间的搭配是均衡的.凡满足上述两性质的表都称为正交表(Orthogonal table).常用的正交表有 L9(3 4) ,L 8(2 7) ,L 16(4 5)等,见附表 .用正交表来安排试验的方法,就叫正交试验设计.一般正交表 Lp(n m)中,p=m( n-1)+1.下面通过实例来说明如何用正交表来安排试验.例 9.7 提高某化工产品转化率的试验.某种化工产品的转化率可能与反应温度 A,反应时间 B,某两种原料之配比 C 和真空度 D 有关.为了寻找最优的生产条件,因此考虑对 A,B, C,D 这 4 个因素进行试验.根据以往的经验,确定各个因素的 3 个不同水平

28、,如表 9-18 所示 .表 9-18水平因素1 2 3A:反应温度() 60 70 80B:反应时间(小时) 2.5 3.0 3.5C:原料配比 1.11 1.151 1.21D:真空度(毫米汞柱) 500 550 600分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件.解 本题是 4 因素 3 水平,选用正交表 L9(3 4).表 9-19列号水平试验号A B C D1 2 3 41234567891 1 1 11 2 2 21 3 3 32 1 2 32 2 3 12 3 1 23 1 3 23 2 1 33 3 2 1把表头上各因素相应的水平任意给一个水平号.本例的水平编号

29、就采用表 9-18 的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到 9 个试验方案,如表 9-20所示.表 9-20列号水平试验号A B C D1 2 3 41234567891(60) 1(2.5) 1(1.1:1) 1(500)1 2(3.0) 2(1.15:1) 2(550)1 3(3.5) 3(1.2:1) 3(600)2(70) 1 2 32 2 3 12 3 1 23(80) 1 3 23 2 1 33 3 2 1从表 9-20 看出,第一行是 1 号试验,其试验条件是:反应温度为 60,反应时间为 2.5 小时,原料配比为 1.11,真空度为 500 毫米汞柱,

30、记作 A1B1C1D1.依此类推,第 9 号试验条件是 A3B3C2D1.由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表 9-20 安排试验,试验的结果依次记于试验方案右侧,见表 9-21.表 9-21列号水平试验号A B C D 试验结果(%)1234567891(60) 1(2.5) 1(1.1:1) 1(500)1 2(3.0) 2(1.15:1) 2(550)1 3(3.5) 3(1.2:1) 3(600)2(70) 1 2 32 2 3 12 3 1 23(80) 1 3 23 2 1 33 3 2 13837765150824455862.试验结果的

31、直观分析正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.例 9.7 中试验结果转化率列在表 9-21 中,在 9 次试验中,以第 9 次试验的指标 86 为最高,其生产条件是 A3B3C2D1.由于全面搭配试验有 81 种,现只做了 9 次.9 次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析.(1) 极差计算在代表因素 A 的表 9-21 的第 1 列中,将与水平“1”相对应的第 1,2,3 号 3 个试验结果相加,记作 T11,求得 T11=151.同样,将第 1

32、列中与水平 “2”对应的第 4,5,6 号试验结果相加,记作 T21,求得 T21=183.一般地,定义 Tij 为表 9-21 的第 j 列中,与水平 i 对应的各次试验结果之和(i=1,2,3; j=1,2,3,4).记 T 为 9 次试验结果的总和,R j 为第 j 列的 3 个 Tij 中最大值与最小值之差,称为极差.显然 T= ,j=1,2,3,4.31i此处 T11 大致反映了 A1 对试验结果的影响,T21 大致反映了 A2 对试验结果的影响,T31 大致反映了 A3 对试验结果的影响,T12,T 22 和 T32 分别反映了 B1,B 2,B 3 对试验结果的影响,T13,T

33、23 和 T33 分别反映了 C1,C 2,C 3 对试验结果的影响,T14,T 24 和 T34 分别反映了 D1,D 2,D 3 对试验结果的影响 .Rj 反映了第 j 列因素的水平改变对试验结果的影响大小,R j 越大反映第 j 列因素影响越大.上述结果列表 9-22.表 9-22T1j T2j T3j151 133 175 174183 142 174 163185 244 170 182T=519Rj 34 111 5 19(2) 极差分析(Analysis of range)由极差大小顺序排出因素的主次顺序:主次B;A、D;C这里,R j 值相近的两因素间用 “、 ”号隔开,而 R

34、j 值相差较大的两因素间用 “;”号隔开.由此看出,特别要求在生产过程中控制好因素 B,即反应时间.其次是要考虑因素 A和 D,即要控制好反应温度和真空度 .至于原料配比就不那么重要了.选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例 9.7 中,希望转化率越高越好,所以应在第 1 列选最大的 T31=185;即取水平 A3,同理可选 B3C1D3.故例 9.7 中较好的因素水平搭配是 A3B3C1D3.例 9.8 某试验被考察的因素有 5 个:A,B,C,D ,E.每个因素有两个水平.选用正交表 L8(27)

35、,现分别把 A,B,C ,D ,E 安排在表 L8(27)的第 1,2,4,5,7 列上,空出第3,6 列仿例 9.7 做法,按方案试验.记下试验结果,进行极差计算,得表 9-23.表 9-23列号水平试验号A B C D E1 2 3 4 5 6 7试验结果123456781 1 1 1 1 1 11 1 1 2 2 2 21 2 2 1 1 2 21 2 2 2 2 1 12 1 2 1 2 1 22 1 2 2 1 2 12 2 1 1 2 2 12 2 1 2 1 1 2141317178101115T1jT2j61 45 53 50 56 54 5244 60 52 55 49 51

36、 53T=105Rj 17 15 1 5 7 3 1试验目的要找出试验结果最小的工艺条件及因素影响的主次顺序.从表 9-23 的极差 Rj的大小顺序排出因素的主次顺序为主 次A、B ;D;C、E最优工艺条件为 A2B1C1D2E1.表 9-23 中因没有安排因素而空出了第 3,6 列.从理论上说,这两列的极差 Rj 应为 0,但因存有随机误差,这两个空列的极差值实际上是相当小的.3.方差分析正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.设有一试验,使用正交表 Lp(nm),试验的 p 个结果为 y1,y2,

37、yp,记T= , = ,1iy1iTST= 21()piiy为试验的 p 个结果的总变差;Sj=2211nnij ijiTTrprp为第 j 列上安排因素的变差平方和,其中 r=p/n.可证明ST= 1mij即总变差为各列变差平方和之和,且 ST 的自由度为 p-1,S j 的自由度为 n-1.当正交表的所有列没被排满因素时,即有空列时,所有空列的 Sj 之和就是误差的变差平方和 Se,这时 Se的自由度 fe 也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取 Sj中的最小值作为误差的变差平方和 Se.从以上分析知,在使用正交表 Lp(nm)的正交试验方差分析中,对正交表所

38、安排的因素选用的统计量为:F= .1jef当因素作用不显著时,FF(n-1,fe),其中第 j 列安排的是被检因素 .在实际应用时,先求出各列的 Sj/(n-1)及 Se/fe,若某个 Sj/(n-1)比 Se/fe 还小时,则这第 j 列就可当作误差列并入 Se 中去,这样使误差 Se 的自由度增大,在作 F 检验时会更灵敏,将所有可当作误差列的 Sj 全并入 Se 后得新的误差变差平方和,记为 Se ,其相应的自由度为 fe ,这时选用统计量F= F(n-1,fe ).1jenfA例 9.9 对例 9.8 的表 9-23 作方差分析 .解 由表 9-23 的最后一行的极差值 Rj,利用公式

39、 Sj= ,得表 9-24.21nijTrp表 9-24A B C D E1 2 3 4 5 6 7Rj 17 15 1 5 7 3 1Sj 36.125 28.125 0.125 3.125 6.125 1.125 0.125 ST=74.875表 9-24 中第 3,6 列为空列,因此 Se=S3+S6=1.250,其中 fe=1+1=2,所以 Se/fe=0.625,而第7 列的 S7=0.125,S 7/f7=0.1251=0.125 比 Se/fe 小,故将它并入误差.Se =Se+S7=1.375,fe =3.整理成方差分析表 9-25.表 9-25方差来源 Sj fj jfF=

40、jeSfA显著性A 36.125 1 36.125 78.818B 28.125 1 28.125 61.364C 3.125 1 3.125 6.818D 6.125 1 6.125 13.364E 0.125 1 0.125e 1.1250 2 0.625e 1.375 3 0.458由于 F0.05(1,3)=10.13, F0.01(1,3)=34.12,故因素 A,B 作用高度显著,因素 C 作用不显著,因素 D 作用显著,这与前面极差分析的结果是一致的 .F 检验法要求选取 Se,且希望 fe 要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素 A 和 B

41、的交互作用 AB.这类交互作用在正交试验设计中同样有表现,即一个因素 A 的水平对试验结果指标的影响同另一个因素 B 的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.小 结本章介绍了数理统计的基本方法之一:方差分析.在生产实践中,试验结果往往要受到一种或多种因素的影响.方差分析就是通过对试验数据进行分析,检验方差相同的多个正态总体的均值是否相等,用以判断各因素对试验结果的影响是否显著.方差分析按影响试验结果的因素的个数分为单因素方差分析、双因素方差分析和多因素方差分析.1. 单因素方差分析的情况 .试验数据总是参差不齐,我们用总偏差平方和 ST=来度量数据

42、间的离散程度.将 ST 分解为试验随机误差的平方和(S E)与因素 A21()jnsijix的偏差平方和(S A)之和.若 SA 比 SE 大得较多,则有理由认为因素的各个水平对应的试验结果有显著差异,从而拒绝因素各水平对应的正态总体的均值相等这一原假设.这就是单因素方差分析法的基本思想.2. 双因素方差分析的基本思想类似于单因素方差分析.但双因素试验的方差分析中,我们不仅要检验因素 A 和 B 各自的作用,还要检验它们之间的交互作用.3. 正交试验设计及其方差分析.根据因素的个数及各个因素的水平个数,选取适当的正交表并按表进行试验.我们通过对这少数的试验数据进行分析,推断出各因素对试验结果影响的大小.对正交试验结果的分析,通常采用两种方法,一种是直观分析法(极差分析法),它通过对各因素极差 Rj 的排序来确定各因素对试验结果影响的大小.一种是方差

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报