1、第十讲 正交设计法(上),正交设计的诞生,上世纪30年代,由于农业试验的需要,费歇 (R. A. Fisher) 在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。 上世纪60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化 。,为什么去农学院的人很少?,应用背景,一般方法三因素三水平1.孤立变量法特点:较少的实验缺点:交互作用没有考虑;大量实验未做;没有分析误差的影响。2.全面实验实验工作量大;信息不准确。,科学实验设计尽量少的试验数目获得可信结果;考虑到交互作用;可以进行误差分析。,3 因 素 3 水 平 的 全 面试验水平组合数为33=27,
2、4 因素3水平的全面试验水平组合数为34=81 ,5因素3水平的全面试验水平组合数为35=243,这在科学试验中是有可能做不到的。,正交试验法解决什么问题? 如何用正交表安排实验? 怎样分析实验结果? 具有交互作用的正交试验如何安排? 正交表是如何构造来的?,La(bc),讲课内容,1、正交试验的基本知识 2、正交试验的极差分析方法 3、正交试验数据的方差分析方法,1、正交试验的基本知识,正交试验法就是一种科学地安排与分析多因素试验的方法。 科学安排试验的方法应做到:(1)尽可能地减少试验次数;(2)分析出指导实践的正确结论,并能得到较好的结果。,1.1 术语和符号:,指标:试验要考察的结果称
3、为指标。如产品的性能、质量、成本、产量等。数量指标和非数量指标 因素:试验中要考察的对试验指标可能有影响的因素称为因素。 水平:每个因素在试验中要比较的具体条件称为水平。,1.2 概念,正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。 它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。,例:要考察固溶温度、回火温度和回火时间对热处理的影响。每个因素设置3个水平进行试验 。 A因素是固溶温度, B因素是回火温度, C因素为回火时间,分别设3个水平。全部可能组合有27种 。 全面试验:可以分析各因素
4、的效应和交互作用,也可选出最优水平组合。但全面试验包含的水平组合数较多,工作量大,在有些情况下无法完成 。 若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。,1.3 特点,基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 因为正交试验是用部分试验来代替全面试验的,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交试验设计有上述不足,但它能通过部分试验找到最优水平组合,因而受到实际工作者青睐。,1.4 原理,在试验安排中 ,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格 ,如
5、果网上的每个点都做试验,就是全面试验。3个因素的选优区可以用一个立方体表示,3个因素各取 3个水平,把立方体划分成27个格点,反映在 图10-1上就是立方体内的27个“.”。若27个网格点都试验,就是全面试验。,立方体上共有9 个面,设对应于A1、A2、A3的是左、中、右三个面;对应于B1、B2、B3的是下、中、上三个面;对应于C1、C2、C3的是前、中、后三个面。,正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即: (1)A1B1C1 (2)A2B1C
6、2 (3)A3B1C3 (4)A1B2C2 (5)A2B2C3 (6)A3B2C1 (7)A1B3C3 (8)A2B3C1 (9)A3B3C2,上述选择 ,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次 。对于A、B、C 3个因素来说,是在27个全面试验点中选择9个试验点 ,仅是全面试验的 三分之一。 从图中可以看到 ,9个试验点在选优区中分布是均衡的,在立方体的每个平面上 ,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。 9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。,1.5 正交表,表10-1,常用的正交表已由数学工作
7、者制定出来,供进行正交设计时选用。2水平正交表除L8(27)外,还有L4(23)、L16(215)等;3水平正交表有L9(34)、L27(313)等.,正交表的基本性质,1)正交性 任一列中,各水平都出现,且出现的次数相等。 任两列之间各种不同水平的所有可能组合都出现,且组合对出现的次数相等 。 例如 L8(27)中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9(34) 中 (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平
8、所有可能组合次数相等,表明任意两列各个数字之间的搭配是均匀的。,2)代表性 一方面:任一列的各水平都出现,使得部分试验中包括了所有因素的所有水平;任两列的所有水平组合都出现,使任意两因素间的试验组合为全面试验。 另一方面:由于正交表的正交性,正交试验的试验点必然均衡地分布在全面试验点中,具有很强的代表性。因此,部分试验寻找的最优条件与全面试验所找的最优条件,应有一致的趋势。,正交表的基本性质,用正交表安排的试验,具有均衡分散和整齐可比的特点。 (1) 整齐可比性:每个字码出现的机会是完全相等的。 (2) 均衡分散性:任意两列间横向组合的数字对搭配是均衡的。,正交性是核心和基础,代表性是正交性的
9、必然结果。,列号,水平,试验号,1,2,3,4,2、正交试验的基本分析方法,2.1 数量指标和非数量指标 2.2 正交试验的作用 2.3 正交试验的基本程序,2.1 非数量指标,衡量试验结果的指标用具体的数量来表示的,称为数量指标或定量指标。 很多试验指标并不是数量指标,例如电镀件的镀层外观是根据颜色、光泽和结晶粗细等来评定的,这些指标称为非数量指标。 非数量指标的确定方法:评分法、统计合格率法。,评分法,是对非数量指标评分,评分后便可以当数量指标来处理。评分方法以及评分等级要根据具体情况而定,在可能做到的前提下,等级划分的越细越好。 1)试验现场边试验边评分。 2)集体评分法:集体商议,得到
10、评分。 3)公议标准,重复评分:在公议标准基础上,各自独立评分,然后取平均值作为最终得分。,非数量指标评分法,统计合格率法,适用于那些指标只能区分为两个等级的试验,例如合格品和废品。,2.2 正交试验的作用,正交试验法是一种能够帮助人们选择一部分有代表性的试验方案,并给出了科学地分析试验结果的方法,它能够回答下面的四个问题: (1)因素的主次:哪个因素是最主要的,哪个是次要的,哪个是最次要的。 (2)因素与指标的关系 (3)什么是较好的试验条件 (4)进一步试验的方向,2.3 正交试验的基本程序,正交试验的基本程序包括:试验方案设计试验结果分析,试验目的与要求,试验指标,选因素、定水平,选择合
11、适正交表,表头设计,列试验方案,试验方案设计,试验结果分析,选因素、定水平,列因素水平表,一般确定试验因素时,应以对试验指标影响大的因素、尚未考察过的因素、尚未完全掌握其规律的因素为先。 每个因素的水平,一般以2-4个水平为宜。对主要考察的试验因素,可以多取水平,但不宜过多(6),否则试验次数骤增。 因素的水平间距,应根据专业知识和已有的资料,尽可能把水平值取在理想区域。,正交表的选择原则,1)尽可能选用较小的正交表。 2)试验因素的水平数一般应等于正交表中的水平数 3)因素个数(包括交互作用)应小于正交表的列数 4)各因素及交互作用的自由度之和要小于所选正交表的总自由度,La(bc),正交设
12、计,试验总次数,行数,因素水平数,因素个数,列数,等水平正交表 La(bc),4因素3水平9次实验,4个3水平因素,可以选用L9(34)或L27(313) ;因本试验仅考察四个因素对硬度的影响效果,不考察因素间的交互作用,故宜选用L9(34)正交表。若要考察交互作用,则应选用L27(313)。,列:正交表的列数c因素所占列数+交互作用所占列数+空列,正交表的总自由度(a-1)因素自由度+交互作用自由度+误差自由度,表头设计,表头设计:就是把试验因素和要考察的交互作用分别安排到正交表的各列中去的过程。 在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按所选正交表的交互作用列表安
13、排各因素与交互作用,以防止设计“混杂” 。 下节课介绍!,进行试验,记录试验结果,试验结果极差分析,计算K值,计算k值,计算极差R,绘制因素指标趋势图,优化水平,因素主次顺序,优化组合,结 论,试验结果分析,试验结果方差分析,列方差分析表,进行F 检验,计算各列偏差平方和、自由度,分析检验结果,写出结论,正交试验的基本程序,(1)根据试验目的,定指标、挑因素、选水平。 1号试验:A1B1C1D1,5号试验A2B2C3D1 (2)选择合适的正交表,排表头(把因素分别填列中,一列只排一个因素,哪一个因素排在哪一列是任意的)。 (3)将试验条件翻译成试验方案,做试验,填试验数据。 (4)分析试验数据
14、,进行极差(每一列中各个水平的最大值与最小值之差,R)分析。 (5)验证试验。,例1:钢材的热处理工艺条件试验 考核指标:布氏硬度(大、小) 考虑三个因素:淬火温度、回火温度、回火时间 根据过去积累的经验确定它们的变化范围:A淬火温度 840 860 B回火温度 410 450 C回火时间 40min80min 三水平:A淬火温度 A1=840 A2=850 A3=860B回火温度 B1=410 B2=430 B3=450C回火时间 C1= 40 C2=60 C3=80,分析,以B因子为例,B1比B2和B3好。依此类推:C2较好,A的三个水平都差不多。这三个因子中起主要作用的因子是谁? 如果因
15、子各水平下数据平均值的分散程度较大,则认为该因子对试验结果影响较大,起较为主要的作用;如果数据平均值较为集中,则对试验结果的影响较小。,极差与离差分析,两种分析方法: (1)极差分析(水平的最大值与最小值之间的差,简单)C;B;A (2)方差分析(一组数与其平均值的差的平方和叫做离差),Kjm,kjm,极差分析法R法,1. 计算,2. 判断,Rj,因素主次,优水平,优组合,Kjm为第j列因素m水平所对应的试验指标和,kjm为Kjm平均值。由kjm大小可以判断第j列因素优水平和优组合。,Rj为第j列因素的极差。Rj越大,说明该因素对试验指标的影响越大。根据Rj大小,可以判断因素的主次顺序。,极差
16、分析法,优点:简便易行,计算量少。 缺点: 没有将试验条件改变引起数据的波动与试验误差引起数据的波动区分开来; 没有提供判断因子影响是否显著的标准。极差分析出来了差别,但这种差别是否显著?,3、正交试验数据的方差分析方法,3.1 基本概念 3.2 正交试验的方差分析,方差分析基本思想是将数据的总变异分解成因素引起的变异和误差引起的变异两部分,构造F统计量,作F检验,即可判断因素作用是否显著。,3.1 方差分析,1)方差分析可以分析出试验误差的大小,从而知道试验精度;2)不仅可给出各因素及交互作用对试验指标影响的主次顺序,而且可分析出哪些因素影响显著,哪些影响不显著。3)对于显著因素,选取优水平
17、并在试验中加以严格控制;对不显著因素,可视具体情况确定优水平。,总偏差平方和各列因素偏差平方和+误差偏差平方和,(1)偏差平方和分解:,(2)自由度分解:,(3)方差:,(4)构造F统计量:,(5)列方差分析表,作F检验,若计算出的F值F0Fa,则拒绝原假设,认为该因素或交互作用对试验结果有显著影响;若F0Fa,则认为该因素或交互作用对试验结果无显著影响。,考虑正交表,第 号试验的结果记为,(同水平重复的次数),3.2 多因素试验的方差分析,误差总变动,反映了全部试验结果与均值之间的差异程度,称为总误差变动;,反映了正交表第j列所排因子的不同水平之间的差异程度,称为第j列误差变动。,第j列误差
18、总变动,行是什么、列是什么?,行是实验次数,列是因素 r=3,自由度,误差自由度n-1 第J列自由度t-1,表10-20 L9(34)正交表,分析第1列因素时,其它列暂不考虑,将其看做条件因素。,因素A第1水平3次重复测定值,因素A第2水平3次重复测定值,因素A第3水平3次重复测定值,单因素试验数据资料格式,A因素各个水平的误差S因,B因素各个水平的误差S因,C因素各个水平的误差S因,空白因素的误差S因,怎么算?为多少?,F检验,误差变动的计算,正交表应留出一定空列,空列的离差平方和(因素变动)就是误差平方和(误差变动)。当无空列时,应进行重复试验,以估计试验误差。 在实际应用中,常常先计算出各列的误差变动(因素变动),当因素变动比误差变动小时,把该因素变动加到误差变动中,使误差的自由度增大,提高灵敏度。,例1:方差分析,例1:方差分析,计算,因素水平改变引起的误差变动和系统的总误差变动进行比较!,表10-5 试验方案及试验结果,说明:试验号并非试验顺序,为了排除误差干扰,试验中可随机进行;安排试验方案时,部分因素的水平可采用随机安排。,作业:方差分析。0.01.,THE END 谢谢!,