1、实验设计的意义: 应用数理统计学的基本知识,讨论如何合理地安排试验、取得数据,然后进行综合科学分析,从而尽快获得最优组合方案。在工程学领域是改进制造过程性能的非常重要的手段。在开发新工序中亦有着广泛的应用。 在工序开发的早期应用实验设计方法能得出以下成果: 1. 提高产量; 2. 减少变异性,与额定值或目标值更为一致; 3. 减少开发时间; 4. 减少总成本;,9.1:实验设计的意义及其发展过程,9 实验设计(DOE),试验设计在科学研究中的地位与意义 :1.试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。2.科学地安排实验,以最少的人力和物力消费,在最短的时间内取得更
2、多、更好的生产和科研成果。简称为:多、快、好、省。 可应用于:提高试验效率、优化产品设计、改进工艺技术、强化质量管理。,实验设计在生产/制造过程中的位置:,生产/制造 过程,可控制因素,不可控制因素,資 源,产 品,实验设计的发展过程: 试验设计始于20世纪20年代,其发展过程大致可分为三个阶段: 1. 早期的方差分析法: 20世纪20年代由英国生物统计学 家、数学家费歇(R.A.Fisher)提出的,开始主要应用于农业、生物学、遗传学方面,取得了丰硕成果。二战期间,英、美采用这种方法在工业生产中取得显著效果; 2. 传统的正交试验设计法:以日本的田口玄一为代表; 3. 信噪比试验设计与三阶段
3、设计:1957年,田口玄一提出信噪比设计法和产品的三阶段设计法。他把信噪比设计和正交表设计、方差分析相结合,开辟了更为重要、更为广泛的应用领域。,我国试验设计方法60末期代,华罗庚教授在我国倡导与普及的“优选法”,如黄金分割法、分数法和斐波那契数列法等。数理统计学者在工业部门中普及 “正交设计”法 。 70年代中期,优选法在全国各行各业取得明显成效。1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,显然优选法和正交设计都不能用,随后,方开泰教授(中国科学院应用数学研究所)和王元院士提出 “均匀设计”法,这一方法在导弹设计中取得
4、了成效。,9.1.1试验设计的基本概念,试验设计,广义理解是指试验研究课题设计,也就是整个试验计划的拟定。主要包括课题的名称、试验目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试验结果的分析方法等。 试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。 试验设计的任务是在研究工作进行之前,根据研究项目的需要,应用数理统计原理,作出周密安排,力求用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料,通过分析得出正确的结论,明确回答研究项目所提出的问题。,试验因素,一些
5、常用术语:,指试验中人为控制的,影响试验指标的原因。,例如,在研究小麦高产栽培技术时,品种、密度、施N量等都对产量有影响,均可作试验因素,当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响,则称为两因素试验或多因素试验。,试验因素常用大写字母A、B、C等表示,因素水平,试验处理就是指实施在试验单位上的具体的项目。,在单因素试验中,实施在试验单位上的具体项目就是该因素的某一水平。例如在进行小麦品种的比较试验时,实施在试验单位上的具体项目就是种植某一品种小麦。所以,单因素试验时,试验因素的一个水平就是一个处理。,试验处理,试验因素的不同水平称为因素水平。,
6、例如比较5个小麦品种产量的高低,这5个小麦品种就是品种这个试验因素的5个水平,可记为A1,A2,A3,A4,A5。,所以,在多因素试验时,试验因素的一个水平组合就是一个处理。,亦称试验单元,是指施加试验处理的材料单位。田间试验时,试验单位通常指一个试验小区。,试验单位,在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3个小麦品种和4种播种密度的两因素试验,整个试验有3412个水平组合,实施在试验单位上的具体项目就是某小麦品种与某播种密度的结合。,干扰因素,干扰因素不是研究的主要因素,但对试验的精确性有很大的影响。,例如:在进行不同品种小麦的产量比较试验时,如果各试验小
7、区的肥力相差很大,则试验单位的一致性变得很差,造成试验误差的增大,从而会掩盖品种这个试验因素的效应。因此,土壤肥力是试验的一个干扰因素。,影响试验单位均匀一致性的对试验结果造成系统误差的因素。,一、试验计划的内容及要求,(一)课题名称与试验目的 科研课题的选择是整个研究工作的第一步。课题选择正确,此项研究工作就有了很好的开端。 选题时应注意以下几点: 1、实用性 要着眼于科研和生产中急需解决的问题,同时从发展的观点出发,适当照顾到长远或不久将来可能出现的问题。 2、先进性 在了解国内外该研究领域的进展、水平等基础上,选择前人未解决或未完全解决的问题,以求在理论、观点及方法等方面有所突破。 3、
8、创新性 研究课题要有自己的新颖之处。 4、可行性 就是完成科研课题的可能性,无论是从主观条件方面,还是客观条件方面,都要能保证研究课题的顺利进行。,(二)研究依据、内容及预期达到的经济技术指标 (三)试验方案和试验设计方法 试验方案是全部试验工作的核心部分,主要包括研究的因素、水平的确定等,具体内容详述于后。方案确定后,结合试验条件选择合适的试验设计方法。 (四)试验的数量及要求 试验选择正确与否,直接关系到试验结果的正确性。 (五)试验记录的项目与要求 (六)试验结果分析与效益估算,二、试验方案的拟定,(一)试验方案的基本概念 试验方案(experimental scheme)是指根据试验目
9、的与要求而拟定的进行比较的一组试验处理的总称。试验方案按供试因素的多少可区分为单因素试验方案、多因素试验方案。 1、单因素试验方案 单因素试验(single-factor experiment)是指整个试验中只比较一个试验因素的不同水平的试验。单因素试验方案由该试验因素的所有水平构成。这是最基本、最简单的试验方案。 2、多因素试验方案 多因素试验(multiple-factor or factorial experiment)是指在同一试验中同时研究两个或两个以上试验因素的试验。多因素试验方案由该试验的所有试验因素的水平组合(即处理)构成。多因素试验方案分为完全方案和不完全方案两类。,(1)完
10、全方案 在列出因素水平组合(即处理)时,要求每一个因素的每个水平都要碰见一次,这时,水平组合(即处理)数等于各个因素水平数的乘积。 例如以3种催化剂配方对3个原料进行试验。 两个因素分别为催化剂配方(A)、原料(B)。 催化剂配方(A)分为A1、A2、A3水平, 原料(B)分为B1、B2、B3水平。 共有A1B1、A1B2、A1B3、A2B1、A2B2、A2B3、A3B1、A3B2、 A3B3共33=9个水平组合(处理)。 这9个水平组合(处理)就构成了这两个因素的试验方案,根据完全试验方案进行的试验称为全面试验。,(2)不完全方案 它是将试验因素的某些水平组合在一起形成少数几个水平组合。 这
11、种试验方案的目的在于探讨试验因素中某些水平组合的综合作用,而不在于考察试验因素对试验指标的影响和交互作用。这种在全部水平组合中挑选部分水平组合获得的方案称为不完全方案。 根据不完全方案进行的试验称为部分试验。 综合性试验(comprehensive experiment)、 正交试验(orthogonal experiment)都属于部分试验。,(二)拟定试验方案的要点 1、根据试验的目的、任务和条件挑选试验因素 2、根据各试验因素的性质分清水平间差异 (1)水平的数目要适当 水平数目过多,不仅难以反映出各水平间的差异,而且加大了处理数;水平数太少又容易漏掉一些好的信息,至使结果分析不全面。
12、(2)水平间的差异要合理 有些因素在数量等级上只需少量的差异就反映出不同处理的效应。如饲料中微量元素的添加等。而有些则需较大的差异才能反应出不同处理效应来,如饲料用量等。 (3)试验方案中各因素水平的排列要灵活掌握 一般可采用等差法(即等间距法)、等比法和随机法3种。 3、试验方案中必须设立作为比较标准的对照 4、试验处理(包括对照)之间应遵循唯一差异原则 5、有的试验要设置预试期,9.1.2试验设计的基本原则,一、试验误差的来源 在科学研究中,试验处理常常受到各种非处理因素的影响,使试验处理的效应不能真实地反映出来,也就是说,试验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响
13、,这就出现了实测值与真值的差异,这种差异在数值上的表现称为试验误差。试验中误差的来源 系统误差影响试验的准确性,随机误差影响试验的精确性。为了提高试验的准确性与精确性,即提高试验的正确性,必须避免系统误差,降低随机误差。,二、试验设计的基本原则 在试验中,误差主要是由于个体之间的差异不一致所造成。针对误差的主要来源,应采取切实有效的措施,如尽量选择初始条件一致的试验,尽量做到条件一致,认真细致进行观测记载等,力求避免系统误差,降低随机误差。在试验设计时必须遵循以下基本原则。 (一)重复 重复是指试验中同一处理实施在两个或两个以上的试验单位上 (二)随机化 (三)局部控制试验条件的局部一致性 重
14、复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher) 三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。,(1)重复,重复是指试验中将同一试验处理设置在两个或两个以上的试验单位上。同一试验处理所设置的试验单位数称为重复数。,重复的作用主要有:,(a)估计试验误差。如果同一处理只设置在一个试验单位上,那么只能得到一个观测值,则无从看出变异,因而也无法估计试验误差的大小。,(b)降低试验误差,提高试验的精确性。,即样本平均数抽样误差的大小与重复次数的平方根成反比。适当增大重复次
15、数可以降低试验误差。,(2)随机化排列,随机化排列是指试验的每一个处理都有同等机会设置在一个重复中的任何一个试验小区上。,随机化的目的是为了获得对总体参数的无偏估计。,随机排列的实现可以通过抽签法、利用随机数字表法。,(3)局部控制,当试验单位之间差异较大时,即存在某种系统干扰因素时,可以将全部试验单位按干扰因素的不同水平分成若干个小组,在小组内部使非实验处理因素尽可能一致,实现试验条件的局部一致性,这就是局部控制。,局部控制通常通过设置区组来实现,相应的试验设计方法以随机区组设计为代表。,局部控制的作用使干扰因素造成的误差从试验误差中分离出来,从而降低试验误差。,试验设计三原则的关系,9.2
16、 试验设计方法,单因素试验设计,两因素试验设计,多因素试验设计,完全随机设计;单因素随机区组设计;拉丁方设计,正交设计,交叉分组设计;两因素随机区组设计;裂区设计,常用的试验设计方法简介,第10章 正交设计,为什么要进行正交试验: 在实际生产中,影响试验的因素往往是多方面的,我们要考察各因素对试验影响的情况。在多因素、多水平试验中,比如对3因素7水平的试验,如果3因素的各个水平都互相搭配进行全面试验,就要做73=343次试验 对6因素7水平,进行全面试验要做76=117649次试验。这显然是不经济的。 我们应当在不影响试验效果的前提下,尽可能地减少试验次数。正交设计就是解决这个问题的有效方法。
17、,10.1 正交设计的概念及原理,(一) 正交设计的基本概念,正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。,在实际问题中,影响指标的因子往往有很多个,要考察它们就要涉及多因子的试验设计问题。为了减少试验次数,传统采用“单因子轮换法”,即逐个改变因子的水平,而将其它因子的水平固定,找出最好的水平并将其固定,这样反复进行。它把多因子试验问题化为若干个单因子试验问题。但在每个单因子试验中选出的最好水平其组合不一定是全局最好的水平组合。,正交试验法 所谓正交
18、试验法就是以人们的实践经验为基础利用规格化的表正交表,科学地安排试验和分析试验数据的方法。它帮助人们只进行代表性很强的少量的若干次试验找到最佳的工艺条件或设计参数,并预报出最佳条件下试验结果的变动范围。作用1 .合理安排试验,减少实验次数,当因素越多时,正交试验设计的这一优越性越突出。2 .在众多影响因素中,分清因素主次,抓住主要矛盾。3 .正交试验设计是掌握各影响因素与产品质量指标之间关系的有效手段,为生产过程的质量控制提供有利的条件。4 .找出最优的设计参数和工艺5 .指出进一步试验方向,(二) 、指标、因素、水平1 指标 定义:在试验中 ,根据试验目的而确定的衡量试验结果的特征量称为指标
19、。它可以是产品的质量参数(重量、尺寸、速度、温度、寿命、硬度、 精度),也可以是成本、数量、效率等。 分类: 定量指标;定性指标。在试验设计中,通常采用将定性指标定量化的方法(如评分法)将定性指标 化为定量指标进行考核和分析。2 因素 定义:在试验中,影响试验结果的试验条件称为因素。 分类:可控因素:在试验中可以人为地加以调节和控制的因素。不可控因素:由于自然、技术和设备等条件的限制,暂时还不能为人们控制和调节的因素。如气温、降雨量等。在正交试验中,所考察的因素都是可控因素,被考察因素通常以大写英文字母A、B、C表示。3 水平:因素在试验中所处的各种状态和条件称为因素的水平。在试验中往往要考虑
20、某因素的几种状态,那么就称该因素为几水平因素。,(三) 正交设计的基本原理,在试验安排中,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格,如果网上的每个点都做试验,就是全面试验。,简单对比,全面实验,正交试验,表10.2 3因素3水平全面试验方案,正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图中标有试验号的九个“”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。,(1)A1B1C1 (2)A1B2C2 (3)A1B3C3 (4)A2B1C2 (5)A2B2C3 (6)A2B3C1 (7)A3B1C3 (8)A3B2
21、C1 (9)A3B3C2,1 定义:是一种规格化的表格。它是正交试验法的基本工具 2 代号交互作用及交互作用列表 分类(1)从各列水平数是否相同划分水平数相同的正交表水平数不等的正交表(混合水平正交表)(2)交互作用是否单独占列划分完备正交表 不完备正交表L12(211),L18(2137),L36(211313) 正交表的性质,正交表符号,正交表横行数(试验次数),字码数(水平数),正交表列数(最多安排因素数),10.2 正交表及其特性,3 交互作用及交互作用列表 交互作用:在多因素试验中一个因素对试验结果的影响依赖于另一因素所取的水平时,称两因素有交互作用。 在多因素对比试验中,某些因素对
22、指标的影响往往是互相制约、互相联系的。即在试验中不仅因素起作用,而且因素间有时联合起来起作用,这种联合作用并 不等于各因素单独作用所产生的影响之和,称这种联合作用为交互作用。,例:某农场对四块大豆试验田作施肥试验。每块田以不同的方式施以磷肥和氮肥,其产量如下:可以看出当施氮肥和不施氮肥时,施以4公斤磷肥后的增产数量是不同的当施磷肥和不施磷肥时,施以6公斤氮肥后的增产数量是不同的若N, P分别起作用时增产为50, 30kg。但同时施时其效果并不是50+30=80kg,而是增产560-400=160kg,增加的80公斤则为交互作用的效果。 交互作用列表:规定正交表中某两列因素的交互作用所占列号的表
23、格,N2,产量(kg),P,根据以上两个特性,我们用正交表安排的试验,具有均衡分散和整齐可比的特点。所谓均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的。 整齐可比是指每一个因素的各水平间具有可比性。因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。,例如在A、B、C 3个因素中,A因素的3个水平A1、A2、A3条件下各有B、C的3个不同水平,即:,在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵
24、消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。,10.3 无交互作用情况下的正交设计,10.3.2 数据的直观分析,10.3.3 利用正交表进行试验的步骤: 1) 明确试验目的,确定要考核的试验指标; 2) 根据试验目的,确定要考察的因素和各因素的水平;要通过对实际问题的具体分析选出主要因素,略去次要因素; 3) 选用合适的正交表,安排试验计划; 4) 根据安排的计划进行试验,测定各试验指标; 5) 对试验结果进行计算分析,得出合理的结论; 6)若最佳组合方案在试验中未出现,如果条件允许,应安排一次验证试验,进行确认。,10.3.4
25、 多指标问题,单指标试验:衡量试验效果的指标只有一个 多指标试验:衡量试验效果的指标有多个多个指标之间又可能存在一定的矛盾,这时需要兼顾各个指标,寻找使得每个指标都尽可能好的生产条件一、综合评分法在对各个指标逐个测定后,按照由具体情况确定的原则,对各个指标综合评分,将各个指标综合为单指标。此方法关键在于评分的标准要合理,例10.4 白地雷核酸生产工艺的试验 试验目的:原来生产中核酸的得率太低,成本太高,甚至造成亏损。试验目的是提高含量,寻找好的工艺条件。1 核酸泥纯度(),2 纯核酸回收率(),因素水平表,试验方案及结果分析,分数2.5纯度0.5回收率,50454035,A1 A2 A3 B1
26、 B2 B3 C1 C2 C3 D1 D2 D3,因素,指标,指标(得分)因素图,从图上和表上的极差都可以看出,因素的主次为:,所以,A取A1,D取D1,PH值选取便于操作的水平C2,B取B3,故,最优条件为:A1B3C2D1,事实上,试验结果也证明,上述最优条件效果很好。投产后核酸质量得到显著提高,做到了不经提纯一次可以入库。,二、综合平衡法 (1)对各个指标进行分析,与单指标的分析方法完全一样,找出各个指标的最优生产条件。 (2)将各个指标的最优生产条件综合平衡,找出兼顾每个指标都尽可能好的条件。实例说明:,例10.5 液体葡萄糖生产工艺最佳条件选取试验目的:生产中存在的主要问题是出率低,
27、质量不稳定,经过问题分析,认为影响出率、质量的关键在于调粉、糖化这两个工段,决定将其它工段的条件固定,对调粉、糖化的工艺条件进行探索。(1)出率:越高越好 (2)总还原糖:在3240之间 (3)明度:比浊度越小越好,不得大于300mg/l (4)色泽:比色度越小越好,不得大于20ml。,因素水平表,列号,试验号,1 2 3 4 5 6 7 8 9 K1 K2 K3 k1 k2 k3 R,A 1,B 1,C 3,D 4,L9 (34 ),3266 3257 3120 1088.7 1085.7 1040 48.7,3125 3258 3233 1050.7 1086 1077.7 35.3,31
28、74 3308 3161 1058 1102.7 1053.7 49,3039 3216 3318 1013 1070 1129.3 116,试验结果,产量(斤),996 1135 1135 1154 1024 1079 1002 1099 1019,试验方案及结果计算表-1,11301110107010401010,A1 A2 A3 B1 B2 B3 C1 C2 C3 D1 D2 D3,因素,产量 (斤),指标因素图-1,42383430,A1 A2 A3 B1 B2 B3 C1 C2 C3 D1 D2 D3,因素,还原糖含量 (),指标因素图-2,450390330270210150,A1
29、 A2 A3 B1 B2 B3 C1 C2 C3 D1 D2 D3,因素,明度 (mg),指标因素图-3,33272115,A1 A2 A3 B1 B2 B3 C1 C2 C3 D1 D2 D3,因素,色泽 (ml),指标因素图-4,四个因素对四个指标的主次关系为:产量: DCA B还原糖:B D A C明度: A B C D色泽: B A C D,综合考察四个指标,还原糖含量要求在3240之间,从趋势及因素主次知道B的影响最重要,取1.5和2.5都不行,只有选2.0最合适。B取B2最好。从色泽来看,B最重要,而且仍然以B2最好;从明度来看,B为次要因素,但也仍以B2为好;因此可确定B2是最优
30、水平。粉浆浓度A对产量影响很大,取A1最好。但对于明度来说,取A1时大于300不合适,浓度A2时比A1略低一些,但其它指标,除色泽外,都能达到要求。因此粉浆浓度定位A2。,工作压力对产量影响最大,取D3最好。但它的色泽不好,用2.7产量会低一些,但其余指标都还比较好,因此确定为D2。稳压时间对四个指标来说,对产量影响最大,对还原糖没有什么影响,对明度、色泽影响也不大,照顾产量应选C25分钟。但此时色泽、明度都不好,考虑将时间延长一些,定为57分钟。最后得出最优条件为:A2 B2 C2 D2事实上,结果证明采用后各项指标都有明显提高。,10.4 水平数不同的正交表的使用,一、直接套用混和正交表
31、例10.6 为了探索某胶压板的制造工艺,因素水平如下表,此试验方案可以直接套用混和正交表L8(424),试验方案及计算结果表,试验方案及计算结果表(续表),因素水平完全一样时,因素的主次关系完全由极差R的大小来决定。当水平数不完全一样时,直接比较时不行的,因为量因素对指标有同等影响时,水平多的因素极差应大一些。因此要用系数对极差进行折算。,折算后用R 的大小衡量因素的主次,R的计算公式为:,由上计算可知因素主次顺序为:,最后得出最优条件为:A1 C1 B2,二、拟水平法:拟水平法是将水平数少的因素纳入水平数多的正交表中的一种设计方法。 例10.9 对转化率试验,如果除已考虑的温度(A)、时间(
32、B)、用碱量(C)外还要考虑搅拌速度(D)的影响,而电磁搅拌器只有快慢两挡,即因素D只有两个水平,这是一项四因素的混合水平试验,如果套用现成的正交表,则以L18(2137)为宜,但由于人为物力所限,18次试验太多了,能否用L9(34)来安排呢?这是可以的,解决的办法给搅拌速度凑足三个水平,这个凑足的水平叫拟水平。我们让搅拌速度快的(或慢的)一档多重复一次,凑成三个水平。,显然,因素D的影响是不显著的,可将它与误差合并,通过此例我们可看到拟水平法有如下特点: (1)每个水平的试验次数不一样。转化率的试验,D1的试验有6次,而D2的试验只有3次。通常把预计比较好的水平试验次数多一些,预计比较差的水
33、平试验次数少一些。 (2)自由度小于所在正交表的自由度,因此D占了L9(34) 的第四列,但它的自由度fD=1小于第四列的自由度fD=2.就是说,D虽然占了第四列,但没有占满,没有占满的地方就是试验误差.,还需作两点说明: (1)因素D由于和其他因素的水平数不同,用极差R来比较因素的主次是不恰当的。但用方差分析法仍能得到可靠的结果。 (2)虽然拟水平法扩大了正交表的使用范围,但值得注意的是,正交表经拟水平改造后不再是一张正交表了,它失去了各因素的各水平之间的均衡搭配的性质,这是和并列法所不同的。,11.1正交试验方差分析的数学模型 (一)数学模型 根据一般线性模型的假定,若9次试验结果(如例1
34、0.2中的转化率)以x1、x2,x表示,我们首先假定: (1)三个因素间没有交互作用。 (2)为9个数据可分解为: x1=+a1+b1+c1+1 x2=+a1+b2+c2+2 x3=+a1+b3+c3+3 x4=+a2+b1+c2+4 x5=+a2+b+c3+5,x6=+a2+b3+c1+6 x7=+a3+b1+c3+7 x8=+a3+b2+c1+8 x9=+a+b+c+9 其中:一般平均;估计=xi=x1+x2+x9叫全部数据的总体平均值。 a1、a2、a3表示A在不同水平时的效应。 b1、b2、b3表示B在不同水平时的效应。 c1、c2、c3表示C在不同水平时的效应。 (3)各因素的效应为
35、零,或者,各因素的效应的加和为零 ai=0 bi=0 ci=0,(4) i是试验误差,它们相互独立,且遵从标准正态分布N(0,1),所以多个试验误差的平均值近似等于零。 (二)参数估计有了数学模型,还应通过子样的实测值,对以上的各个参数作出估计。由数理统计知识 E( )E( )表示 的数学期望。即,是的一个无偏估计量。可表示为:,11.2 正交试验的方差分析法,一、方差分析的必要性极差分析不能估计试验中以及试验结果测定中必然存在的误差大小。为了弥补这个缺点,可采用方差分析的方法。方差分析法是将因素水平(或交互作用)的变化所引起的试验结果间的差异与误差波动所引起的试验结果间的差异区分开来的一种数
36、学方法所谓方差分析,就是给出离散度的各种因素将总变差平方和进行分解,而你还进行统计检验的一直数学方法。,二、单因素方差分析法 方差分析法的基本思路: (1)由数据中的总变差平方和中分出组内变差平方和、组间变差平方和,并赋予它们的数量表示; (2)用组间变差平方和与组内变差平方和在一定意义下进行比较,如两者相差不大,说明因素水平的变化对指标影响不大;如两者相差较大,组间变差平方和比组内变差平方和大得多,说明因素水平的变化影响很大,不可忽视; (3)选择较好的工艺条件或进一步的试验方向。,例11.1 考察温度对一化工产品的得率的影响,选了五种不同的温度,同一温度做了三次试验,结果如下:,11.3.
37、1:正交设计方差分析的步骤 11.3.2:3水平正交设计的方差分析 11.3.3:混合型正交设计的方差分析 11.3.4:拟水平法的方差分析 11.3.5:重复试验的方差分析,11.3:正交试验方差分析,计算离差的平方和:设用正交表安排m个因素的试验,试验总次数为n, 试验的结果分别 为x1, x2, , xn. 假定每个因素有na个水平,每个水平做a次试验,则n = ana.1) 总离差的平方和ST记:记为 其中ST反映了试验结果的总差异,它越大,说明各次试验的结果之间的 差异越大。试验结果之所以有差异,一是由因素水平的变化所引起 的,二是因为有试验误差。,11.3.1 正交设计方差分析的步
38、骤,2) 各因素离差的平方和下面以计算因素A的离差的平方和SA为例来说明。设因素A安排在正交表的某列,可看作单因素试验。用xij表示因素A的第i个水平的第j个试验的结果(i = 1, 2, , na; j = 1, 2, , a),则有:由单因素的方差分析记为 其中 Ki 表示因素的第i 个水平a次试验结果的和。 SA反映了因素A的水平变化时所引起的试验结果的差异,即因素A对试验结果的影响。用同样的方法可以计算其它因素的离差平方和。对于两因素的交互作用,我们把它当作一个新的因素。如果交互作用占两列,则交互作用的离差的平方和等于这两列的离差的平方和之和。比如 SAxB = S(AxB)1 + S
39、(AxB)2,3) 试验误差的离差的平方和SE设S因+交为所有因素以及要考虑的交互作用的离差的平方和, 因为 ST = S因+交 + SE, 所以 SE = ST - S因+交计算自由度:试验的总自由度 f总 = 试验总次数 - 1 = n - 1 各因素的自由度 f因 = 因素的水平数 - 1 = na - 1 两因素交互作用的自由度等于两因素的自由度之积fAxB = fA X fB 试验误差的自由度fE = f总 - f因+交,计算平均离差平方和(均方):在计算各因素离差平方和时,我们知道,它们都是若干项平方的和, 它们的大小与项数有关,因此不能确切反映各因素的情况。为了消除项数的影响,我
40、们计算它们的平均离差的平方和。因素的平均离差平方和 = (因素离差的平方和)/因素的自由度 = S因/f因试验误差的平均离差平方和 = (试验误差的离差的平方和)/试验误差的自由度 = SE / fE求F比:将各因素的平均离差的平方和与误差的平均离差平方和相比,得出F值。这个比值的大小反映了各因素对试验结果影响程度的大小。,对因素进行显著性检验:给出检验水平,从F分布表中查出临界值F(f因,fE)。将在“求 F 比”中算出的F值与该临界值比较,若F F(f因,fE),说明该因素对试验结果的影响显著,两数差别越大,说明该因素的显著性越大。,11.3.2: 3水平正交设计的方差分析,例1 (无交互
41、作用):磁鼓电机是彩色录像机磁鼓组件的关键部件之一,按质量要求其输 出力矩应大于210g.cm。某生产厂过去这项指标的合格率较低,从 而希望通过试验找出好的条件,以提高磁鼓电机的输出力矩。根据 工程技术人员的经验,取试验因素和相应水平如下表:,解:(选用正交表L9(34)表头设计:试验计划与试验结果:,详细计算如下:,列方差分析表如下:最佳条件的选择: 对显著因子应取最好的水平,对不显著因子的水平可以任意选取;在实际中通常从降低成本操作方便等角度加以选择,上面的例子中对因子A与B应选择A2B2,因子C可以任选,譬如为节约材料可选择C1,验证试验: 对A2B2C1进行三次试验,结果为:234,2
42、40,220,平均值 为231.3. 此结果是满意的,例4(无交互作用)某钢厂生产一种合金,为便于校直冷拉,需要进行一次退火热处理, 以降低合金的硬度。根据冷加工变形量,在该合金技术要求范围内, 硬度越低越好。试验的目的是寻求降低硬度的退火工艺参数。考察 的指标是洛氏硬度(HR),经分析研究,要考虑的因素有3个: 退火 温度A,保温时间B,冷却介质C。,11.3.3:混合型正交设计的方差分析,解:,方差分析表:从F值和临界值的比较看出,各因素均无显著影响,相对来说,B的 影响大些。为提高分析精度,我们只考虑因素B,把因素A,C都并 入误差。这样一来,SE就变成SA + SC + S4 + S5
43、 = 0.445 + 0.18 + 1.125 + 0.500 = 2.250,再列方差分析表。,方差分析表(2):临界值 F0.05(1,6) = 5.99, F0.01(1, 6) = 13.75 从F值和临界值的比较来看,因素B就是显著性因素了。 因素影响从大到小的顺序为BCA,选定的最优方案应为A2B2C1,例6: 钢片在镀锌前要用酸洗的方法除锈。为了提高除锈效率,缩短酸洗 时间,先安排酸洗试验。考察指标是酸洗时间。在除锈效果达到要 求的情况下,酸洗时间越短越好。要考虑的因素及其水平如表:选取正交表L9(34),将因素C虚拟1个水平。据经验知,海鸥牌比 OP牌的效果好,故虚拟第2水平并
44、安排在第1列。,11.3.4 拟水平法的方差分析,解:虚拟水平的因素C的第1水平重复3次,第二水平重复6次。因此,离差平方和为:其余因素的离差平方和为误差的离差平方和为:,方差分析表:从F值和临界值比较看出,各因素均无显著影响,相对来说,因素D 的影响大些。我们把影响最小的因素B并入误差,使得新的误差平方 和为SE= SE + SB,再列方差分析表,方差分析表(2):由此看出,因素D有显著影响,因素A,B均无显著影响。因素重要 性的顺序为DCAB,最优方案为A3B1C2D3.,11.3.5 重复试验的方差分析,总平方和分解,对模型的检验,作业,上机作业,2、 在某种化油器设计中希望寻找一种结构,使在不同天气条件下均具有较小的比油耗。试验中考察的因子水平如表,。 试验结果见表,因子水平表,