1、西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意申请学位论文与资料若有不实之处,本人承担一切的法律责任本人签名: 日期西安电子科技大学关于论文使用授权的说明本人了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的
2、知识产权单位属西安电子科技大学学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文同时本人保证,毕业后结合学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学(保密的论文在解密后遵守此规定)本学位论文属于保密,在本人签名:导师签名:年解密后适用本授权书日期日期摘要最优设计的数值算法是近 40年发展起来的最优回归设计理论中的一个新分支,它在试验设计领域具有非常重要的作用。Fedorov首先提出了 D-最优设计的数值算法,奠定了 D-最优设计的基础,后来在此算法的基础上,许多学者进行了进一步的研究和推广。本文基于 D
3、-最优设计的 Fedorov算法和 Dn-最优设计的 Wynn-Mitchell单点交换算法主要完成了以下工作:首先介绍了最优设计的基本理论以及研究现状,阐述了 D-最优设计和 Dn-最优设计的数值算法的理论基础,总结了国内外的一些经典算法。其次,在 Fedorov算法的基础上,利用最小体积闭包椭球问题的理论,结合支持向量机中序列最小最优化(Sequential minimal optimization,简记为 SMO)的算法思想,提出了 D-最优设计的一个秩 2更新算法,给出了有关信息矩阵的更新公式,并详细分析了它的收敛性和复杂度;对该算法做了进一步的推广,并给出了有关信息矩阵的更新公式,同
4、时,通过数值试验对秩 2更新算法和秩 1算法进行了比较。最后,在 Wynn-Mitchell单点交换算法的基础上,利用 D-最优设计的秩 2更新算法的思想,提出了 Dn-最优设计的秩 2更新算法,记为 SMO算法,并对该算法进行了推广,给出了有关信息矩阵的更新公式。关键词: D-最优算法 Dn-最优算法 Fedorov算法 Wynn-Mitchell单点算法SMO算法AbstractThe numerical algorithm of the optimal design is a new branch of the optimumregression design theory which
5、has been developing in recent 40 years. It plays a veryimportant role in the test design field. Fedorov put forward the numerical algorithm forD-optimal design, and laid the D-optimal designs foundation. Based on the Fedorovalgorithm, many scholars proceed further research and promotion.Based on the
6、 Fedorov algorithm for D-optimal design and Wynn-Mitchellalgorithm for Dn-optimal exact design, this paper mainly complete following work:Firstly, this paper introduces the basic theory and the research status of theoptimal design, and elaborates the theoretical foundation of the numerical algorithm
7、 ofthe D-optimal design and Dn-optimal exact design, then, summarizes some domesticand foreign classical algorithms.Secondly, based on the Fedorov method, combining the minimum volumeeppipsoid closure theory, Sequential minimal optimization, we advance a new methodfor D-optimal experimental designSM
8、O updating algorithm, gives relevantinformation matrix updated formula, and analyzes its convergence and complexity;then, promotes the SMO algorithm, and gives the update formula ; then, the rank 2updating algorithm and rank 1 updating algorithm for D-optimal design are compared.Finally, based on th
9、e Wynn-Mitchell algorithm for Dn-optimal design and thethought of SMO algorithm for D-optimal design, we puts forward the rank 2 updatingalgorithm for Dn-optimal design, and promotes this algorithm; then, gives thecorresponding information matrix update formula.Keywords: D-optimal design Dn-optimal
10、algorithm Fedorov algorithmWynn-Mitchell algorithmSMO algorithm目录第一章绪论11.1最优设计的发展和研究现状11.2回归模型和试验设计31.3本文内容安排7第二章 D-最优和 Dn-最优设计的数值算法基础 92.1 D-最优设计的数值算法基础.92.2 D-最优设计的数值算法基本思想.122.3构造 D-最优设计的主要算法132.4构造 Dn-最优设计的主要算法.16第三章 D-最优设计的秩 2更新算法及其推广193.1 D-最优设计的秩 1更新算法.193.2最小序列优化方法简介223.3 D-最优设计的 SMO算法233.4
11、SMO算法分析 . 253.5 D-最优设计 SMO算法的推广323.6数值实验363.7本章小结38第四章 Dn-最优设计的秩 2更新算法及其推广394.1 Dn-最优设计的秩 2更新算法.394.2算法分析424.3 Dn-最优设计 SMO算法的推广444.4本章小结48总结与展望49致谢51参考文献53在读期间研究成果57第一章绪论 1第一章绪论随着科技的发展,尤其是根据寻找最佳工艺条件和最佳配方及建立合理的数学模型的需要,人们己不满足于只用回归分析的方法来被动地处理盲目得到的试验数据,而是越来越要求合理安排试验点来建立精度较高的回归方程,这就需要把试验点的安排、数据的处理及回归方程的精
12、度统一起来考虑。这正是最优设计所要研究的问题,最优设计是近四十年发展起来的统计学的一个新分支。1.1最优设计的发展和研究现状最优设计理论及其应用 5,6是 70年代后迅速发展起来的一门数理统计分支,它是根据最优化原理和方法,综合各方面的因素,用“人机配合” 或者“自动探索”的方式,在计算机上进行的自动或半自动设计,选出在现有工程条件下的最好设计方案的现代设计方法。它在试验设计领域具有非常重要的作用,是解决最佳工艺条件的获得、科学实验中数学模型的建立的一种极其有效的统计学工具。最优化设计是降低工程造价、减轻体积的一种有效设计方法,同时也可使设计者从大量重复和繁琐的计算工作中解脱出来,以便其有更多
13、的时间和精力致力于创造性的设计,另外,它还大大提高了设计效率。最优设计的应用非常广,遍及金属材料、钢铁冶金、建筑结构、机械制造、采矿、机床、汽车、航空、化工 2、控制系统 3 、分布参数系统 1,5 、铁路、造船以及电器、电机等工程设计领域,并取得了非常好的实际效果。最优化设计方法中比较重要的有 G-最优设计和 D-最优设计。随着近年来计算机技术的迅速发展,在 D-最优试验设计领域中,计算机辅助试验设计思想(CAD)的应用成为一种国际同行认证的新的研究方向,以美国科学院院士 J.Kiefer 7为首,学者们很快提出了确定试验设计的七种基本最优准则,其中,用于构造 D-最优设计和 Dn-最优设计
14、的计算机方法是实现最优准则的最实用和最有效的方法之一,比较有影响的有 Wynn-Mitchell单点交换法、Fedorov单点交换法 8和当时比较流行的 DETMAX算法,它们能够取得比较好的实际效果,因此,其影响几乎遍及所有的试验设计领域。设计上的“最优值 ”是指在一定条件的影响下所能得到的最佳设计值。最优值不是一个绝对的概念,也即绝对最优的设计是不存在的,它是一个相对概念,与数学上所说的极值不同,但在很多情况下它也可以用最大值或最小值来表示。概括起来,最优设计的工作主要包括以下两方面的内容 7:2 D-最优设计和 Dn-最优设计的算法研究(1)将实际问题的物理模型转换为数学模型。建立数学模
15、型的时候,要注意选取合适的设计变量,列出目标函数和约束条件。目标函数是指设计问题所要求的设计变量与最优指标之间的关系式。(2)采用合适的最优化设计方法,求解数学模型,问题就转化为在给定的约束条件下求目标函数的极大极小值或最大最小值问题。在 20世纪初,Fisher等就已经开始将统计的理论和方法运用到试验设计之中。Smith最早提出了回归试验的最优性判别准则-G-最优性准则。Wald(1943)提出了一个检验多项式回归好坏的方法-极大化 det(XT X)。Mood(1964) 提出了获得加权设计的判别准则-D-最优性准则,并将它扩充到一般的回归设计模型。在试验设计领域中,Kiefer 9,10
16、 和 Wolfowitz 7做出了奠基性的贡献,他们将离散试验设计推广到连续设计测度空间,提出并证明了非常著名的等价定理。Atwood 11给出了 DS-最优和 GS-最优的更一般性定义,并研究了对称性在最优设计中的作用。Kiefer 10给出了其它准则与 D-最优之间进一步的等价结果。后来 Silvey 12等人结合数学规划中的对偶理论,提出了 D-最优设计的对偶算法,减少了由于初始设计选取不好所带来的不利影响。Fedorov 8和 Wynn 13是构造 D-最优设计的一般性算法的先驱者。 Fedorov提出了 D-最优设计的单点迭代法,并证明了该算法的收敛性,同时提出了 Dn-最优设计的单
17、点交换法。Wynn 14提出了 D-最优设计的序列发生法,并证明了该算法的收敛性。Wynn(1972)、Mitchell15,16和 Miller(1970)分别独立地提出了更为有效的 Dn-最优设计的单点交换法。Evans 17 提出了 Dn-最优设计的直接扩张法。不久后,Wynn建立了 D-最优设计的推广算法,而后对该算法做了进一步的优化提炼。1988年,Donew 和 Atkinson 18给出了 Dn-最优设计的改进算法,并与传统的搜索方法进行了对比,引进了 D-效率评价参数和 G-效率评价参数,分别简称为 D-效应和 G-效应。Atwood 19对 Fedorov算法提出了三点改进性
18、的建议,提高了算法的精度和收敛速度。St.John 20 对 Atwood的第一点建议做了进一步的改进,提高了算法的效率。与传统的 Fedorov算法相比,在原始设计的“坏 ”设计点的删除问题上,Atwood和 St.John所做的改进是非常有效的,明显改进了 Fedorov算法的收敛速度。1974年,Mitchell 给出了 D-最优设计的 DETMAX法,通过增加或者删除设计点的方式使信息矩阵的行列式达到极大化,直到它满足试验要求的精度,每次选取的增加或删除的设计点都能使行列式增值最大。后来,Galil 21-23和 Kiefer 21对 DETMAX法进行了改进,进一步节省了算法的时间和
19、空间。Welch(1982)结合分支和边界优化的策略,给出了新的构造方法。通过比较发现,原 DETMAX法虽然计算时间较长,但是它的试验结果却比较好,而 Galil和 Kiefer的改进方法第一章绪论 3在产生初始设计方面是比较成功的。DETMAX法和 Welch法都能增加原有设计的信息矩阵的行列式。Evans(1979)提出了一个使原始设计行列式增加的新方法-单纯形构造法。提别地,为了进一步提高算法的效率,Evans提出了同时增加多点使原始设计信息矩阵行列式的值增加最快的方法。另外,在原有算法的基础上,针对不同的回归模型,很多学者提出了比较实用的算法 24-36,这里就不一一赘述了。在国内,
20、东北大学的朱伟勇教授37是最早关注及从事最优设计研究的学者之一。1983年,他提出了具有对数项的混料模型38,并创造性地将“ 组合搜索”的CAD方法应用到最优设计中,填补了国内这一研究方面的空白。为了克服 Fedorov和 Wynn的方法会出现 “聚集点 ”的问题,朱伟勇和段晓东研究了 D-最优设计的对称性,提出了 D-最优设计的对称构造法39,该方法的优点在于多点同时迭代,有效提高了计算速度。后来,朱伟勇教授等68又将对称构造法与 Silvey 12,40法相结合,提出了一个适用于对偶设计空间寻优问题的新方法 -对称对偶算法 41,42,49 。随着计算机技术的发展,最优设计理论越来越受到人
21、们的重视,由于具有良好的实际效果,它已被广泛地应用到许多领域的试验设计之中。1.2回归模型和试验设计为了生产发展的需要,人们提出了很多不同的试验设计,其中包括已有广泛应用的回归旋转设计和回归正交设计,这样就产生了以下两个问题:对现有的各种不同试验设计,通过什么标准比较它们的优劣?是否能够建立一定意义下的最优试验设计?回归的正交设计能够适当有效地减少试验的次数,并且使统计分析得到简化;回归的旋转设计则保证了因子区域中同一球面上的点的预测值方差相同,这样可以排除掉某些误差的干扰,但是,这两种试验设计都并没有从统计的角度比较不同试验设计的优劣以及建立最优的试验设计。从五十年代开始,人们就不断地提出了
22、很多标准来比较不同试验设计的优劣,比如 E-最优性、G- 最优性以及 D-最优性等。目前,D-最优性越来越引起人们的关注。过去常讨论的回归模型大多都是完全多项式模型,实际上并不完全是这样,例如人们在已知某些因子间不存在交互作用时,就可以在回归模型中不考虑这些因子的交叉项;另外,有的时候,因子的取值并不完全是按照幂函数变化的,而是按照其它的连续函数(如三角函数列、埃尔米塔函数列和勒盖尔函数列等构成的函数)变化,因此,为了更好地进行试验设计,就需要把回归模型的概念加以推广。今后,我们研究的回归模型是MM4 D-最优设计和 Dn-最优设计的算法研究ya1 f1 ( x a )2 f 2 ( xa )
23、L m f m ( xa ) aa 1,2,L, N (1-1)其中, a ( a 1,2,L, N )是服从 N (0, 2 )的相互独立的随机变量, xa是因子区域 中的点, f1 ( xa ), f 2 ( x a ),L, f m ( xa )是因子区域 上的连续函数, 1, 2 ,L, m是 m个待估参数。模型 1-1可以简记为y,同前面定义,E ( y) T f ( x)(1-2)f ( x)f1 ( x)f 2 ( x)f m ( x)当 f1 ( x), f 2 ( x),L, f m ( x)是一组幂函数时,模型(1-1)就化为多项式模型16 了。假如试验设计由 N个试验点
24、x1 , x2 ,L, x N组成,那么模型(1-1)的结构矩阵为 f1 ( x1 ) f ( x 2 )M f 1( x N )f 2 ( x1 ) Lf 2 ( x 2 ) LM Mf 2 ( x N ) Lf m ( x1 )f m ( x2 )f m ( x N ) (1-3)它的信息矩阵是NM F T ( x) F ( x) f ( x t ) f T ( xt ) (1-4)t1人们希望通过试验组合的选择使信息矩阵 M越小越好,如何比较两个矩阵的大小,有很多种方法,由不同的优化策略标准,产生了不同的优化设计方法,在最优设计中主要包含:(1) D-最优化设计:选择试验设计使信息矩阵的
25、行列式达到极大;(2) A-最优化设计:选择试验设计使信息矩阵的迹达到极大,这里的迹为信息矩阵对角线元素之和;(3) E-最优化设计:选择试验设计使信息矩阵的最大特征根达到极小;(4) G-最优化设计:选择试验设计使响应预报值的最大方差达到极小。在这里,需要注意的是,设计的最优化是依赖于模型的,在最优设计产生之前,必须为设计指定模型和期望的点数,由计算机算法产生的设计只是针对该模型的最优化。对于完全多项式回归模型,它的结构矩阵可以确定一个试验设计,但对于推pf(x)M 第一章绪论 5广后的回归模型(1-1),从它的结构矩阵(1-3) 并不能直接得到一个试验设计,为了进一步研究的需要,给出试验设
26、计的一般性定义。定义 1.3由因子区域 中的一组点x1 , x 2 ,L, x n和一组与其相对应的自然数nn1 , n2 ,L, nn, nt Nt1构成的集体,称为一张离散试验设计。定义 1.4 由因子区域 中的一组点x1 , x 2 ,L, x n和与其相对应的一组数p1, p2 ,L, pnn构成的集体,称为一张连续试验设计,其中 pi0,1且 pi 1,这里称 pi为 xi的i1测度。每一个离散设计都可以转化为一个连续设计,但是一个连续设计一般只能转化成一个近似的离散设计。在实际应用中使用的是较多的是离散设计,但在很多情况下,直接编一个离散设计是非常困难的,而做出一个连续设计却是可能
27、的,因此,实际应用中,往往是先做出一个连续设计,然后再将它转化为一个离散设计,而 D-最优设计就是这样制定的。在连续设计 下,模型(1-1)的信息矩阵和方差函数分别为NM F T ( x) F ( x) f ( x t ) f T ( xt )t1 pi f 12 ( x i ) pi f1 ( i ) f 2 ( xi )2i 2 iLLL pi f1 ( xi ) f m ( xi ) pi f 2 ( x i ) f m ( x i )pi f m2 ( xi )(1-5)d ( x, ) f T ( x) M1 ( ) f ( x) (1-6)对模型(1-1),可以编制不同的试验设计,
28、以什么标准来评价这些设计的优劣呢?饱和设计是从设计点的多少来评价的,正交设计是从计算的繁简来比较的,而 D-最优设计是对参数 1 , 2 ,L, m的估计好坏来评价的。对于模型(1-1) ,可以寻找一个试验设计,通过实验得到数据,然后,通过最小二乘法得到参数的最定义1.7 *(n)是Dn-最优设计,当且仅当它的信息矩阵 M(*(n)XnXn是定义1.8假设 为D-最优设计,则称6 D-最优设计和 Dn-最优设计的算法研究小二乘估计 bTb1 b2 L bm。通过不同的试验设计可以得到不同的最小二乘估计,通常利用它们的密集椭球体的体积大小来评价参数最小二乘估计的好坏。假如已经知道 b1 ,b2
29、,L,b m的相关矩和平均值,则在 m维空间中要找到这样的椭球体,使在这个椭球体所围成区域上的 m维随机变量 b Tb1 b2 L bm与 m维均匀分布有相同的相关矩和平均值,具有这样性质的椭球体就称为bTb1 b2 L bm的密集椭球体,参数估计值 bTb1 b2 L bm分散与集中程度的指标就是这个密集椭球体的体积大小,一般地,不同的试验设计有不同的密集椭球体,因此, bTb1 b2 L bm的密集椭球体的体积是与设计有关的,即 V V ( )。对某一个试验设计,在模型(1-1)中, m个回归系数的密集椭球体的体积与该设计的信息矩阵的行列式有如下的关系:V ( ) (m m( m 2)2
30、2m 1) det A( )2其中,( x)是函数。在同一个模型(1-1)下,对两个不同的试验设计 1 , 2,若 V ( 1 ) V ( 2 ),则称在 D-优良性下,设计 1比设计 2好,这也等价于 det M ( 1) det M ( 2 )。定义 1.5在给定的因子区域 上,使回归系数 bTb1 b2 L bm的密集椭球体的体积达到最小的试验设计就称为 D-最优设计,也即det M ( * ) max det M ( )。定义 1.6称一个设计为一个 n点设计,若它由因子区域 中的 n个点1n令 ( n)表示一个 n点设计,则它的信息矩阵为M ( ( n) ( X nT X n )n方
31、差函数为d ( x, (n) nf T ( x)( X nT X n )1 f ( x)对试验者来说,除了要找到 D-最优设计以外,更重要的是构造出具有实际应用价值的 Dn-最优设计,以利于试验点的安排。T可逆的,并且 det( X nT X n )满足det( X n* )T X n* ) max det( X nT X n ) ( n)*det(M(n)m1第一章绪论 7 det M (* ( n) 为 ( n)的 Dn-效应。需要注意的是,对于 n点设计,不存在相应的等价定理 20,因此由任何算法给出的 n点设计都不能保证是 Dn-最优确切设计。在这种情况下,就常用 Dn-效应来作为检验
32、一个 n点确切设计好坏的标准。1.3本文内容安排本文是作者在攻读硕士学位期间在刘红卫老师的帮助指导下完成的部分工作,主要是关于 D-最优设计和 Dn-最优设计的秩 2更新算法的研究,具体内容如下:1.第一章,简述了最优设计的发展、重要性以及研究现状。2.第二章,阐述了 D-最优设计和 Dn-最优设计的数值算法基础,并对已有的经典算法做了简单的介绍。3.第三章,结合最小密集闭包椭球体的理论和支持向量机中的序列最小最优化算法的思想,提出了 D-最优设计的秩 2更新算法,对其收敛性和复杂度进行了分析,并对该算法进行了推广。通过数值试验对算法进行了比较。4.第四章,基于第三章中 D-最优设计的秩 2更
33、新算法的思想,提出了 Dn-最优设计的秩 2更新算法,并对该算法进行了推广。5.在论文的最后部分是总结与展望、致谢、参考文献以及作者在攻读硕士期间的研究成果等内容。8D-最优设计和 Dn-最优设计的算法研究第二章 D-最优和 Dn-最优设计的数值算法基础 9第二章 D-最优和 Dn-最优设计的数值算法基础D-最优设计的信息矩阵的行列式在所有设计中是最大的,但要想一步就构造出使行列式达到最大的设计,是非常困难的。我们可以利用数值方法,从一个非退化的初始设计出发,通过逐步迭代进行比较来寻优,只要能实现每一次迭代都能使行列式增大即可。实验证明,利用迭代法是可以实现这个目标的。2.1 D-最优设计的数
34、值算法基础构造 D-最优设计的基本思想很类似于组合设计,该方法在一些最为简单的情况下是寻找 D-最优设计可行的,但是在一般情况下却不然。随着计算机技术的迅速发展,目前主要采用数值方法去寻找各种条件下的最优设计。所谓 D-最优化的数值方法,是指在给定因子区域 和模型(1-1)的情况下,用最优化技术去寻找使信息矩阵的行列式达到最大的设计点,常采取的方法是随机寻找法、梯度法和最速下降法等。构造 D-最优设计的方法,关键在于如何合理地在给定的因子区域 中选择设计点和分配测度,使得设计的信息矩阵以及相关的计算能够比较简单易行,比如可以在选取设计点时考虑因子区域的对称性等。定义 2.1称 d ( x, )
35、 f T ( x) M1 ( ) f ( x)为方差函数。方差函数有以下两个重要的性质:性质 1对 上的任意一个连续设计 ,都有Npt d ( xt , ) mt1其中, xt和 p t分别是设计 的第 t个设计点和它的测度。性质 2对因子区域 上的任意一个连续设计 ,都有max d ( x, ) mx当且仅当 是 D-最优设计时,等号成立。证明:显然,对设计 的任意一个设计点 x t,有d ( xt , ) max d( x, )x由性质 1可以得到n nm pt d ( xt , ) pt max d ( x, )t1t110D-最优设计和 Dn-最优设计的算法研究 max d ( x,
36、) max d ( x, )x定义 2.2设 1和 2是两个连续设计x x11 p11, 2 21p12 L p1m1 p21p 22 L p2 m 2m1 m 2其中, p1t1 1,0 p1t1 1, t1 1,2,L, m1, p2t 2 1,0 p2t 2 1,t2 1,2,L, m2,则t11t 21x11 x12 L x 21 x 22 L (1 ) p11 (1 ) p12 L (1 ) p1m 1p 21p22 Lp2 m2仍是一个连续设计, 称为设计 1和 2的线性组合设计,记为 (1 ) 1 2。性质 3线性组合设计 (1 ) 1 2的信息矩阵为M ( ) (1 ) M (
37、 1 )M ( 2 )定义 2.3只含有一个谱点 x0的设计 称为一点设计,记为 ( x 0 ),这个唯一的谱点测度为 1。一点设计有如下的两个性质:性质 4一点设计 ( x 0 )的信息矩阵和方差函数分别为M ( ( x0 ) f ( x0 ) f T ( x0 )d ( x 0 , ( x0 ) m(2-1)(2-2)性质 5任意一个连续设计 0和一个一点设计 ( x 0 )的线性组合设计 1 (1 ) 0 ( x0)的信息矩阵的行列式为det M ( 1) (1 ) m 1 1 d( x 0 , 0 )det M ( 0 )证明: M ( 1 ) (1 ) M ( 0 )M ( ( x
38、0 ) (1 ) M ( 0 )f ( x 0 ) f T ( x0 )因此det M ( 1) (1 ) m det(M ( 0 ) 1 f ( x0 ) f T ( x0 ) (2-3)又矩阵行列式的计算具有性质det( B F T F ) det B det( I m F T B1F )其中 B是 n阶方阵, F是 n m阶矩阵,令 B M ( 0 ), F (有11) 2 f ( x 0 ), m 1,则(3)maxd(x,)m。第二章 D-最优和 Dn-最优设计的数值算法基础 11det M ( 1) (1 ) m 1 (1 ) m 111f T ( x0 ) M1 ( ( x 0
39、) f ( x 0 ) det M ( 0 )d( x 0 , 0 ) det M ( 0 )定义 2.4给定因子区域 ,如果设计 *满足下面的等式max d ( x, * ) min max d ( x, )x x则称 *是因子区域 上的 G-最优设计,也称之为极大极小化设计,其中 min是相对于因子区域 上的所有可能的设计 而言的。定理 2.1(等价定理) 下面的三个结论是等价的(1) *是 D-最优的,当且仅当 *是非退化的,且d ( M ( * ) max det( M ( )(2) *是 G-最优的,当且仅当max d ( x, * ) min max d ( x, )x x*x其中
40、,(3)是由 (2)得到的,它对于构造和检验 D-最优设计非常方便,在 D-最优设计的数值算法中有非常重要的作用。推论在 D-最优设计 *的每一个点 x上,方差函数 d ( x, * )都能达到它的最大值 m。证明: (用反证法) 假设结论不成立,即在设计 *中存在一个点 x,使得d ( x, * ) m则n npt d( x t , * ) pt m m又因为 nt1 nt1 pt d( x t , * ) pt f ( x t )T M1 ( * ) f ( x t )t1 t1n TrM1( * ) pt f ( xt ) f T ( xt )t1 TrM1 ( * ) M ( * )
41、TrI m m显然是矛盾的,因此假设不成立,故推论得证。detM()即可以证明,按照d(x0, )maxd(x,)来选择x0作为一个一点设计,并且12 D-最优设计和 Dn-最优设计的算法研究2.2 D-最优设计的数值算法基本思想用数值方法构造 D-最优设计,就是从初始设计出发,通过迭代,构造出一系列设计,使它的信息矩阵的行列式不断增大,直至满足一定的精度为止,那么得到的设计就是要寻找的近似 D-最优设计,由性质 5可以知道,这个想法是可行的,因为,我们可以做设计 0和一个一点设计 ( x0 )的线性组合,并且知道了前后两个设计的信息矩阵行列式的比值。现在的关键问题是通过线性组合得到的新设计,
42、它的信息矩阵的行列式是否是增加的?若能增加,在什么情况下增加最快?为了解决这两个问题,引入函数 ( x0 , ) det M ( 1 )0 (1 ) m1 1 d ( xo , 0 )这个函数是新旧两个信息矩阵的行列式的比值,由上面的式子可以看出它只与 和新增加的设计点 x0有关,现在的问题转化为在什么条件下 ( x 0 , )一定大于 1,以及当 x0和 分别取什么值时,能使 ( x0 , )取得最大值。性质 6当 0不是 D-最优设计时,按照 d ( x 0 , 0 ) m或者d ( x0 , 0 ) max d( x, 0 )确定的 x0,可以使得函数 ( x0 , )在 0的附近是一个
43、增函数,因此,在 0的附近,当 0时,有 ( x 0 , ) 1。0 0x选择适当小的 ,得到的线性组合设计 1 (1 ) 0 ( x0),必有det M ( 1 ) det M ( 0 ),即信息矩阵的行列式是单调递增的。特别地,当 0 d ( x0 , 0 ) mm( d( x0 , 0 )1)(2-4)时,信息矩阵的行列式是增加最大的,而且这个最大的信息矩阵的行列式为det M ( 1) m d (m1x0 , 0 ) 1 m1 det M ( 0 ) (2-5)若用上述方法得到的新设计 1仍不是 D-最优设计,则同样地,在设计 1的基础上,选择 x1和 1,使其满足d ( x1, 1
44、) max d ( x, 1 )x构造新的线性组合设计 1d( x1, 1 ) mm( d ( x1 , 1 ) 1),L,L,定理当n时,limdet( (n)det(),其中, *是一个D-最优设计。第二章 D-最优和 Dn-最优设计的数值算法基础 13 2 (11 ) 11 ( x1 )重复上述的步骤,这样就可以得到一个信息矩阵的行列式序列det M ( 0 ) det M ( 1 ) det M ( 2 ) L det M ( k ) L性质 7上述迭代过程产生的信息矩阵的行列式序列是收敛的,并且按照d ( x k , k ) max d ( x, k )选择的 xk,有lim det
45、 M ( k ) det M ( * )k其中, *是 D-最优设计。2.3构造 D-最优设计的主要算法2.3.1 Wynn序列发生算法14步骤 1选取一个非退化的初始设计 ( n) ( n) : x1, x 2 ,L, x n1 1n n1n步骤 2在因子区域上,求出点 x n1满足 d ( x n1, ( n) max d ( x, ( n)x步骤 3 把 xn1加入到 ( n)中,得到 n 1点设计 ( n 1) : x1 , x2 ,L, xn11 1 1n 1 n 1 n 1步骤 4令 n n 1,转步骤 2,直到 d ( x n1, ( n)充分接近 m,停止迭代。*nWynn序列
46、发生法的特点如下:(1)算法中的各点等测度;(2)每一次迭代都是在原设计中增加一个设计点;(3)每一次迭代都赋予新增加点一个正的测度,原设计中谱点的测度按比例减少,保证测度和为 1。利用该算法,可以构造出各类试验模型的 D-最优设计方案,在实际中得到了比较广泛的应用,如 Draper 43的倒数项模型设计和对数项混料模型的设计等,但是,利用该算法构造 D-最优设计时,必须得考虑以下两个问题:(1)在每一次迭代中,都必须在整个因子区域 内计算方差函数的最大值,14 D-最优设计和 Dn-最优设计的算法研究对于比较复杂的模型,这往往是一项非常困难的工作。(2)为了使 D-最优设计的结果包含的点数尽可能少,且使设计点分布均匀,以利于在实际工程中应用,在计算的过程中,需要对位置相近的试验点进行合并处理。上述这两项工作在计算中费时比较多,因此,算法的收敛速度比较缓慢,很难获得比较满意的结果。该