1、长春理工大学本科毕业论文I摘 要最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识,并在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用.然而,最小二乘法因其抽象、难懂常常不能被准确理解.本文探讨了最小二乘法的基本原理及其各种变形的拟合方法,其中包括:一元线性最小二乘法拟合、多元线性拟合、多项式拟合、非线性拟合,并且讨论了连续函数的最佳平方逼近,在此基础上,介绍了切比雪夫、勒让德、拉盖尔、埃尔米特四种正交多项式以及三角多项式的逼近问题。关键词:最小二乘法 线性拟合 曲线拟合 正交多项式长春理工大学本科毕业论文IIAbstractLeast square was used
2、to estimate parameters and identify system of regression model, by the point of error fitting. And it has widely application in the parameters estimate, system identification, prediction, forecasting and other fields. However, the least square method because of its abstract and difficult ,often can
3、not be accurately understanding. The least square methods principle and the various kinds of fitting methods such as the linear least square fitting, multiple linear fitting, polynomial fitting a nonlinear fitting are dealt with. And discussedsquare approximation of continuous function, on this basi
4、s, introduced the Chebyshev, Legendre, Laguerre, Hermite orthogonal polynomials and the four triangular polynomial approximation.Key Words:least square method;linear fitting;square approximation长春理工大学本科毕业论文I目 录摘 要 .IAbstract.II目 录 .I第 1 章 引言 .1第 2 章 最小二乘法 .32.1 最小二乘法问题描述 3第 3 章 离散点的最小二乘曲线拟合 .73.1 问题
5、提法及拟合模型 73.2 线性模型的正规方程 93.3 基于正交基的线性模型 .113.4 非线性模型举例 .13第 4 章 连续函数的最佳平方逼近 174.1 问题提法及正规方程 .174.2 利用多项式作平方逼近 .194.3 利用正交函数组作平方逼近 .214.4 几种常见的正交多项式 .21第 5 章 结论 25参考文献 .27致谢 .29长春理工大学本科毕业论文1第 1 章 引言最小二乘方法最早是由高斯提出的,他用这种方法解决了天文学方面的问题,特别是确定了某些行星和彗星的天体轨迹。这类天体的椭圆轨迹由 5 个参数确定,原则上,只要对它的位置做 5 次测量就足以确定它的整个轨迹。但由
6、于存在测量误差,由 5 次测量所确定的运行轨迹极不可靠,相反,要进行多次测量,用最小二乘法消除测量误差,得到有关轨迹参数的更精确的值。最小二乘法近似将几十次甚至上百次的观察所产生的高维空间问题降到了椭圆轨迹模型的五维参数空间。假如想了解某个地方的月降雨量,一个月的观测当然不够,任何一个月都可能是异常晴朗或异常多雨。相反,人们应该研究几个月或至少一年甚至十年,并将所有数据加以平均。平均的结果对任何一个具体的月份并不一定能完全符合,但凭直觉,这个结果所给我们的标准降雨量图形将比只研究一个月所得到的结果要准确得多。这个原理在观察和实验科学领域是通用的。它是通过多次测量消除测量误差及随机波动。木匠的格
7、言“量两次,再下手” 也正是这个常识的一个例子。在降雨的例子中,我们用一个数来代表或一定程度地近似整个测定数据的效果。更一般的,鉴于各种理论和实际的原因,常用低维来近似说明高维的对象。在下面几种工作中都可以采用这个方法,象消除误差或忽略无关细节,从干扰数据中提取信号或找出趋势,将大量数据降低到可管理的数量或用简单的近似来代替复杂函数。我们并不期望这个近似值多么精确,事实上,在许多时候它也不用很精确。但尽管如此,我们还是希望它能保持对原始数据的相似之处。在线性代数领域,我们希望将一个高维空间的向量投影到低维子空间,完成这个工作的最普遍和最便于计算的方法之一就是最小二乘法。在正确选择模型的前提下,
8、用绝对误差最小二乘法拟合观测点的因变量量级相差较大的资料,往往使各点的相对估计误差分布不均匀(表现为大观测值的相对误差较小,小的则很大),若采用相对误差最小二乘法来拟合,可在一定程度上改善这种不良效果,并提高了拟合结果的可靠性。用于估计直线或曲线模型参数的相对误差最小二乘法是指使因变量估计值与实测值间的相对误差平方和为最小。最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识,并在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用。我们用数量 来度量逼近多项式 与已知函数maxbpfpfxpx的近似程度。若 ,则意味着序列 在区间fx 0,nnn上一致收敛到 .一致逼近度量、
9、亦称 Tchebyshev 度量是很重要的一类,abf度量标准,然而由于它的非线性特征,使得最佳一致逼近多项式的构造问题十长春理工大学本科毕业论文2分困难。对于许多问题来讲,人们需要求出的是在确定意义下的“整体”近似。本文讨论一类新的度量平方度量意义下函数的逼近问题。长春理工大学本科毕业论文3第 2 章 最小二乘法2.1 最小二乘法问题描述最小二乘法起源于以测量和观测为基础的天文学。 在 1794 年利用Gaus最小二乘法解决了多余观测问题。可以用下面的简单例子描述这类问题。假定通过观测或实验得到如下一组数据(即列表函数):k1 2 3 4 5 6 7 8x0 1 2 3 4 5 6 7ky1
10、.4 1.3 1.4 1.1 1.3 1.8 1.6 2.3我们的目的是用一简单的式子表出这些数据间的关系,从分析数据看出,这些点差不多分布在一条直线上,因此我们自然想到用线性式 表示它yabx们之间的关系。这就须定出参数 和 的值。待定参数的确定归结为矛盾方程ab组的求解问题。假定有某方法可以定出 和 ,则按 ,给出一个 便可以算出一yxx个 。我们记ykkyabx1,.8称为 估计值,显然它们不会是完全相同的,它们之间的差(通常称kky为残差) ,.kky无疑是衡量被确定的参数 和 (也就是近似多项式 )好坏的重abyabx要标志。可以规定许多原则来确定参数 , ,例如(1)参数的确定,将
11、使残差绝对值中最大的一个达到最小,即为最小;maxkT(2)参数确定,将使残差绝对值之和达到最小,即 为最小;k(3)参数的确定,将使残差的平方和达到最小,即 为最小2k(1) (2)两个原则是很直观的,也很理想,但很不好用;而原则(3)既直观又很好用。按原则(3)确定待定参数,从而得到近似多项式的方法,就是通常所说的最小二乘法。这一方法的理论根据是,概率理论已证明,只有这样的原则才能使得观测或实验的偶然误差对于所作的近似多项式有最小影响。回到所提出的问题上来,即用最小二乘法确定参数 , ,按最小二乘法,ab应使长春理工大学本科毕业论文4821,iiiSabyabx取最小值,因此,应有 812
12、0iiiyxa81iiiSabb由此,得到如下线性方程组: 88011,iiixy8882111,iiiab经过简单计算,这个方程组成为 .,284073ab解之可得 , ,从而得近似多项式 ,1.42a0.1b1.420.1pxx现在转入讨论更为一般的情形,设已知列表函数 ,,.iiyfm并且我们想用一个通常的 次多项式nm(2-1)01().npxaax去近似它.问题是应该如何选择 使 能较好地近似列表函数 .,npfx按最小二乘法,应该选择 ,使得01.(2-2)20,mniniiSafx取最小。注意到 是非负的,且是 的 2 次多项式,它必有最小值。求1,.a对 的偏导数,并令其等于零
13、,得到S01,.na010.0,1.mnkiiiiyxxn进一步,可以将它们写成 10000. 0,.mmmkkkkniii iyxaxax引进记号和0mkkisx0mkiuyx则上述方程组成为长春理工大学本科毕业论文5(2-3)01021012.,nannssauss它的系数行列式是 0121112nnnnssX由 的定义及行列式性质,可以断言(0,12)isn(2-4)2101,!n nXW此处符号 表 行列式,而 是对所有可能的 求和WVadermo 0,1.in(每个 可以取值 并且当 时 ).i01,.xijij由(2-4 )式及 行列式的性质可知,当 互异时,ne01,.mx012
14、20101(,)nnnnW 从而, ,方程组(2-3)有唯一解 ,且它们使(2-2)取极10nX,.a小值。如此,我们应用最小二乘法找到了 的近似多项式 .fxnpx在利用最小二乘法组成和式(2-2)时,所有点 都起到了同样的作用,但i是有时依据某种理由认为 中某些项的作用大些,而另外一些作用小些(例如,一些 是由精密较高的仪器或操作上比较熟练的人员获得的,自然应该予iy以较大的信任) ,这在数学上表现为用和(2-5)20miinifxp替代和(2-2 )取最小值。此处诸 且 , 通常称之为权;而(2-,i1ii5)为加权和。例 2.1 设已函数 f(x)的表列值为x0.2 0.5 0.7 0
15、.85 1长春理工大学本科毕业论文6y1.221 1.649 2.014 2.340 2.718试按最小二乘法构造 的二次近似多项式。fx解 经过简单计算可得关于参数 和 方程组(参阅下面的第一个表):01,a201253.2.539.4,785.6.aa解之,得 故21098,7,251.3pxx0x1 4yx2y1111150.20.50.70.8513.2500.040.250.490.72312.5030.0080.1250.3430.61412.0900.0020.0630.2400.52211.8261.2211.6492.0142.3402.7189.9420.2440.8241
16、.4101.9892.7187.1850.0490.4120.9971.6902.7185.857下表给出了 在结点处的误差。2pxx0.2 0.5 0.7 0.85 1y2px1.2211.223-0.0021.6491.6440.0052.0142.017-0.0032.3402.344-0.0042.7182.7150.003用多项式 去近似一个给定的列表函数(即给出的01().nnaxa一组观测值 )时,需要确定的参数是 ;而 可以看成是iiyf 01,.nanpx的线性函数。01,.na长春理工大学本科毕业论文7第 3 章 离散点的最小二乘曲线拟合3.1 问题提法及拟合模型为离散数据
17、建立连续模型,或者说为离散点配一条曲线,有两种途径。一种途径是曲线( 连续模型的图象)必须精确地通过由已知离散数据确定的离散点,也就是插值法。另一途径是要求曲线符合离散点分布的总体轮廓,而不要曲线精确地通过给定的各离散点,即所谓“曲线拟合” 。在处理从实验中得到的大量数据时,通常采用曲线拟合方法。本章讨论最小二乘意义下的曲线拟合问题。设从实验中得到离散数据(离散点)(3-1)(,)ixy0,1im设 是用于拟合数据(3-1)的函数类, 是拟合模型即 的一般元素,(3-2)01;,),nc axb其中 是 个参数, 又设 与 分别是带权 2-01,nc 1(ixabi2I范数与最小二乘拟合优度,
18、即 2102z(miizw(3-3)1(,) R与22010(,)=(),mniiiIcyx y(3-4)其中常数 是权, 最)iwim01(,), 01,().mx小二乘曲线拟合就是实现最小二乘拟合优度 下的极小化(达最小平方残差):I找 使得*,*01();,),nxc(3-5)*0101(min(,).nIcIc 从问题的提法可见,进行最小二乘曲线拟合包含两个主要步骤:一是选取形如(3-2 )的合适的拟合模型 ,即选取合适的函数类 ;二是求解问题(3-5). 关于拟合模型,必须能反映离散点(3-1)分布的基本特征。常选取 是线性拟合模型,即 所属的函数类 (3-6)01,nSpan其中
19、是线性无关的基函数。于是01,n长春理工大学本科毕业论文8(3-7)0()().mjxcx往往选取每个 是次数 的简单的多项式,即 是次数 的多项式空间,jjn特别常取 (),jnjx01,其中 是整数,并直接记01nn 01,nnSpax从而 01().nnxcc有时,根据离散点(9.1)分布的明显特征,也选取 非线性地依赖于参数 ,是非线性拟合模型,例如01,nc 10(),cxe0123()c等。这种情形, 是由若干参数确定的某种函数族。一般地说,非线性模型的建立比线性模型的建立要困难一些,而且只有那些能变换为线性模型来处理的非线性模型适合采用最小二乘方式进行拟合。(i)有时,我们希望用
20、如下类型的函数:(3-8)qspt去近似一个由一组观测数据(列表)所描绘的函数,其中 和 是待定的两个pq参数。显然 是 和 的线性函数。怎样线性化呢?为此,我们在(3-8)式两spq端取对数,得到.lnlnspqt记 ,则(3-8)式变成01ln,l,syaxt.01yax这是一个一次多项式,它的系数 和 可以用最小二乘法求得。(ii)我们经常希望用函数(3-9)CtSAe去近似一个已给定的列表函数,其中 、 是待定的参数。这时,我们可以在(3-9)的两端取对数: lnt记 ,则(3-9)式变成01ln,l,SyAaCxt01yax这样,仍可用最小二乘法定出 (从而也就定出了 ) ,得到近似
21、函数01, ,AC长春理工大学本科毕业论文9.CtSAe3.2 线性模型的正规方程我们着重讨论线性模型的最小二乘拟合。设关于离散数据(3-1)的拟合模型 形如(3-7) ,则求解问题(3-5)归结为求 元函数 的极值, 1nI(3-10)20100(,)().mnijiiIcwycx显然, 是非负的上无界的二次函数,没有最大值但可以达到最小值。I 达最小值的必要条件是002()0,mnijikiikIycxc,1.k这是关于 的线性代数方程组,可以改写成01,n(3-11)0(,)(,)jkjkjcy0,n其中 01(),(,jjjjmxx 01,m 10()(),uv R(3-12)0,.i
22、iwu方程组(3-11)称为正规方程或法方程。一般, 远小于 ,函数 线性无关保证向量 线性无关。nm01,n 01,n这时,方程组(3-11)的系数矩阵(3-13)0100101(,)(,)(,)(,)(,)(,)nnnnG 的行列式不为零,因此正规方程(3-11)有唯一解。如果求得正规方程(3-11)的解 *,jjc01,n那么 在 达最小值,所要求的拟合数据(3-1)的连续模型为I*01(,)nc *0()().njxcx例 3.1 表 3-1 中提供了离散数据 ,利用二次多项式(抛物,4iyi长春理工大学本科毕业论文10线)即利用函数类 进行拟合。21,Spanx表 3-1iixiy*
23、ix*iiyx0123400.250.500.751.001.00001.28401.64872.11702.71831.00521.27401.64822.12792.7130-0.00520.01000.0005-0.01090.0053我们有 , , 三个基函数,012()jix0,12.拟合模型是基函数的线性组合, 012.cx取 ,依据014w40(,)jkjki,40,kkiyx1,2可以算出 0(,)5,1.872(,)34,0102.52(,)(,)87,11.60(,)8.76,y()54,y2()4.015y正规方程为 0125287.,.618734.015cc通过求解,
24、得 0.52,c10.8,c2.7c因此所求的连续模型 为*长春理工大学本科毕业论文11* 2()1.052.86410.37.xx最小平方残差(各点拟合残差的平方和) 422*40()iiiyy3.3 基于正交基的线性模型线性模型(3-7)和相应的正规方程(3-12)均取决于基函数 的01,n选取。通常,由选定的基函数产生的正规方程的系数矩阵(3-13)往往是病态的,即在求解正规方程时因系数矩阵的微小误差可能导致解有很大误差。因此,出现了避免求解方程组的解线性拟合模型最小二乘问题的直接方法,一种方法是选取特殊的基函数,使正规方程的系数矩阵是对角矩阵。定义 3.1 设 是区间 上的函数,点集
25、.01,n ,ab01,mxab常数 ,如果成立()iwm 200,(,(),jkiikii kjkwx ,1,jn则称 是关于点集 的带权 的正交函数组。01,n 01,m 0,mw显然,如果线性空间 的基函数 是正交函,nSpan 01.,n数组(称为 的正交基) ,且拟合模型 ,那么正规方程(3-11)将简化为对角方程,可直接得出其解为(3-14)*,0,1.kkcny这时最小平方残差可简化为(3-15)22*0202*2,.mnijiiiojijnjijwycxcyy可得正交多项式 的如下递推公式:01,.n0()1,x1 1() (),kkkxx(3-16),.,n其中长春理工大学本
26、科毕业论文12(3-17)101,0,1.;,2.,kkkkxkn 记号 01,kkkmkxxx例 3.2 仍考察表 3-1 中的离散数据 且利用二次多项式进行(,)04),iyi拟合,依据递推公式(3.16)与(3.17)计算关于点集 0,.25,.71的不带权 的正交函数组 014.w即 02,:0x4200100,5, .,.;iiixx15,42101110,6,.5.3,.2;iiixx221150.1xx经计算可得 0122,.7536,.674,49.yy于是,按照(3-14) , 000111222,.53,78,.4,cy最后有长春理工大学本科毕业论文13* 21.7536.
27、08(.5)41,xx简化后得 * 21.025.860.437,xx与例 3.1 的结果完全相符。3.4 非线性模型举例容易检验,表 3-1 中的 是 的具有五位有效数字的近似值。在对物理系iyixe统进行数学分析时经常出现指数函数,于是也时有用形如或 (3-18)10cx10cxye等曲线拟合实验数据(3-1) ,其中 与 待定参数。直接就(3-18)的形式,通过极小化 1200imcxiiwye或 1200icmxiiye来确定 与 ,将导致求解关于 与 的非线性方程组,这样,不但比较难于0c1c1求解,而且一般不能求得精确解。通常的处理方法是通过取对数将(3-18)变换为线性形式,以便
28、使用前面描述的关于线性模型的最小二乘方法,具体地说,对方程 取对数,得10cxye(3-19)01lnycx是 与 的线性组合,用(3-19)的形式拟合实验数据(3-1) ,lny0()1x()x使 2010ln()mii iiwycx极小化,归结为求解关于 与 的正规方程lc1(3-20)001001 1(,)l(,)(,)ncy其中 .01(ln,l)myy例 3.3 表 3-2 中的离散数据 的分布属图 的情形,(,04)ixi10cxye利用表 3-2 中列出的值可以算得(取 )1mw长春理工大学本科毕业论文14, ,4200(,)15i4210(,)1.875ix,1,.iiA,40
29、(,)ln9.4iiyy10,1.2iix表 3-2iixiylniy2ixlniiy*ix0 1.00 5.10 1.629 1.0000 1.629 5.091 1.25 5.79 1.756 1.5625 2.195 5.782 1.50 6.53 1.876 2.2500 2.814 6.563 1.75 7.45 2.008 3.0625 3.514 7.444 2.00 8.46 2.135 4.0000 4.270 8.44正规方程如下: 015ln7.9.407.82c其解为 , .因 ,所求的拟合曲线为 0ln1.2c16c.203e*506()37xyxe表 3-2 的最后
30、一列给出 的值。*()i类似地,对方程 取对数,得10cxy(3-21)01lnycxA是 与 的线性组合。使lny0()1x()x2010l()miii iwycx极小化,仍归结为求解形如(3-20)的正规方程,这时 ,101(,)mxx不同于(3-19)形式的 .101(,)mx例 3.4 表 3-3 中的离散数据 符合图 的情形(3iyi10cxye长春理工大学本科毕业论文15表 3-3iixiylniy1ix2ilniyx*i0 1 1.95 0.66783 1 1 0.66783 1.9481 2 3.05 1.11514 0.5 0.25 0.55757 3.0602 3 3.55
31、 1.26695 0.33333 0.11111 0.42232 3.5573 4 3.85 1.34807 0.25 0.0625 0.33702 3.835从表 3-3 中已经算出的值并取 w0=w1=w2=w3=1,可得, ,320,4i201.46ix,31010,.8iiA30(,)ln4.97iiyy410,1.2iix于是,正规方程为 01ln2.83.97.4684cc经求解得, ;0ln1.576c1.95c1.5706.9ce因此拟合曲线为 *0.935/4.8xyx表 3-3 的最后一列给出 的值。*i另一类简单的易于线性化的非线性模型是形如或 (3-22)01ycx01
32、xyc等双曲线,它们的图象包括了形似 的各种情形。通过对方和取倒数,1e立即转化为线性地依赖参数 c0 与 c1.例 3.5 利用 拟合表 3-2 中所列的数据 ,对此方程01yx(,)04)ixyi取倒数得(3-23)01cxy考虑不带权的情形,极小化长春理工大学本科毕业论文1624010iiicxy得正规方程 0157436.829c其系数矩阵与例 3.3 相同,而右端常数 0.77436 与 1.11299 分别是与 的值。正规方程的解为 ,401(,)iiy410(,)ixy0.7139c.故拟合曲线为1.768c*1.27390.68xx的值依次为 5.16,5.74.6.46,7.
33、38,8.62,可与表 3-2 中 yi 的*ix(04)值相比较例 3.6 利用 拟合表 3-3 中所列的数据 ,取倒数即01xyc(,)03)ixyi得(3-24)10cyx极小化 23100iiicyx得正规方程 0142.83.2.608359cc其系数矩阵与例 3.4 相同,而右端常数 1.38212 与 0.83559 分别是与 的值。正规方程的解为 c0 = 0.16744 301(,)iiy410(,)iixyc1=0.34187。故拟合曲线为 *.16740.3187x(0i 3) 的值依次为 1.96,2.96,3.55,3.95,可与表 3-3 中的相应值比*x较。长春理
34、工大学本科毕业论文17第 4 章 连续函数的最佳平方逼近4.1 问题提法及正规方程从离散点的最小二乘曲线拟合可以很自然地过渡到连续函数的最佳平方逼近。设函数 , 是用于逼近 的函数类, 的fCab01,.nSpf2定义是带权函数 的 2-范数,即w(4-1)1222(),bagxgd,gCab其中 是(a,b)上的已知权函数。下面给出权函数的一个定义。定义 4.1 设 是定义在开区间 (a,b)上的可积的非负函数,而且在 (a,b)的任一开子区间上 不恒等于零,则称 是(a,b)上的一个权函数。()wxw这个范数确定一个距离,任一 与 的距离为 .记0njcf2f(4-2)2201 0(,.)
35、.()()bnanjIcfxfgxdwcx称为 逼近 时的平方误差。If最佳平方逼近就是极小化平方误差 :I找 ,使得*0njc(4-3)*0101(,.)inf(,.),nIcIc等价于.*22iff如果满足(4-3)的 存在,则称它为 在区间 上的最佳平方逼近函数。*,ab因 是由选定的基函数 生成的线性空间,可使问题至多归结为01,.n求解线性代数方程组。事实上,使 达极小值的必要条件是I,kc01,.n因为由(4-2 )有,02()()nbjkakIwxfcxdc所以要找的 的系数 是如下以 为未知数的 阶线性代数*01,.n1,.n1n长春理工大学本科毕业论文18方程组的解:(4-4
36、)0(,)(,)nikjkjcf0,1.n(4-5),(.bauvwxuvdx也称方程组(4-4)为正规方程,其系数矩阵为. (4-6)0100101(,)(,)(,)(,)(,)(,)nnnnG 由于 是基函数必线性无关,由文献8第一章定理 5.4 可知 的01,.n G行列式 ,因此正规方程定有唯一解。det下述引理 4.1 引自8,定理 1.5.4引理 4.1 设 是内积空间, 为内积, ,矩阵X(,)A12,nxX (4-7)12212(),(,)(,)(,)nnnxGxx 则 线性无关。12det0,nGx证明 注意到 齐次方程组det0, (4-8)11(,)(,)0nnjkjkj
37、jcxxc1,2n只有零解,而(4-9)121nj ncxcx 2111(,)0nnjjj, 1,0njkcx,n从以上等价关系可知, 等价于从(4-8)推出 ,而后者detG120ncc又等价于(4-9)推出 ,即 线性无关。12n 12,nx接着来证明由正规方程的解确定的 的解确使平方误差 达到极小.*I定理 4.1 设 是正规方程(4-4)的解,则*0,njc(0)jji长春理工大学本科毕业论文19(4-10)*22,ff而且最小平方误差为(4-11)2*01,. ,.nIcfff证明 先证(4-11).由已知条件有(4-12) *00*0*0,0nnjknkjknkjkkfcfcfcf
38、于是 2*2,.fffff再证(4-10 ) 。 ,仿(4-12)同样可证*,0,f由此及(4-12) , 22*22* *, 0,ff等价于 .*22ff于是,问题是如何具体地选取 ,常选取 是多项式组成的线性空间,或是以一组正交函数为基的线性空间。4.2 利用多项式作平方逼近设 ,即 利用 的元素对函数21,.,nSpanx,01,.jixn作最佳平方逼近,每个 是次数 的多项式, 。为了建立f n0jjxc正规方程,需计算如下积分:(4-13), ,1.,;, ,0,.bjkikabkkawxdjnffx 长春理工大学本科毕业论文20若不带权即 ,则计算()1wx(4-14)11, ,1
39、,.0,.;, ,.jkjkbjkikabkkaaxdjnnff然后求解形如(4-4)的正规方程,设所得解为 *01,.,ncc则得 的最佳平方逼近多项式 ,f *01nxx例 4.1 设 ,求 在区间 上的二次最佳平方逼近多项式 .()sinfxf, *函数类 .考虑不带权的情形。依(4-14) ,可得21,Spa0(,)1,0(),201(),3132142;50(,)sin,fxd10, ,222 34(,)sin.fxd正规方程(注意到系数矩阵的对称性)为 0122013,234.5cccc此方程组的解为 2031.46,c21237064.15.c因此 。*()4.50.5xxx当
40、时,从(4-14)得出正规方程的系数矩阵的一般形式为,ab长春理工大学本科毕业论文21(4-15)1.2.3112nHnn称为 Hilbert(希尔伯特)矩阵。建立次数较高的最佳平方逼近多项式常H常利用正交多项式。4.3 利用正交函数组作平方逼近现设 的基函数是关于区间 的带权 的正交组,01,.nSpa,abw即 20,bikika kjwxxdk(4-16),1,.jn则正规方程(4-4)简化为对角方程,其解为(4-17)*,0,.kkfc如果 的基函数还是规范的,则(4-18)*,1.kkfn这样,无须求解线性代数方程组即可获得函数 在 中的最佳平方逼fCab近函数 .*4.4 几种常见
41、的正交多项式(1)切比雪夫(Chebyshev)多项式, (4-()cosar)nTxx0x-1,n,19)是区间 上带权函数 的 n 次正交多项式,且满足递推关系式-1, 21=-( )(4-011(),()nnTxxT20)为证明切比雪夫多项式 是 次多项式,可利用三角函数关系式n( )( )cos()2coscos(1)n及 的定义,导出上面递推关系式,然后用数学归纳法证明切比雪夫01(),Tx长春理工大学本科毕业论文22多项式 是一个最高系数为 的 次多项式。()nTx12n证明: cos()cossin(1)co()2n1cs()css22ooc()nnar11()()nnTxTx由
42、(4-20 )式得 22334245356426753786428()81()07()1211xTxxxTx所以 是最高次数为 的 次多项式()nTxn为证明切比雪夫多项式的正交性,可直接计算积分,得 1 1jkjkjk2- - 0jkTx=xTd=d=j ,( ) ( )( , ) ( ) ( ) ( ) , ,由上可知, 是区间 上带权 的正交序列。01(),()nTxx: -1, 21-x( )(2)勒让德(Legendre)多项式(4-21)02()1()1,(2,)!nnnLxdLx是区间 上的 次正交多项式序列。1,显然 为 次多项式,且通过分部积分可以证明()nLx长春理工大学本
43、科毕业论文23(4-22)10,2k1(,)()jjkjkLxLd即正交性成立。证明:分部积分法12!nundvx11u12!2!nnnddxx通过递推可得 12()()(0nnnppp即 10,2k1(,)()jjkjkLxLd成立,得证。在一定条件下,正交多项式的积分区间端点 或 可以取在无穷远处,即ab或 可为 或 。ab(3)拉盖尔(Laguerre)多项式(4-0()1()()nxxnnLdee23)是区间 上带权 的 n 次正交多项式序列。0,()xe(4)埃尔米特(Hermite)多项式(4-022()1)()nnxxnHxdee24)是区间 上带权 的 n 次正交多项式序列。,
44、2()xe除正交多项式序列外,还常用三角函数序列作平方逼近,下面略加讨论。设长春理工大学本科毕业论文2401,2x21cos,sin,k kkx(4-25)1.是关于区间 的 的规范正交函数组。函数012,.n,wx在 中的最佳平方逼近函数 称为三角多项,fC012.nSpan *式,显然(4-26)2*0,nkkxf其中(4-27), ,1.2kkffdn依赖于正整数 ,当 时, 的极限称为 的 Fourier(傅里叶)级数。*n*fFourier 级数是描述从物理现象引出的各种微分方程的解的有力工具。例 4.2 设 容易算出,fxx201,fdx21 2,cos1kkfxk 21,in0k
45、f xd0,.因此, 中逼近 的三角多项式为f*21cos.2knkxx的 Fourier 级数是f *21limcs.knkxx因 ,故此级数对任何 均收敛。cos1kxR长春理工大学本科毕业论文25第 5 章 结论最小二乘曲线拟合是处理实验数据的常用方法,最佳平方逼近可以在一个区间上比较均匀地逼近“好”的连续函数,也有广泛应用。但是两者的正规方程当阶数较高时往往呈现出病态,因此必须谨慎对待和加以巧妙的处理。正交多项式的引入使数值稳定性得以较大的改善,然而构造正交函数组的 Gram-Schmidt 方法是递推的,误差随之传播,所以计算时仍然要小心。在使用每种正交序列时必须注意成立正交性的有关区间及权函数。可以通过对被逼近的函数作适当的变量替换,使所考察的区间与某种正交序列的有关区间相