1、第五章 函数近似计算的插值问题,Numerical Value Analysis,5.6 样条函数及三次样条插值,5.6 三次样条插值,样条:,是 指飞机或轮船等的制造过程中为描绘 出光滑的外形曲线(放样)所用的工具.,样条本质上是一段一段的三次多项式拼合而成的曲线,在拼接处,不仅函数是连续的,且一阶和二阶导数也是连续的,1946年,Schoenberg将样条引入数学,即所谓的样条函数,一、三次样条插值函数,定义1.,-(1),二、三次样条插值多项式,-(2),-(3),-(4),少两个条件,并且我们不能只对插值函数在中间节点的状态进行限制,也要对插值多项式在两端点的状态加以要求,也就是所谓的
2、边界条件:,第一类(一阶)边界条件:,第二类(二阶)边界条件:,第三类(周期)边界条件:,-(5),-(6),-(7),加上任何一类边界条件(至少两个)后,一般使用第一、二类边界条件,即,-(8),或,常用第二类边界条件.,-(9),加以整理后可得,-(10),-(11),由条件,由于以上两式相等,得,-(12),(12)式称为基本方程组,其中:,如果问题要求满足第一类(一阶)边界条件:,-(5),-(5),基本方程组(12)化为n-1阶方程组,-(13),即,将(13)式化为矩阵形式,-(14),这是一个三对角方程组,如果问题要求满足第二类(二阶自然)边界条件:,-(6),由(11)式,可知
3、,-(15),-(16),-(17),-(18),与基本方程组(12)联合,并化为矩阵形式,得,-(19),(19)式与(14)一样,都是三对角方程组,并且都严格对角占优,可以使用追赶法求解,并且解是唯一的,对于问题要求满足第三类(周期)边界条件,请同学们自己思考,现在回到(10)式,例.,定理 .,最后,介绍一个有用的结论,计算方法: 复习题5(5.3、5.7除外); 例题 5.1、5.6 ; 习题 5.2、5.3、5.4、5.5、5.13,19,问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。RESET检验中,采用所设定模型中被解释变量Y的估计值的若干次幂来充当该“替代”
4、变量。,例如,先估计 Y=0+ 1X1+v 得:,20,再根据第三章第五节介绍的增加解释变量的F检验来判断是否增加这些“替代”变量。若仅增加一个“替代”变量,也可通过t检验来判断。,21,例如,在一元回归中,假设真实的函数形式是非线性的,用泰勒定理将其近似地表示为多项式:,RESET检验也可用来检验函数形式设定偏误的问题。,因此,如果设定了线性模型,就意味着遗漏了相关变量X12、 X13 ,等等。,(*),22,因此,在一元回归中,可通过检验(*)式中的各高次幂参数的显著性来判断是否将非线性模型误设成了线性模型。,对多元回归,非线性函数可能是关于若干个或全部解释变量的非线性,这时可按遗漏变量的
5、程序进行检验。,23,例如,估计 Y=0+1X1+2X2+ 但却怀疑真实的函数形式是非线性的。,这时,只需以估计出的的若干次幂为“替代”变量,进行类似于如下模型的估计:,再判断各“替代”变量的参数是否显著地不为零即可。,24,例5.3.1:在4.3商品进口的例中,估计了中国商品进口M与GDP的关系,并发现具有强烈的一阶自相关性。然而,由于仅用GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。因此,序列相关性的主要原因可能就是建模时遗漏了重要的相关变量造成的。下面进行RESET检验。,25,用原回归模型估计出商品进口序列:,R2=0.9484,(-0.085) (8.
6、274) (-6.457) (6.692)R2=0.9842,26,在=5%下,查得临界值F0.05(2, 20)=3.49 判断:拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。,27,*(3)同期相关性的豪斯蔓(Hausman)检验,由于在遗漏相关变量的情况下,往往导致解释变量与随机扰动项出现同期相关性,从而使得OLS估计量有偏且非一致。因此,对模型遗漏相关变量的检验可以用模型是否出现解释变量与随机扰动项同期相关性的检验来替代。这就是豪斯蔓检验(1978)的主要思想。,28,当解释变量与随机扰动项同期相关时,通过工具变量法可得到参数的一致估计
7、量。而当解释变量与随机扰动项同期无关时, OLS估计量就可得到参数的一致估计量。,因此,只须检验IV估计量与OLS估计量是否有显著差异来检验解释变量与随机扰动项是否同期无关。,29,对一元线性回归模型Y=0+1X+,所检验的假设是 H0:X与无同期相关。,设一元样本回归模型为:,30,以Z为工具变量,则IV估计量为:,(*),(*)式表明,IV估计量与OLS估计量无差异当且仅当ziei=0,即工具变量与OLS估计的残差项无关。,31,检验时,求Y关于X与Z的OLS回归式:,在实际检验中,豪斯蔓检验主要针对多元回归进行,而且也不是直接对工具变量回归,而是对以各工具变量为自变量、分别以各解释变量为
8、因变量进行回归。,32,如对二元回归模型:,(*),33,通过增加解释变量的F检验,检验联合假设: H0:1=2=0 。拒绝原假设,就意味着(*)式中的解释变量与随机扰动项相关。,34,(4)线性模型与双对数线性模型的选择,无法通过判定系数的大小来辅助决策,因为在两类模型中被解释变量是不同的。为了在两类模型中比较,可用Box-Cox变换:,第一步,计算Y的样本几何均值。,第二步,用得到的样本几何均值去除原被解释变量Y,得到被解释变量的新序列Y*。,35,第三步,用Y*替代Y,分别估计双对数线性模型与线性模型。并通过比较它们的残差平方和是否有显著差异来进行判断。,Zarembka(1968)提出
9、的检验统计量为:,36,其中,RSS1与RSS2分别为对应的较大的残差平方和与较小的残差平方和,n为样本容量。,可以证明:该统计量在两个回归的残差平方和无差异的假设下服从自由度为1 的2分布。因此,拒绝原假设时,就应选择RSS2的模型。,37,例5.3.2 在4.3中国商品进口的例中,采用线性模型: R2=0.948;采用双对数线性模型: R2=0.973,但不能就此简单地判断双对数线性模型优于线性模型。下面进行Box-Cox变换。,计算原商品进口样本的几何平均值为:,计算出新的商品进口序列:,38,以Mt*替代Mt,分别进行双对数线性模型与线性模型的回归,得:,RSS1=0.5044,RSS
10、2=1.5536,于是,,在=5%下,查得临界值20.05(1)=3.841 判断:拒绝原假设,表明双对数线性模型确实“优于”线性模型。,5.4从传统建模理论到约化建模理论,一、传统建模理论与数据开采问题 二、“从一般到简单”约化建模型理论 三、非嵌套假设检验 四、约化模型的准则,40,一、传统建模理论与数据开采问题,传统计量经济学的主导建模理论是“结构模型方法论” 以先验给定的经济理论为建立模型的出发点, 以模型参数的估计为重心, 以参数估计值与其理论预期值相一致为判断标准,,41,是一个“从简单到复杂”的建模过程(simple-to-general approach):对不同变量及其数据的
11、偿试与筛选过程。,传统建模方法主要的缺陷:建模过程的所谓“数据开采”(Data minimg)问题。 数据开采:对不同变量及其数据的偿试与筛选。 这一过程对最终选择的变量的t检验产生较大影响,42,当在众多备选变量中选择变量进入模型时,其中t检验的真实的显著性水平已不再是事先给出的名义显著性水平。 显著性水平意味着将一个无关变量作为相关变量选入模型而犯错误的概率。,罗维尔(Lovell)给出了一个从c个备选变量中选取k个变量进入模型时,真实显著性水平*与名义显著性水平的关系:*=1-(1- )c/k,43,例如: 给定=5%,如果有2个相互独立且与被解释变量无关的备选变量,误选一个进入模型的概
12、率就成了 1-(1-0.05)2=0.0975 传统建模方法的另一问题是它的“随意性”。其结果是:对同一研究对象,使用同一数据,但不同的建模者往往得出不同的最终模型。,44,二、“从一般到简单”约化建模型理论,该理论认为:在模型的最初设定上,就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,各种可能的“简单”模型都被“嵌套”(nested)在这个“一般”的模型之中。然后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。这就是所谓的“从一般到简单”(general-to-specific)的建模理论。,45,(1)约化建模理论提出了一个对不同先
13、验假设的更为系统的检验程序;(2)初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采”问题;(3)由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在相同的约化程序下,最后得到的最终模型也应该是相同的。,特点:,46,例题:,例3.5.1曾建立了一个中国城镇居民食品消费模型:Q=f(X,P1,P0) 然而,有理由认为X、P1、P0的变化可能会经过一段时期才会对Q起作用,因为消费者固有的消费习惯是不易改变的。于是,可建立如下更“一般”的模型:,47,在估计该模型之前,并不知道食品消费需求是怎样决定的,但可以考察几种可能的情况:,例如认为,对食品的消费需求是一个“静态”行为,只有当期的因素发生作用:,(*),48,也可以认为,由于食品是必需品,P1的变化并不对Q产生影响,但仍受P0与X变动的影响,然而后者的影响却有着一期的滞后:,可以看出,(*)、(*)都是原一般模型的特例,即都可通过对原一般模型施加约束得到。,(*),如果一个模型可通过对“一般”模型施加约束得到,则称该模型“嵌套”在一般模型之中。,