1、第五章 设定检验与模型选择,本章内容第一节 模型误设定:类型及后果第二节 误设定的检验第三节 模型选择,前面有关章节介绍了经典线性模型的建立、参数估计方法、假设检验以及对于违背经典假设情况的技术处理方法等内容,在实际建模的过程中,我们还将遇到解释变量筛选与模型选择等方面问题,本章将具体介绍模型误设定检验方法、解释变量的筛选原则以及备选模型间的选择标准。,第一节 模型误设定:类型及后果 采用OLS法估计模型时,实际上有一个隐含的假设,即模型是正确设定的。这包括两方面的含义:函数形式正确和解释变量选择正确。在实践中,这样一个假设或许从来也不现实。我们可能犯下列三个方面的错误: 选择错误的函数形式遗
2、漏有关的解释变量包括无关的解释变量从而造成所谓的“误设定”问题,误设定(misspecification)亦称设定误差(specification error)。,这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。因此,我们应当根据实际问题,选择正确的函数形式。,一、选择错误的函数形式,选择正确的函数形式是计量经济学家的任务,这是因为,经济理论通常不会告诉我们因变量和解释变量之间的具体函数形式是什么。解决这个问题,很大程度上要靠计量经济工作者在实践中不断摸索。下面介绍几种比较常见的函数形式的模型: 半对数模型
3、双曲函数模型 多项式回归模型,1. 半对数模型 半对数模型指的是因变量和解释变量中一个为对数形式而另一个为线性的模型。因变量为对数形式的称为对数-线性模型(log-lin model)。解释变量为对数形式的称为线性-对数模型(lin-log model)。,我们先介绍前者,其形式如下: 对数-线性模型中,斜率的含义是Y的百分比变动,即解释变量X变动一个单位引起的因变量Y的百分比变动。这是因为,利用微分可以得出:,这表明,斜率度量的是解释变量X的单位变动所引起的因变量Y的相对变动。将此相对变动乘以100,就得到Y的百分比变动,或者说得到Y的增长率。由于对数-线性模型中斜率系数的这一含义,因而也叫
4、增长模型 (growth model)。增长模型通常用于测度所关心的经济变量(如GDP)的增长率。例如,我们可以通过估计下面的半对数模型 得到一国GDP的年增长率的估计值,这里t为时间趋势变量。,案例5.1 测算1978-2010中国国内生产总值的增长率,名义值,不变值,案例5.2 19492003年的中国人口增长率,斜率0.01685表示,平均而言,中国人口的年增长率为0.01685,即人口以每年1.685的速度增长。 截距项10.924可解释为: 10.924log(Y0),即Y0 55475.68,可解释为1948年的人口数。,线性-对数模型的形式如下:,与前面类似,我们可用微分得到,上
5、式可改写为,这表明,上式表明,Y的绝对变动量等于 乘以X的相对变动量。若将后者乘以100,则上式给出了X每变动一个百分点所引起的Y的变动量。 因此, 线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题。,2.双曲函数模型,双曲函数模型的形式为:,不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法将其线性化。 双曲函数模型的特点是,当X趋向无穷时,Y趋向 ,反映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线(Y= )。 双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线。,多项式回归模型通常用于描述生产成本函数,其一般形式为: 其中Y表示总成本
6、,X表示产出,p为多项式的阶数,一般不超过四阶。 多项式回归模型中,解释变量X以不同幂次出现在方程的右端。这类模型也仅存在变量非线性,因而很容易线性化,可用OLS法估计模型。,3. 多项式回归模型,例5.1 总成本函数假设存在如下假想数据来描述某种成本-产出关系,见表5-1。用这些数据,我们来说明多项式模型。表5-1 成本-产出数据,从下面的散点图可以看出二者是非线性关系,因此试用多项式模型进行线性回归。图 5-1 成本-产出数据散点图,回归结果如下(括号中数字为t值):从估计结果可以看出,模型的决定系数为0.998,拟合很好,所有参数都显著。可见,采用三次多项式模型比较理想,拟合效果见下图:
7、图 5-2 三次多项式模型拟合效果,二、 模型中遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的后果是:将使模型参数估计量不再是无偏估计量。下面用一个简单例子说明。设正确模型为: (5-9)而实际估计的模型是: (5-10)也就是说,我们忽略了X2 ,而X2是一个对Y有影响的重要变量。 估计(5-10)式,可得: (5-11)而由(5-9)有: (5-12),(5-12)代入(5-11),得:,取期望值,得:,上式中右边第三项等于0,而第二项方括号中内容可以看作是回归方程中斜率系数的估计量,可以预期,X1和X2之间存在一定程度的相关,从而第二项不等于0,故:事实上,可以证明: (
8、5-13),同样道理,可以证明 ,因此,如果遗漏变量与模型中的变量相关,则 和 都是真实参数的有偏估计量,还可以进一步证明 和 都是不一致的,即无论样本容量有多大,偏差都不会消失。同时,根据式5-10得到的误差方差是真实误差方差的有偏估计量,从而,的方差也是真实估计量的方差的有偏估计量。因此,参数估计的置信区间和假设检验过程都不再可靠。结论:遗漏有关解释变量将使参数估计量有偏,可能产生非常严重的后果,因此,模型设定时必须格外谨慎。,例5.2 进口支出函数,我们通过一个实例对上面讨论的模型中遗漏有关解释变量问题做一说明。表5-2给出了19681987年间美国的进口支出及个人可支配收入(PDI)(
9、税后收入)的数据。以1982年的美元价为基准度量单位,以消除通货膨胀的影响。,表5-2 U.S进口商品支出(Y)与个人可支配收入(X),19681987,资料来源:经济计量学精要,达莫达尔 N. 古亚拉提著。单位为亿美元(1982年价),凯恩斯消费函数理论表明:个人的消费支出与个人可支配收入正相关。由于对外国物品的消费是总消费支出的一部分,因此,可以认为进口支出与个人可支配收入正相关。模型的形式为: 其中,Y表示进口的消费支出,X表示个人可支配收入,拟合表5-2给出的数据,得到如下回归结果(括号中数字为t值):现在,假定“真实”的进口支出函数如下:其中,Y表示进口支出, 为个人可支配收入(PD
10、I),是时间或趋势变量,它代表人口、偏好和技术变动等其它影响进口的因素,取值为1, 2, 20。,仍用表5-2的数据,对加了时间趋势变量的式进行回归,结果如下: 注意两个回归结果的几个特点:(1)错误设定式表明:PDI每增加一美元,平均而言,用于进口商品上的支出将会增加25美分;也就是说,进口支出的边际倾向为25美分。而真实模型表明:由于考虑到趋势变量的影响,因而,PDI每增加一美元,平均而言,用于进口商品的支出将会增加大约65美分。在这个例子中,错误设定方程低估了真实的边际进口支出倾向,也就是说,它有一个向下的偏差。,(2)截距也是有偏的,在这里它高估了真实的截距值(注意-261是大于-85
11、9的)。(3)从两个模型中所估计的扰动项方差也明显不同,分别是184和475。(4)截距和斜率( )的标准差也明显不同。 所有的这些结果都与前面的讨论一致。如果根据错误设定的方程来进行假设检验的话,则得出的结论是令人怀疑的。毫无疑问,从模型中略去相关变量可能产生非常严重的后果。因此,在建立模型时,必须小心谨慎。需要对研究现象中所蕴含的经济理论作深入的了解,从而把相关的变量都包括进模型中。,三、 模型中包括无关的解释变量模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。我们同样用一个简单例子说明之。 设正确模型为: (5-19)而实际估计的模型是: (5-20) 也就
12、是说,X2 与Y无关,因而应有 。可以证明 ,即 是真实参数 的无偏估计量。但是,由于r12一般不等于0,因此我们有:,结论:模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。估计参数的置信区间进而变宽,从而使得我们无法认识到被解释变量与解释变量之间的显著关系。,而:,第二节 误设定的检验 针对第一节介绍的各种误设定类型,本节给出几种常用的检验方法。 一、包含无关变量检验 二、遗漏重要变量检验 三、检验误设定的RESET方法 四、拉格朗日乘数(LM)检验,一、包含无关变量检验,对于模型中是否包含无关变量的情况,最直接的一个检验方法就是t检验,即检验单个变量前系数估计
13、值的显著性。针对不能确定几个变量是否真的属于模型的情况,也可以使用第二章介绍的若干个系数联合显著性的F检验。需要特别注意的是,在许多个自变量中查找是否存在无关变量时,一定不能脱离模型的理论基础,不要轻易将理论上很重要但未通过显著性检验的变量删除。实际建模中经常会使用逐步回归的方法,即从一个较小模型开始,逐步筛选可以进入模型的变量。,实践中我们可以使用逐步回归的思想以避免无关变量进入模型,同时要结合所研究问题的重点,最终目标是得到有理论支持的好模型:其所有估计系数都具有“正确的”符号、基于t和F检验都是统计显著的、值足够高、DW统计量的值可以接受等等。,二、遗漏重要变量检验,考虑一个双变量线性回
14、归模型假设要检验模型是否遗漏了一个解释变量,则要做的是估计下面的模型并检验 是否为零。另外一种做法是先估计原模型,得到残差et,然后将其对 和 进行回归,检验变量 前的系数是否为零。请注意是将残差对所有解释变量进行回归估计,而并非仅仅针对疑似遗漏的变量。因为仅对疑似遗漏变量估计得到的 的系数估计量是非一致估计量(除非系数真实值为零),且其分布较复杂,使用最小二乘估计得到的标准误差不正确。,此外,可以通过残差图的变化进行判定,如果模型遗漏了一个重要变量,残差图将会显示出较明显的变动趋势或不同的形状。我们以第一节中提到的生产成本函数为例,假定真实的总成本函数可表示为 但研究者拟合为二次函数: 而另
15、一研究者则拟合为线性函数:,例5.3 不同多项式模型拟合效果的比较,我们仍以例5.1的数据为例,考虑短期内某商品产出与其总生产成本的关系,对以上三个模型进行估计,得到回归结果如下(括号中数字为t值):,回顾例5.1中对三次多项式模型的回归结果,如下:,以上三个回归模型,决定系数依次提高,即表明模型越来越接近真实。下面从残差变动角度来看,三组残差图如下:,从上图看出,在逐渐接近真实模型的过程中,随着残差绝对值的变小,残差变动呈现的周期趋势也逐渐消失。由此可见,利用对残差图的定性分析也可对模型是否遗漏重要变量作出判断。,三、 检验误设定的RESET方法 RESET检验法的思路是在要检验的回归方程中
16、加进 等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。 直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过F检验, 表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题。 等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果存在误设定,则用这样一个装置可以很好地代表它们。,RESET检验法的步骤 拉姆齐RESET检验的具体步骤是:(1) 用OLS法估计要要检验的方程,得到 (2) 由上一步得到的值 (i=1,2,n),计算 ,然后用OLS法估计: (3) 用F检验比较两个方
17、程的拟合情况(类似于上一章中联合假设检验采用的方法),如果两方程总体拟合情况显著不同,则我们得出原方程可能存在误设定的结论。使用的检验统计量为:,其中:RSSM为第一步中回归(有约束回归)的残差平方和,RSS为第二步中回归(无约束回归)的残差平方和,M为约束条件的个数,这里是M=3。 应该指出的是,拉姆齐RESET检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定,或者说,不能告诉我们正确的模型是什么。但该方法毕竟能给出模型误设定的信号,以便我们去进一步查找问题。另一方面,如果模型设定正确,RESET检验使我们能够排除误设定的存在,转而去查找其它方面的问题。,在Eview中,回归出方
18、程中,reset检验的命令如下: ViewStability TestsRamsey RESET Test,例5.4 误设定检验在本例中,我们使用中国19922009年城镇居民人均食品消费和人均可支配收入的实际数据来估计凯恩斯消费函数。方程形式: 其中:C代表食品消费,Y代表收入。原始数据如下表所示。,表5-3 我国1992-2009年城镇居民人均食品消费和人均可支配收入,资料来源:根据中国统计年鉴2010数据计算得到。,从回归结果来看,方程的拟合优度很高,斜率系数显著,但DW值低。 为了检验模型设定是否正确,采用RESET方法。,由于P=0.00005.991所以拒绝原假设,表明式(5-23
19、)存在误设定。,第三节 模型选择 现实中,模型拟合的过程其实主要就是变量筛选的过程,在相关理论的基础上,同时考虑变量的数据可得性以及替代变量适用性等问题,哪些变量应引入模型,哪些变量应剔除,应结合研究问题的重点综合考虑。同样的问题,十个计量经济学家有可能最终给出十个不同的模型结果。“经验”和“艺术”在建模中非常重要,实际操作中的一些技术因素也有一定规律可循,接下来将介绍一些模型选择中的技术方法。,一、 变量选择的一般原则,根据第一节中对各类误设定后果的分析,我们知道在模型设定中的一般原则是尽量不遗漏有关的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义
20、了,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中做出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。,选择解释变量的四条准则,1.理论: 从理论上看,该变量是否应该作为解释变量包括在方程中?2. t检验:该变量的系数估计值是否显著?:该变量加进方程中后, 是否增大?4. 偏倚: 该变量加进方程中后,其它变量的系数估计值是否显著变化?,如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”, 则该变量是无关变量,可以安全地从方程中删掉它。,但根据以上准则判断并不总是这么简单。在很多情况下,这四
21、项准则的判断结果会出现不一致。例如,有可能某个变量加进方程后, 增大,但该变量不显著。 因此,当这四项用于判断一个变量是否应加进回归方程的准则出现不一致的情况时,应当特别小心。在这种情况下,作出正确判断不是一件容易的事,但可以让事情变得容易一些,办法是将理论准则放在第一位,再多的统计证据也不能将一个理论上很重要的变量变成“无关”变量。 在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则。如果不这样做,产生不正确结果的风险很大。,实践中,要解决的一个问题是如何从大量的潜在解释变量的集合中选择一个最合适的子集,以
22、得到一个正确设定的模型。 上个世纪六十年代后相当一段时间,人们使用逐步回归法来解决解释变量的选择问题。这种由计算机机械挑选变量的做法如今已不流行了。目前比较通行的做法是从少量精心设定的备选模型中选择一个。 计量经济学家就此提出了很多基于统计学的选择标准,我们这里讨论其中几种,如表54所示。,二、 有关模型选择的几个判断准则,令RSSj表示第j个模型(有kj个解释变量)的残差平方和,并定义 为第j个模型的的 估计值。我们 用表示包含全部k个解释变量的模型的 估计值。,表54 选择回归模型的准则,准则 计算公式,1. 准则 希尔(Theil)的 准则基于如下假设:所考虑的模型中有一个是正确模型。对
23、于正确模型, ,对于不正确模型, 。因此,选择 最小的模型一般就能选出正确模型。由于 最小化与 最大化是一回事,我们习惯上称该准则为 最大准则。 这个准则的主要问题是,一个包括正确模型的所有解释变量但同时也包括一些无关变量的模型也会给出 ,在这种情况下,我们所选择的其实并非正确模型。当备选模型包含大量无关变量时,选出正确模型的概率较低。,在一个实际问题的回归建模中, 越大,所对应的回归方程越好。如果我们仅从拟合的角度追求“最优”,则所有回归子集中 最大者对应的回归模型就是“最优”模型。,2. 基于预测的均方误差最小的三个准则 希尔的准则是基于回归的标准误差最小,下列三个准则则是基于预测的均方误
24、差(MSE)最小。这三个准则是: 马娄斯(Mallows)的 准则 霍金(Hocking)的 准则 阿美米亚(Amemiya)的PC准则 假设正确的方程有k个解释变量,我们考虑的方程有 个解释变量,问题是如何选择k1以及具体的k1个解释变量的集合。在上述三个预测准则中,这是通过使的均方误差 达到最小实现的,其中 是Y的未来值,而 是预测值。,另一件要注意之事是, 最大准则与预测准则 、 或PC回答的是两个不同的问题。 在 最大准则的情况下,假定备选模型中有一个是正确的,我们要做的是挑出“正确”模型。 而在三个预测准则的情况下,我们感兴趣的是改善预测的MSE,只要能改善,可以去掉某些变量,即便是
25、正确模型中包括它们也在所不惜。,3. 赤池信息准则(AIC) 赤池信息准则(Akaikes Information Criterion,AIC)是一个更一般的准则,它可以应用于任何一个可用极大似然法估计的模型。对于我们这里的应用,AIC的计算公式为 与赤池信息准则类似的还有施瓦茨信息准则(Schwarz information criterion,SIC): 上述两个准则与前述准则 一样,可用于模型选择,其值也是越小越好。,在回归分析的建模过程中,对每一个回归子集计算AIC,其中AIC最小者所对应的模型是“最优”回归模型。 AIC准则只能用于比较同一种方法拟合得到的回归模型。,71,下面用一个
26、实际经济例子,对所有回归子集计算上述四个统计量,综合比较一下“最优”回归子集的选择。,【例5.5】用y表示某种消费品的销售额,x1表示居民可支配收入,x2表示该类消费品的价格指数,x3表示其他消费品平均价格指数。表中给出了某地区18年来某种消费品情况资料,试建立该地区该消费品销售额预测方程。,72,73,74,由5项指标均可看出x1,x2,x3是“最优”子集,x1,x3是“次优”子集。因为这个实际问题所涉及的自变量本来就较少,所以从几个准则看到全模型是“最优”的。这种情况在自变量只有少数几个时是常见的,但当涉及的自变量数目较多时,很少见到全模型是最优的。,75,再说我们讲的最优是相对而言,在实际问题的选模中,应综合考虑,或根据实际问题的研究目的从不同最优角度来考虑。如有时希望模型各项衡量准则较优,得到的模型又能给出合理的经济解释;有时只从拟合角度考虑;有时只从预测角度考虑,并不计较回归方程能否有个合理解释;有时要求模型的各个衡量准则较优,而模型最好简单些,涉及变量少些;有时还看回归模型参数估计的标准误差大小等。 从本例来看,x1,x2,x3和x1,x3和x1,x2模型相对较好,但从实际经济角度考虑,x2和x3相关度很高,所以应选择x1,x3或x1,x2;或转换变量,采用新变量x4x2/x3。,76,作业:对例5.5的方程进行误设定检验,看看哪些方程有误设定,哪些方程无误设定。,