1、2018/6/9,经济贸易学院 熊维勤,1,计量经济学基础,第六章 自相关,2018/6/9,经济贸易学院 熊维勤,2,主要内容,第一节、非自相关假定第二节、自相关的来源与后果第三节、自相关的检验第四节、自相关的解决办法第五节、自相关系数的估计第六节、案例,2018/6/9,经济贸易学院 熊维勤,3,如果对于不同的样本点,随机误差项之间存在着某种相关性,则认为出现了序列相关性,也就是存在着自相关。即,,一、自相关的概念: 对于总体线性回归模型: Yi=0+1X1i+2X2i+kXki+ui i=1,2, ,T,随机误差项互不相关的基本假设表现为 Cov(ui , uj)=0 ij, i,j=1
2、,2, ,T,Cov(ui , uj)0 ij, i,j=1,2, ,T,第一节 非自相关假定,2018/6/9,经济贸易学院 熊维勤,4,即因变量Yi的取值会对Yj的取值产生影响。,由于,因此随机误差项存在序列相关性意味着:,第一节 非自相关假定,2018/6/9,经济贸易学院 熊维勤,5,(1)如果误差项只与其滞后一期的值相关,则称误差项存在着一阶自相关。即:,二、自相关的分类,1、按自相关表现形式分类,(2)如果误差项与其滞后若干期(大于1期)的值相关,则误差项存在着高阶自相关。即 :,2018/6/9,经济贸易学院 熊维勤,6,计量经济学中最常见的自相关形式为一阶线性自回归形式,即:u
3、t=1 ut-1 +vt其中,1称为自回归系数; vt是满足标准的OLS假定的随机误差项:,二、自相关的分类,2018/6/9,经济贸易学院 熊维勤,7,根据最小二乘原理和相关系数的定义,可以得到:,ut=ut-1 +vt -11,即在大样本条件下,一阶自回归系数等于该二个变量的相关系数。由此,误差项的一阶线性自回归形式可写为,,二、自相关的分类,2018/6/9,经济贸易学院 熊维勤,8,如相关系数大于0,则称误差项存在着正自相关;如相关系数小于0,则称误差项存在着负自相关。,注意:自相关不是指两个或两个以上的变量之间的相关关系,而是指一个变量前后期数值之间存在的相关关系。,二、自相关的分类
4、,2、按相关系数大小分类,2018/6/9,经济贸易学院 熊维勤,9,第二节 自相关的来源与后果,大多数经济时间序列数据都有一个明显的特点惯性,表现为滞后值对本期值具有影响。,例如:GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利率或课税的升高)出现才把它拖慢下来。,1、经济变量固有的惯性,一、自相关的来源,2018/6/9,经济贸易学院 熊维勤,10,2、模型设定的偏误,所谓模型设定偏误(Specification error)是指所设定的模
5、型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。,例如,本来应该估计的模型为 Yt=0+1X1t+ 2X2t + 3X3t + ut,但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt,因此, vt=3X3t + ut,如果X3确实影响Y,则随机误差项中有一个重要的系统性影响因素,使其呈序列相关性。,2018/6/9,经济贸易学院 熊维勤,11,3、数据的“加工整理”,例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的平滑性,这种平滑性本身就能使干扰项中出现系统性的因素,从而出现序列相关。 还有就是两个时间点之间
6、的“内插”技术往往导致随机项的序列相关性。,在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,从而表现出序列相关性。,2018/6/9,经济贸易学院 熊维勤,12,4、蛛网现象,例如,农产品供给对价格的反映本身存在一个滞后期: St= 0+1Pt-1+ut意味着,农民由于在年度t的过量生产(使该期价格下降)很可能导致在年度t+1时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。,2018/6/9,经济贸易学院 熊维勤,13,一般经验,一般经验告诉我们,对于采用时间序列数据的计量经济模型,由于不同样本点上随机误差项在时间上是连续的,因此
7、它们对被解释变量的影响也存在连续性,所以往往会存在序列相关性。需要注意的是:在截面数据中也可能产生序列相关性(截面数据中的序列相关常称为空间相关)。例如在研究家庭收入与消费的关系中,家庭之间的消费攀比就可能产生空间相关现象。,2018/6/9,经济贸易学院 熊维勤,14,二、自相关存在的后果1、参数的OLS估计量仍然具有无偏性和线性性2、参数的OLS估计量不再具有最小方差性。当存在正自相关性时,OLS估计会低估参数估计量的真实方差;这就意味着在变量的显著性检验中,当存在正序列相关时,由OLS估计得到的参数方差可能低于真实方差,从而导致t统计量值变大,拒绝原假设i=0的可能性增加,因此t检验失去
8、意义;同时,参数的区间估计也不再准确。3、可能低估随机误差项ui的方差,从而导致模型预测失效,第二节 自相关的来源与后果,2018/6/9,经济贸易学院 熊维勤,15,基本思路序列相关性检验方法有多种,但基本思路和步骤是相同的。首先采用普通最小二乘法估计模型,以求得随机误差项ui的“近似估计量”:然后,通过分析这些“近似估计量”之间的相关性,以达到判断随机误差项是否具有序列相关性的目的。,第三节 自相关的检验,2018/6/9,经济贸易学院 熊维勤,16,1、图示法由于残差项ei可以作为随机误差项ui的近似估计,因此如果ui存在序列相关,必然由残差项ei反映出来。因此可利用ei的变化图来判断随
9、机误差项ui的序列相关性。,第三节 自相关的检验,2018/6/9,经济贸易学院 熊维勤,17,2018/6/9,经济贸易学院 熊维勤,18,2、德宾-沃森(Durbin-Watson)检验法,D-W检验是德宾(J.Durbin)和沃森(G.S. Watson)于1951年提出的一种检验序列自相关的方法。(使用范围:一阶自相关),(1)解释变量 X非随机,或者在重复抽样中被固定;(2)随机误差项ui为一阶自回归形式: ui=ui-1+i(3)回归模型中不应含有滞后被解释变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+ui(4)回归含有截距项;(5)没有缺失数据。,
10、该方法的适用条件是:,2018/6/9,经济贸易学院 熊维勤,19,2、德宾-沃森(Durbin-Watson)检验法,1、确定检验假设,2、构造统计量,该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。但是,Durbin和Watson成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。,2018/6/9,经济贸易学院 熊维勤,20,计算D.W.统计量的值,根据样本容量n和解释变量数目k查D.W.分布表,得到临界值dL和dU,按照下列准则考察计算得到的D.W.值,以判断随机误差项是否存在一阶自相关。
11、,2、德宾-沃森(Durbin-Watson)检验法,3、进行DW检验,2018/6/9,经济贸易学院 熊维勤,21,DW检验决策规则,2018/6/9,经济贸易学院 熊维勤,22,用坐标图更直观表示DW检验规则:,2018/6/9,经济贸易学院 熊维勤,23,容易证明,当D.W.值在2左右时,模型不存在一阶自相关。,2、德宾-沃森(Durbin-Watson)检验法,2018/6/9,经济贸易学院 熊维勤,24,如果存在完全一阶正相关,即 =1, 则 D.W. 0 如果存在完全一阶负相关,即 = -1, 则 D.W. 4如果完全不相关,即 =0, 则 D.W.2,2、德宾-沃森(Durbin
12、-Watson)检验法,2018/6/9,经济贸易学院 熊维勤,25,注意:(1)从判断准则看到,存在一个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。 (2)D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关; (3)经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。 所以在实际应用中,对于序列相关问题一般只进行D.W.检验。,2、德宾-沃森(Durbin-Watson)检验法,2018/6/9,经济贸易学院 熊维勤,26,3、LM检验(或BG检验),此方法不仅适用于一阶自相关检验,也适用于高阶自相关的检验。检验步骤:1、用OLS
13、对回归模型进行,得到残差序列et;2、运用残差序列和样本观测值中的解释变量,建立如下辅助回归模型并进行OLS估计,得到样本可决系数R2;,LM检验的检验假设为:,2018/6/9,经济贸易学院 熊维勤,27,3、构造LM统计量:4、查分布表,求得临界值:,3、LM检验(或BG检验),2018/6/9,经济贸易学院 熊维勤,4、回归检验法,1、用原始样本数据进行OLS回归,得到残差序列et2、以et为被解释变量,以各种可能的相关量,如et1、et2 、(et1 )2等为解释变量,进行多种形式的辅助回归:,2018/6/9,经济贸易学院 熊维勤,29,4、回归检验法,如果存在某一种函数形式,使得估
14、计参数具有显著性,则说明随机误差项存在该种形式的序列相关性。,回归检验法的优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。缺点是计算量大。,2018/6/9,经济贸易学院 熊维勤,30,如果随机误差项被检验证明存在序列相关性,首先应分析产生自相关的原因,如果是由于模型设定偏误,则应修改模型的数学形式。,怎样查明自相关是由模型设定偏误引起的?一种方法是用残差et对解释变量进行较高次幂回归,然后对新残差作DW检验,如果此时自相关消失,则说明模型设定存在偏误。,第四节自相关的解决方法,2018/6/9,经济贸易学院 熊维勤,31,如果模型产生自相关的原因是模型中省略了
15、重要解释变量,则解决方法就是找出被省略了的解释变量,将其作为解释变量列入模型。,怎样查明此种自相关?一种方法是用残差et对那些可能影响被解释变量而未被列入模型的解释变量进行回归,并作显著性检验,从而确定该解释变量的重要性。,第四节自相关的解决方法,2018/6/9,经济贸易学院 熊维勤,32,只有当上两种引起自相关的原因都消除以后,才能认为随机误差项“真正”存在自相关,此时需要对原模型进行变换,使变换以后的模型的的随机误差项自相关得以消除,进而利用普通最小二乘法估计回归参数,最常用的方法是广义最小二乘法(GLS: Generalized least squares),这种方法是对原模型进行适当
16、变换以消除误差项的自相关,进而利用OLS来估计回归参数,相应的回归参数估计结果称为广义最小二乘估计量。,第四节自相关的解决方法,2018/6/9,经济贸易学院 熊维勤,33,对于多元线性回归模型,如果随机误差项存在一阶自相关,则可以按照如下思路来矫正自相关对模型估计结果的影响。,GLS的基本原理:,上述过程中的变量变换称为广义差分变换,对变换后的模型即可进行OLS估计,相应的回归参数估计估计量称为广义最小二乘估计量。,2018/6/9,经济贸易学院 熊维勤,34,注意:,上述广义差分变换使得样本观测值由T个减少为T个,为了弥补这一缺陷,通常在变换后的模型估计过程中,加入下述观测值。,当误差项存
17、在高阶自相关时,可以按照同样的方法进行广义差分变换,然后运用OLS估计各个回归参数值。如果广义差分变量回归结果中仍然存在自相关,则可以对广义差分变量再进行广义差分,直到消除误差项的自相关为止。,2018/6/9,经济贸易学院 熊维勤,35,第五节随机误差项相关系数的估计,应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1, 2, , n 。 实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。 常用的估计方法有:,根据DW值计算和根据德宾两步法计算,2018/6/9,经济贸易学院 熊维勤,36,一、根据DW值来计算,二、德宾两步法(以一阶自相关为例),第一步,变换差分模型为下列形式,进行OLS估计,得到Yt-1前的系数 的估计值,第二步,将得到的自相关系数的估计值代入原广义差模型,即可运用OLS估计得到各个GLS估计量。,2018/6/9,经济贸易学院 熊维勤,37,附:应用软件中的广义差分法,注意,上面两种方法给出的都只是的近似估计,精确的估计要使用科克伦-奥科特(Cochrane-Orcutt)迭代法。Eview提供了科-奥迭代法进行自相关修正的软件实现。具体方法是:在解释变量中引入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。,