1、第十一章 自相关,目录,第一节自相关的定义和形成原因 第二节 自相关的后果 第三节 自相关的检验 第四节 自相关的修正 作业,第一节自相关的定义和形成原因P243-246,一、自相关含义 二、从散点图观察自相关模式 三、自相关的形成原因 返回,一、自相关的含义,经典线性回归模型的一个假定是无自相关,即随机扰动项之间不存在相关关系 自相关:随机扰动项之间存在相关关系,即随机扰动项之间相互影响,两个例子,理解自相关含义:二个例子,产出对于资本和劳动投入的回归中 如果某个季度发生了罢工,影响了当季产出,并且如果这个季度的罢工这个随机扰动,影响了下一季度的产出,这就被称为自相关:两个季度的产出的波动有
2、相关性 分析家庭支出和家庭收入关系的横截面数据时: 一个家庭的一个随机的收入增加导致其消费增加,通过攀比、模仿效应影响到其他家庭,导致这些家庭消费增加。这也被称为自相关:两个家庭的支出的波动有相关性。返回,二、从散点图观察自相关模式 p313,1、注意和异方差的散点图相互区别: 横坐标不同 纵坐标不同 2、观察其有无系统性运动模式 a-d表示存在自相关 返回,三、自相关的形成原因,1、经济时间序列数据的惯性:随着时间的流动,“自行运动” 例如GDP数据:按经济周期运动,在萧条底部开始向上运动,后一期值总是大于前一期值, 呈现P245图12-1b模式 经济时间序列数据容易发生自相关现象,2、模型
3、设定误差:模型没有正确设定,包括 遗漏重要变量 选择了错误的函数形式 3、蛛网现象 某种商品的供给量因受前一期价格影响而表现出来的某种规律性(如呈蛛网状收敛或发散于供需的品平衡点 4、数据加工 数据的外推和内插: 例:2001-2005年的数据中,缺少2003年数据,一般是根据一个假定,由其他年份的数据内插计算出来,这种数据加工会带来自相关性 返回,5、滞后效应:随机干扰因素的影响持续几个时期 例:前例罢工之例 6、其他: 例:前例家庭收入和开支的横截面数据分析之例,第二节 自相关的后果 P315,一、数据存在自相关时,OLS估计量依然是线性无偏估计量 (证明OLS估计量具有线性、无偏性时没有
4、用到无自相关假定,或者说,线性、无偏性和是否自相关无关) 二、 OLS估计量在数据存在自相关时,不再具有最小方差性,或者说,OLS估计量不再是BLUE,导致t值过小 这是指OLS估计量的方差不再是所有线性无偏估计量方差中的最小方差,OLS估计量在存在自相关时不再是BLUE(以AR(1)为例),三、忽视自相关,根据常用的OLS估计量方差公式计算得到的方差是有偏的(由于经济数据的特性,往往是负的偏误,即低估了真实方差),五、综上所述:在数据存在自相关的情形下,t检验和F检验的结论不再可靠 例如:OLS回归得到的t值比实际上的t值偏大或者偏小都有可能,我们无法相信t检验的结果 存在自相关时的后果和存
5、在异方差时的后果非常类似 返回,第三节 自相关的检验,一、图形检验法 二、D-W检验法 返回,一、图形法P248-249:观察残差项ei随i的的分布或ei和ei-1的散点图 注意图14-2,a和b,它们实质上是对同一种自相关情形不同表述,(scat resid resid(-1)),返回,二、D-W检验/杜宾-瓦尔森检验P319,1、自回归的一种形式:一阶自回归,AR(1) 2、一阶自相关系数的ols估计量 3、构造d统计量 4、 d统计量服从D-W分布 5、 D-W检验步骤 6、D-W检验的前提条件 返回,1、自回归的一种形式:一阶自回归,AR(1),返回,返回,3、构造d统计量,返回,返回
6、,D-W检验不是单纯地和临界值比较,5、D-W检验步骤 由回归软件得到d值 设定零假设:原回归中不存在自相关 设定显著性水平 对照D-W统计表查找临界值,按下表给出的法则进行检验 例题,0,dL,du,2,4-du,4-dL,4,存在着正自相关,无法判定区域,接受零假设,无法判定区域,存在负自相关,例14-1 P316 N=44,d=0.2136,解释变量个数k=1 返回,补充,6、D-W检验的前提条件 自回归的形式是AR(1) 回归模型必须有截距项 样本容量须在15以上 解释变量不是随机变量 返回,第四节 自相关的修正,一、当自相关系数已知时 广义差分法 二、当自相关系数未知时 一阶差分法
7、由D-W统计量估计自相关系数 科克兰内-奥克特法 返回,一、当一阶自相关系数已知时候,使用广义差分法 P322,将(1)式滞后一期,两边同乘以 得,将(1)-(2)得,做广义差分变换:,1、 一阶差分估计法: 直接设 是广义差分法的特例。,再估计广义差分模型:,估计步骤和广义差分法相同。,3、科克兰内-奥克特法(Cochrane-Orcutt):迭代法求一个相对精确的的估计值,步骤:,1)用OLS估计模型,得到各参数估计值,用0LS估计广义差分方程,用估计得到的新的参数估计值代入原方程,重复2-4,直到 收敛,所对应的参数估计值为最终的估计值,4、 德宾两步估计法,大样本适用,的系数即为 的估计值 。,然后,用 估计值做广义差分模型。,将原广义差分方程改写为:,返回,作业,讨论:p328-14.8 作业:P330 14.15 14.17,