1、第四章 经典单方程计量经济学模型:放宽基本假定的模型 4.1 异方差性 二、异方差的类型 同方差性假定: ?i2 = 常数 ? f(Xi) 异方差时: ?i2 = f(Xi) 三、实际经济问题中的异方差性 :截面资料下研究居民家庭的储蓄行为 Yi=?0+?1Xi+?i Yi:第 i 个家庭的储蓄额 Xi:第 i 个家庭的可支配收入 四、异方差性的后果 五、异方差性的检验 检验思路: 3、怀特(White)检验 怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤(以二元为例): 六、异方差的修正 模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squa
2、res, WLS)进行估计。 七、案例 -中国农村居民人均消费函数 4.2 序列相关性 一、序列相关性概念 二、实际经济问题中的序列相关性 三、序列相关性的后果 四、序列相关性的检验 五、具有序列相关性模型的估计 六、案例 一、序列相关性概念 称为一阶列相关,或自相关(autocorrelation) 二、实际经济问题中的序列相关性 1、经济变量固有的惯性 2、模型设定的偏误 但建模时设立了如下模型: Yt= ?0+?1Xt+vt 因此,由于 vt= ?2Xt2+?t, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。 3、数据的“编造” 例如:季度数据来自月度数据的简单平均,
3、这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。 2、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。 3、模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。 所以,当模型出现序列相关性时,它的预测功能失效。 三、序列相关性的检验 三、序列相关性的检验 然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。 1、图示法 2、回归检验法
4、 3、杜宾-瓦森(Durbin-Watson )检验法 D-W 检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于 1951 年提出的一种检验序列自相关的方法,该方法的假定条件是: 右时,模型不存在一阶自相关。 4、拉格朗日乘数( Lagrange multiplier)检验 如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。 1、广义最小二乘法 对于模型 Y=X?+ ? 如果存在序列相关,同时存在异方差,即有 如何得到矩阵?? 2、广义差分法 广义差分法是将原模型变换为满足 OLS 法的差分模型,再进行 OLS估计。 注意: 广义差分法就是上述广义最小二乘法,但是
5、却损失了部分样本观测值。 如:一阶序列相关的情况下,广义差分是估计 3、随机误差项相关系数的估计 应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数?1, ?2, , ?L 。 实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。 常用的估计方法有: (1)科克伦-奥科特迭代法。 类似地,可进行第三次、第四次迭代。 关于迭代的次数,可根据具体的问题来定。 一般是事先给出一个精度,当相邻两次?1,?2, ? ,?L 的估计值之差小于这一精度时,迭代终止。 实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。 应用软件中的广义差分法 在
6、Eview/TSP 软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计?。 在解释变量中引入 AR(1)、AR(2)、,即可得到参数和 1、2、的估计值。 其中AR(m)表示随机误差项的 m 阶自回归。在估计过程中自动完成了 1、2、的迭代。 如果能够找到一种方法,求得 或各序列相关系数?j 的估计量,使得 GLS 能够实现,则称为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares) 。 FGLS 估计量,也称为可行的广义最小二乘估计量(feasible general least squares estima
7、tors) 可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。 前面提出的方法,就是 FGLS 4、虚假序列相关问题 由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation) ,应在模型设定中排除。 避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。五、案例:中国商品进口模型 1. 通过 OLS 法建立如下中国商品进口方程: 2. 进行序列相关性检验。 DW 检验 则 M*关于 GDP*的 OLS
8、 估计结果为: (2)采用科克伦-奥科特迭代法估计? 在 Eviews 软包下,2 阶广义差分的结果为: 4.3 多重共线性 Multi-Collinearity 一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例 *七、分部回归与多重共线性 一、多重共线性的概念 对于模型 Yi=?0+?1X1i+?2X2i+?+?kXki+?i i=1,2,n 其基本假设之一是解释变量是互相独立的。 如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中: ci 不全为 0,则称为解释变量间存在完全共线性(pe
9、rfect multicollinearity) 。 在矩阵表示的线性回归模型Y=X?+?中,完全共线性指:秩(X) k+1,即 注意: 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。 (2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映
10、真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。 (3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在多重共线性。 截面数据样本:问题不那么严重,但多重共线性仍然是存在的。 二、多重共线性的后果 2、近似共线性下 OLS 估计量非有效 近似共线性下,可以得到 OLS 参数估计量, 但参数估计量方差的表达式为 多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF) 3、参
11、数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= ?X1 , 这时,X1 和 X2 前的参数?1、?2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 ?1、?2 已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如?1 本来应该是正的,结果恰是负的。 4、变量的显著性检验失去意义 5、模型的预测功能失效 变大的方差容易使区间预测的“区间”变大,使预测失去意义。 三、多重共线性的检验 多重共线性检验的任务是: ( 1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间存在共线性。 1、检验多重共线性是否存在 (
12、1)对两个解释变量的模型,采用简单相关系数法 求出 X1 与 X2 的简单相关系数 r,若|r|接近 1,则说明两变量存在较强的多重共线性。 2、判明存在多重共线性的范围 如果存在多重共线性,需进一步确定究竟由哪些变量引起。 (1) 判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归 Xji=?1X1i+?2X2i+?LXLi 的判定系数较大,说明 Xj 与其他 X 间存在共线性。 具体可进一步对上述回归方程作 F 检验: 式中:Rj?2为第 j 个解释变量对其他解释变量的回归方程的决定系数, 若存在较强的共线性,则 Rj?2 较
13、大且接近于 1,这时(1- Rj?2 )较小,从而 Fj 的值较大。 因此,给定显著性水平?,计算 F 值,并与相应的临界值比较,来判定是否存在相关性。 在模型中排除某一个解释变量 Xj,估计模型; 如果拟合优度与包含 Xj 时十分接近,则说明 Xj 与其它解释变量之间存在共线性。 (2)逐步回归法 以 Y 为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。 四、克服多重共线性的方法 找出引起多重共线性
14、的解释变量,将它排除出去。 以逐步回归法得到最广泛的应用。 注意: 这时,剩余解释变量参数的经济含义和数值都发生了变化。 2、第二类方法:差分法 时间序列数据、线性模型:将原模型变换为差分模型: ?Yi=?1 ? X1i+?2 ? X2i+?+?k ? Xki+ ? ?i 可以有效地消除原模型中的多重共线性。 例如: 由表中的比值可以直观地看到,增量的线性关系弱于总量之间的线性关系。 进一步分析: Y 与 C(-1)之间的判定系数为0.9988, Y 与C(-1)之间的判定系数为 0.9567 3、第三类方法:减小参数估计量的方差 多重共线性的主要后果是参数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。 例如: 增加样本容量,可使参数估计量的方差减小。 *岭回归法(Ridge Regression) 70 年代发展的岭