1、第四章 经典单方程计量经济学模型:放宽基本假定的模型第四章经典单方程计量经济学模型:放宽基本假定的模型41.1 异方差性4.2 序列相关性4.3 多重共线性4.4 随机解释变量问题基本假定违背主要 包括:(1)随机误差项序列存在异方差性;(2)随机误差项序列存在序列相关性;(3)解释变量之间存在多重共线性;(4)解释变量是随机变量且与随机误差项相关的随机解释变量问题;(5)模型设定有偏误;(6)解释变量的方差不随样本容量的增而收敛。计量经济检验:对模型基本假定的检验本章主要学习:前 4 类4.1 异方差性一、异方差的概念二、异方差的类型三、实际经济问题中的异方差性四、异方差性的后果五、异方差性
2、的检验六、异方差的修正七、案例对于模型如果出现即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。一、异方差的概念二、异方差的类型同方差:?i2 = 常数 ? f(Xi)异方差: ?i2 = f(Xi)异方差一般可归结为三种类型:(1)单调递增型: ?i2 随 X 的增大而增大(2)单调递减型: ?i2 随 X 的增大而减小(3)复 杂 型: ?i2 与 X 的变化呈复杂形式三、实际经济问题中的异方差性例 4.1.1:截面资料下研究居民家庭的储蓄行为:Yi=?0+?1Xi+?iYi:第 i 个家庭的储蓄额 Xi:第 i 个家
3、庭的可支配收入。高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小?i 的方差呈现单调递增型变化例 4.1.2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=?0+?1Yi+?I将居民按照收入等距离分成 n 组,取组平均数为样本观测值。一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。例 4.1.3,以某一行业的企业为样本建立企业生产函数模型:Yi=Ai?1 Ki?2 Li?3e?i被解释变量:产出量 Y解释变量:
4、资本 K、劳动 L、技术 A,那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。四、异方差性的后果计量经济学模型一旦出现异方差性,如果仍采用 OLS 估计模型参数,会产生下列不良后果:1. 参数估计量非有效OLS 估计量仍然具有无偏性,但不具有有效性 因为在有效性证明中利用了 E(?)=?2I而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。2. 变量的显著性检验失去意义变量的显著性检验中,构造了 t 统
5、计量其他检验也是如此。3. 模型的预测失效一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,参数 OLS 估计值的变异程度增大,从而造成对 Y 的预测误差变大,降低预测精度,预测功能失效。五、异方差性的检验检验思路:由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式” 。问题在于用什么来表示随机误差项的方差一般的处理方法:几种异方差的检验方法:1. 图示法(1)用 X-Y 的散点图进行判断看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中
6、)看是否形成一斜率为零的直线2. 帕克(Park)检验与戈里瑟(Gleiser)检验基本思想:偿试建立方程:或选择关于变量 X 的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。如: 帕克检验常用的函数形式:或若?在统计上是显著的,表明存在异方差性。3. 戈德菲尔德-匡特(Goldfeld-Quandt)检验G-Q 检验以 F 检验为基础,适用于样本容量较大、异方差递增或递减的情况。G-Q 检验的思想:先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从 F 分布
7、,因此假如存在递增的异方差,则 F 远大于 1;反之就会等于 1(同方差) 、或小于 1(递减方差) 。G-Q 检验的步骤:将 n 对样本观察值(Xi,Yi)按观察值 Xi 的大小排队;将序列中间的 c=n/4 个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2;对每个子样分别进行 OLS 回归,并计算各自的残差平方和;在同方差性假定下,构造如下满足 F 分布的统计量给定显著性水平?,确定临界值 F?(v1,v2), 若 F F?(v1,v2), 则拒绝同方差性假设,表明存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差
8、还是递减异型方差。4. 怀特(White)检验怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):然后做如下辅助回归可以证明,在同方差假设下:(*)R2 为(*)的可决系数,h 为(*)式解释变量的个数,表示渐近服从某分布。注意: 辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的 t 检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。六、异方差的修正模型检验
9、出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS)进行估计。加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用 OLS 估计其参数。例如,如果对一多元模型,经检验知:在采用 OLS 方法时:对较小的残差平方 ei2 赋予较大的权数;对较大的残差平方 ei2 赋予较小的权数。新模型中,存在 即满足同方差性,可用 OLS 法估计。一般情况下:对于模型 Y=X?+?存在: 即存在异方差性。 W 是一对称正定矩阵,存在一可逆矩阵 9D-1 左乘 Y=X?+?两边,得到一个新的模型: 该模型具有同方差性。因为
10、这就是原模型 Y=X?+?的加权最小二乘估计量,是无偏、有效的估计量。 这里权矩阵为90)R2 =0.4374X2 项与 X2 的平方项的参数的 t 检验是显著的,且n R2 =31? 0.4374=13.56 ?=5%下,临界值 ?20.05(4)=9.49,拒绝同方差的原假设。 原模型的加权最小二乘回归 对原模型进行 OLS 估计,得到随机误差项的近似估计量 i,以此构成权矩阵?2W 的估计量;再以 1/| i|为权重进行 WLS 估计,得各项统计检验指标全面改善一、序列相关性概念二、实际经济问题中的序列相关性 三、序列相关性的后果四、序列相关性的检验五、案例4.2 序列相关性 一、序列相
11、关性概念如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性(Serial Correlation)。对于模型Yi=?0+?1X1i+?2X2i+?kXki+?i i=1,2, ,n随机项互不相关的基本假设表现为Cov(?i , ?j)=0 i?j, i,j=1,2, ,n或称为一阶列相关,或自相关(autocorrelation)其中:?被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation)如果仅存在E(?i ?i+1)?
12、0 i=1,2, ,n自相关往往可写成如下形式:?i=?i-1+?i -1?1由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标 t 代表 i。 ?i 是满足以下标准 OLS 假定的随机干扰项:二、实际经济问题中的序列相关性 1.经济变量固有的惯性大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 ) 。例如,绝对收入假设下居民总消费函数模型:Ct=?0+?1Yt+?t t=1,2,n2.模型设定的偏误 所谓模型设定偏误(Specification error)是指所设定的
13、模型“不正确” 。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。 例如,本来应该估计的模型为Yt=?0+?1X1t+ ?2X2t + ?3X3t + ?t但在模型设定中做了下述回归: Yt=?0+?1X1t+ ?1X2t + vt因此, vt=?3X3t + ?t,如果 X3 确实影响 Y,则出现序列相关。 又如:如果真实的边际成本回归模型应为:Yt= ?0+?1Xt+?2Xt2+?t其中:Y=边际成本,X=产出。 但建模时设立了如下模型:Yt= ?0+?1Xt+vt因此,由于 vt= ?2Xt2+?t, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。3. 数据的
14、“编造”例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。计量经济学模型一旦出现序列相关性,如果仍采用 OLS 法估计模型参数,会产生下列不良后果:二、序列相关性的后果1. 参数估计量非有效因为,在有效性证明中利用了E(NN)=?2I即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。2. 变量的显著性检验失去意义在
15、变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。其他检验也是如此。3. 模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。三、序列相关性的检验然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。序列相关性检验方法有多种,但基本思路相同:基本思路:1. 图示法2. 回归检验法 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。 回归检验法的优点是:(1)能够确定序列相关的形式, (
16、2)适用于任何类型序列相关性问题的检验。3. 杜宾瓦森(Durbin-Watson)检验法 D.W. 统计量:该统计量的分布与出现在给定样本中的 X 值有复杂的关系,因此其精确的分布很难得到。但是,他们成功地导出了临界值的下限 dL 和上限 dU ,且这些上下限只与样本的容量 n 和解释变量的个数 k 有关,而与解释变量 X 的取值无关。D.W.dL 存在正自相关dLD.W.4dU 无自相关当D.W.4 dL 不能确定4dL D.W.统计量: (*)如果存在完全一阶正相关,即?=1,则 D.W.? 4完全不相关, 即?=0,则 D,使得?=DD变换原模型:D-1X ? +D,使参数估计量为 其
17、中矩阵D=aI a 为大于 0 的常数。(*)显然,与未含D 的参数 B 的估计量相比,(*)式的估计量有较小的方差。六、案例中国粮食生产函数根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1) 粮食播种面积(X2)成灾面积(X3) 农业机械总动力(X4)农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=?0+?1 X1 +?2 X2 +?3 X3 +?4 X4 +?4 X5 +?1. 用 OLS 法估计上述模型:R2 接近于 1; 给定?=5%,得 F 临界值 F0.05(5,12)=3.11 F=638.4 15.19,故认上述粮食生产的总体线性
18、关系显著成立。但 X4 、X5 的参数未通过 t 检验,且符号不正确,故解释变量间可能存在多重共线性。(-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14)2. 检验简单相关系数发现: X1 与 X4 间存在高度相关性。列出 X1,X2,X3,X4,X5 的相关系数矩阵:3. 找出最简单的回归形式可见,应选第一个式子为初始的回归模型。分别作 Y 与 X1,X2,X4,X5 间的回归:(25.58) (11.49) R2=0.8919 F=132.1 DW=1.56(-0.49) (1.14) R2=0.075 F=1.30 DW=0.12(17.45) (6
19、.68) R2=0.7527 F=48.7 DW=1.11(-1.04) (2.66)R2=0.3064 F=7.07 DW=0.364. 逐步回归将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。回归方程以 Y=f(X1,X2,X3)为最优:5. 结论1. 分部回归法(Partitioned Regression)对于模型:在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组: 将解释变量分为两部分,对应的参数也分为两部分:*七、分部回归与多重共线性如果存在则有同样有这就是仅以 X2 作为解释变量时的参数估计量。这就是仅以 X1 作为解释变量时的参数估计量2. 由
20、分部回归法导出如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、进行估计,参数估计结果不变;实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、进行估计,参数估计结果将发生变化;当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的结构关系。4.4 随机解释变量问题一、随机解释变量问题二、实际经济问题中的随机解释变量问题 三、随机解释变量的后果四、工具变量法五、案例 基本假设:解释变量 X1
21、,X2,Xk 是确定性变量。如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。假设 X2 为随机解释变量。对于随机解释变量问题,分三种不同情况:一、随机解释变量问题对于模型: 2. 随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。3. 随机解释变量与随机误差项同期相关(contemporaneously correlated)。 1. 随机解释变量与随机误差项独立(Independence)二、实际经济问题中的随机解释变量问题在实际经济问题中,经济变量往往都具有随机性。但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。于是随机解释变量问题主要表现于:用滞后被解释变量作为模型的解释变量的情况。例如:(1)耐用品存量调整模型:耐用品的存量 Qt 由前一个时期的存量 Qt-1 和当期收入 It 共同决定:Qt=?0+?1It+?2Qt-1+?t t=1,?T这是一个滞后被解释变量作为解释变量的模型。但是,如果模型不存在随机误差项的序列相关性,那么随机解释变量 Qt-1 只与?t-1 相关,与?t 不相关,属于上述的第 2 种情况。(2)合理预期的消费函数模型