收藏 分享(赏)

面板数据模型EVIEWS讲义(张晓峒).pdf

上传人:精品资料 文档编号:5025605 上传时间:2019-01-31 格式:PDF 页数:70 大小:2.55MB
下载 相关 举报
面板数据模型EVIEWS讲义(张晓峒).pdf_第1页
第1页 / 共70页
面板数据模型EVIEWS讲义(张晓峒).pdf_第2页
第2页 / 共70页
面板数据模型EVIEWS讲义(张晓峒).pdf_第3页
第3页 / 共70页
面板数据模型EVIEWS讲义(张晓峒).pdf_第4页
第4页 / 共70页
面板数据模型EVIEWS讲义(张晓峒).pdf_第5页
第5页 / 共70页
点击查看更多>>
资源描述

1、 1第第第 第 9 章章章 章 面板数据模型面板数据模型面板数据模型面板数据模型 与应用与应用与应用与应用 1面板数据 定义 2面板数据模型分类 3面板数据模型估计方法 4面板数据模型 的检验 与设定 5面板数据建模 案例 分析 6面板数据的单位根检验 7面板数据模型的 协整 检验 8 EViwes 应用 9面板数据研究新进展 (动态面板数据模型 、非均衡面板数据模型 、离散面板数据模型、面板数据非平稳性 、面板数据的协积 ) 1面板数据定义 时间序列数据或截面数据都是一维数据 。时间序列数据是变量按时间得到的数据 ;截面数据是变量在固定时点的一组数据 。面板数据是同时在时间和截面上取得的二

2、维数据 。所以 ,面板数据 ( panel data)也称 作时间序列 与截面 混合 数据 ( pooled time series and cross section data)。 面板数据 是截面上 个体在不同时点的重复观测数据 。 panel 原指对一组固定调查对象的多次观测 ,近年来 panel data 已经成为专业术语 。 面板数据示意图见图 1。面板数据从横截面 ( cross section)看,是由若干个体 ( entity, unit, individual)在某一时点构成的截面观测值 ,从纵剖面 ( longitudinal section)看每个个体都是一个时间序列 。

3、 图 2 1978-2005 中国 各省 级地区 消费性支出占可支配收入比例走势图 (价格平减过 ) 面板数据 分两种特征 :( 1)个体数少 ,时间长 。( 2)个体数多 ,时间短 。面板数据 主要指后一种情形 。 面板数据用双下标变量表示 。例如 2yi t, i = 1, 2, , N; t = 1, 2, , T i 对应面板数据中不同个体 。 N 表示面板数据中含有 N 个个体 。 t 对应面板数据中不同时点 。T 表示时间序列的最大长度 。若固定 t 不变 , yi ., ( i = 1, 2, , N)是横截面上 的 N 个随机变量 ;若固定 i 不变 , y. t, (t =

4、1, 2, , T)是纵剖面上的 一 个时间序列 (个体 )。 利用面板数据建立模型的好处 是:( 1)由于观测值的增多 ,可以增加估计量的抽样精度。( 2)对于固定效应 模型 能得到参数的一致估计量 ,甚至有效估计量 。( 3)面板数据建模比单截面数据建模可以获得更多的动态信息 。 例如 1990-2000 年 30 个省份的农业总产值数据 。固定在某一年份上 ,它是由 30 个农业总产值数字组成的截面数据 ;固定在某一省份上 ,它是由 11 年农业总产值数据组成的 一 个时间序列 。面板数据由 30 个个体组成 。共有 330 个观测值 。 对于面板数据 yi t, i = 1, 2, ,

5、 N; t = 1, 2, , T,如果每个个体在相同的时期内都有观测值记录 ,则称此面板数据为平衡面板数据 ( balanced panel data)。 若面板数据中的个体在相同时期内缺失若干个观测值 ,则称此面板数据为非平衡面板数据 ( unbalanced panel data)。 案例 1( file:5panel02): 1996-2002 年中国东北 、华北 、华东 15 个省级地区的居民家庭固定价格的人均消费 ( CP)和人均收入 ( IP)数据见 file:panel02。数据是 7 年的 ,每一年都有 15 个数据 ,共 105 组观测值 。 人均消费和收入两个面板数据都是

6、平衡面板数据 ,各有 15 个个体 。人均消费和收入的面板数据从纵剖面观察分别见图 2 和图 3。从横截面观察分别见图 4 和图 5。横截面数据散点图的表现与观测值顺序有关 。图 4 和图 5 中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的 。 1996 19992002安徽河北江苏内蒙古山西 020004000600080001000012000 安徽北京福建河北黑龙江吉林江苏江西辽宁内蒙古山东上海山西天津浙江图 3 15 个省级地区的人均消费序列 (个体 ) ( file:5panel02) 1996 19982000 2002安徽福建黑龙江江苏辽宁山东山西浙江 020004

7、00060008000100001200014000安徽北京福建河北黑龙江吉林江苏江西辽宁内蒙古山东上海山西天津浙江 图 4 15 个省级地区的人均收入序列 (个体 ) ( file:5panel02) 3安徽 河北江苏内蒙古 山西 19961998 200020020200040006000800010000120001996199719981999200020012002图 5 7 个人均 消费横截面数据 (含 15 个地区 ) (每条连线表示同一年度 15 个地区的消费值 ) 安徽 河北江苏内蒙古 山西 1996 1999 20020200040006000800010000120001

8、40001996199719981999200020012002图 6 7 个人均 收入 横截面数据 (含 15 个地区 ) (每条连线表示同一年度 15 个地区的收入值 ) 用 CP 表示消费 , IP 表示收入 。 AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ 分别表示安徽省 、北京市 、福建省 、河北省 、黑龙江省 、吉林省 、江苏省 、江西省 、辽宁省 、内蒙古自治区 、山东省 、上海市 、山西省 、天津市 、浙江省 。 15 个地区 7 年人均消费对收入的面板数据散点图 见图 6 和图 7。图 6 中每一种符

9、号代表一个省级地区的 7 个观测点组成的时间序列 。相当于观察 15 个时间序列 。图 7 中每一种符号代表一个年度的截面散点图 (共 7 个截面 )。 相当于观察 7 个截面散点图的叠加 。 2000300040005000600070008000900010000110002000 4000 6000 8000 10000 12000 14000IPCROSSCP1996CP1997CP1998CP1999CP2000CP2001CP2002IP7.88.08.28.48.68.89.09.29.48.0 8.2 8.4 8.6 8.8 9.0 9.2 9.4 9.6LOG(IPCROSS

10、)LOG(CP1996)LOG(CP1997)LOG(CP1998)LOG(CP1999)LOG(CP2000)LOG(CP2001)LOG(CP2002)图 6 对数的 人均消费对收入的面板数据散点图 图 7 对数的 人均消费对收入的面板数据散点图 42000300040005000600070008000900010000110002000 4000 6000 8000 10000 12000 14000CP_IAHCP_IBJCP_IFJCP_IHBCP_IHLJCP_IJLCP_IJSCP_IJXCP_ILNCP_INMGCP_ISDCP_ISHCP_ISXCP_ITJCP_IZJIP

11、_I为了观察得更清楚 ,图 8 给出北京和内蒙古 1996-2002 年消费对收入散点图 。从图中可以看出 ,无论是从收入还是从消费看内蒙古的水平都低于北京市 。内蒙古 2002 年的收入与消费规模还不如北京市 1996 年的大 。图 9 给出该 15 个省级地区 1996 和 2002 年的消费对收入散点图 。 6 年之后 15 个地区的消费和收入都有了相应的提高 。 2000300040005000600070008000900010000110002000 4000 6000 8000 10000 12000 14000cp_bj cp_nmgIP_I200030004000500060

12、0070008000900010000110002000 4000 6000 8000 10000 12000 14000CP_1996 CP_2002IP_T图 8 北京和内蒙古 1996-2002 年消费对收入 散点图 图 9 1996 和 2002 年 15 个地区的消费对收入散点图 2面板数据模型分类 用面板数据建立的模型通常有 3 种,即混合 模型 、固定效应 模型 和随机效应 模型 。 2.1 混合 模型 ( Pooled model)。 如果一个 面板数据 模型定义为 , yit = + Xit +it, i = 1, 2, , N; t = 1, 2, , T (1) 其中 y

13、it为被回归变量 (标量 ), 表示截距项 , Xit 为 k 1 阶回归变量列向量 (包括 k 个回归量), 为 k 1 阶回归系数列向量 , it为误差项 (标量 )。 则称此模型为混合 模型 。混合 模型的特点是无论对任何个体和截面 ,回归系数 和 都相同 。 如果模型是正确设定的 ,解释变量与误差项不相关 ,即 Cov(Xit,it) = 0。那么无论是N,还是 T,模型参数的混合最小二乘估计量 ( Pooled OLS)都是一致估计量 。 以案例 1( file:5panel02)为例得到的 混合模型估计结果如下 : 5图 9 EViwes 6 混合 模型 的估计结果 LnCPit

14、= 0.0187 + 0.9694 LnIPit +it (0.2) (79.2) R2 = 0.984, SSE = 0.1702, DW = 0.62 可以加 AR(1)项克服自相关 , LnCPit = 0.0922 + 0.9595 LnIPit + 0.7383 AR(1) +it (0.3) (26.1) (9.0) R2 = 0.984, SSE = 0.0801, DW = 2.0 2.2 固定效应 模型 ( fixed effects regression model)。 固定效应模型分为 3 种类型 ,即个体固定效应 模型 、时点固定效应 模型 和个体时点双固定效应 模型

15、。下面分别介绍 。 2.2.1 个体固定效应 模型 ( entity fixed effects model) 如果一个 面板数据 模型定义为 , yit = i + Xit +it, i = 1, 2, , N; t = 1, 2, , T (3) 其中 i 是随机变量 ,表示对于 i 个个体有 i 个不同的截距项 ,且其变化与 Xit 有关系 ; Xit 为 k 1 阶回归变量列向量 (包括 k 个回归量 ), 为 k 1 阶回归系数列向量 ,对于不同个体回归系数相同 , yit为被回归变量 (标量 ), it 为误差项 (标量 ), 则称此模型为个体固定效应 模型 。 个体固定效应模型

16、( 3)的强假定条件是 , E(iti, Xit) = 0, i = 1, 2, , N i 作为随机变量描述不同个体建立的模型间的差异 。因为 i 是不 可观测的 ,且与可观测的解释变量 Xit的变化相联系 ,所以称 ( 3)式为个体固定效应 模型 。 个体固定效应 模型 也可以表示为 yit = 1 D1 + 2 D2 + +N DN + Xit +it, t = 1, 2, , T (4) 其中 Di = =其他 ,个个体如果属于第 ,,0., ,2 ,1,1 Nii 个体固定效应 模型 ( 3)还可 以用多方程 表示为 6y1t = 1 + X1t +1t, i = 1(对于第 1 个

17、个体或时间序列 ), t = 1, 2, , T y2t = 2 + X2t +2 t, i = 2(对于第 2 个个体或时间序列 ), t = 1, 2, , T yN t = N + XN t + N t, i = N(对于第 N 个个体或时间序列 ), t = 1, 2, , T 注意 : ( 1)在 EViews 输出结果中 i 是以一个不变的常数部分和随个体变化的部分相加而成 。 ( 2)在 EViews 5.0 以上版本 个体固定效应对话框中 的回归因子选项中填不填 c 输出结果都会有固定常数项 。 对于 个体固定效应 模型 ,个体效应 i 未知 , E(i Xit)随 Xit而变

18、化 ,但不知怎样与 Xit变化,所以 E(yit Xit)不可识别 。对于短期面板数据 ,个体固定效应 模型 是正确设定的 , 的混合 OLS 估计量不具有一致性 。相应解释见 3.1 小节 。但是对个体固定效应模型可以识别边际效应 。 = E(yit i, Xit)/ Xit 个体固定效应 模型 的估计方法有多种 ,首先设法除去 i 的影响 , 从而保证 估计量的一致性 。(详见第 3 节,面板数据模型估计方法 。) 下面解释 设定个体固定效应 模型 的原因 。假定有面板数据模型 yit = 0 + 1 xit +2 zi +it, i = 1, 2, , N; t = 1, 2, , T

19、(5) 其中 0为常数 ,不随时间 、截面变化 ; zi 表示随个体变化 ,但不随时间变化的难以观测的变量。 以案例 1 为例 ,省家庭平均人口数就是这样的一个变量 。对于短期面板来说 ,这是一个基本不随时间变化的量 ,但是对于不同的省份 ,这个变量的值是不同的 。 上述模型可以被解释为含有 N 个截距 ,即每个个体都对应一个不同截距的模型 。令 i = 0 +2 zi,于是 ( 5)式变为 yit = i + 1 xit +it, i = 1, 2, , N; t = 1, 2, , T (6) 这正是个体固定效应 模型 形式 。对于每个个体回归函数的斜率相同 (都是 1), 截距 i 却因

20、个体不同而变化 。 可见个体固定效应 模型 中的截距项 i 中包括了那些随个体变化 ,但不随时间变化的难以观测的变量的影响 。 i是一个随机变量 。因为 zi 是不随时间变化的量 ,所以 当对个体固定效应 模型 中的变量进行差分时 ,可以剔除那些随个体变化 ,但不 随时间变化的难以观测变量的影响 ,即剔出 i 的影响 。 以案例 1( file:5panel02)为例得到的个体固定效应模型估计结果如下 : 7图 10 个体固定效应 模型 的 EViwes 6 估计结果 输出结果的方程形式是 tLncp1= 安徽 + 1 Lnip1t = (0.6878 0.0039) + 0.89 Lnip1

21、t (5.4) (60.6) tLncp 2= 北京 + 1 Lnip2t = (0.6878 + 0.0821) + 0.89 Lnip 2t (5.4) (60.6) 。 tLncp15= 浙江 + 1 Lnip15t = (0.6878 + 0.0434) + 0.89 Lnip 15t (5.4) (60.6) R2 = 0.9937, SSEr = 0.0667, t0.05 (89) = 1.98, DW = 1.51 从结果看 ,北京 、上海 、浙江是自发消费 (消费函数截距 )最大的 3 个地区 。 注意 : 带 AR 项的 个体固定效应 模型 基础上同样可以做是否取混合模型的

22、 F 检验 。 2.2.2 时点 固定效应 模型 ( time fixed effects model) 如果一个 面板数据 模型定义为 , yit = t + Xit +it, i = 1, 2, , N (7) 8其中 t 是模型截距项 ,随机变量 ,表示对于 T 个截面有 T 个不同的截距项 ,且其变化与 Xit有关系 ; yit为被回归变量 (标量 ), it 为误差项 (标量 ), 满足通常假定条件 。 Xit 为 k 1 阶回归变量列向量 (包括 k 个回归变量 ), 为 k 1 阶回归系数列向量 ,则称 此模型为时点固定效应 模型 。 时点固定效应 模型 也可以加入虚拟变量表示为

23、 yit =0 + 1 W1 + 2 W2 + + T WT + Xit +it, i = 1, 2, , N; t = 1, 2, , T (8) 其中 Wt = =,0; ., ,2 ,1 ,1)( 。,个截面不属于第其他个截面如果属于第tt Tt 模型 ( 8)还也可以 用多方程 表示为 yi1 = (0 + 1) + X1t + i1, t = 1,( 对于第 1 个截面 ), i = 1, 2, , N yi2 = (0 + 2) + X2t + i2, t = 2,( 对于第 2 个截面 ), i = 1, 2, , N yiT = (0 + T) + XN t + iT, t =

24、 T,( 对于第 T 个截面 ), i = 1, 2, , N 设定时点固定效应 模型 的原因 。假定有面板数据模型 yit = 0 + 1 xit +2 zt +it, i = 1, 2, , N; t = 1, 2, , T (9) 其中 0为常数 ,不随时间 、截面变化 ; zt表示随不同截面 (时点 )变化 ,但不随个体变化的难以观测的变量 。 以案例 1 为例 ,“全国零售物价指数 ”就是这样的一个变量 。对于不同时点 ,这是一个变化的量 ,但是对于不同省份 (个体 ), 这是一个不变化的量 。 上述模型可以被解释为含有 T 个截距 ,即每个截面都对应一个不同截距的模型 。令 t =

25、 0 +2 zt,于是 ( 9)式变为 yit = t + 1 xit +it, i = 1, 2, , N; t = 1, 2, , T (10) 这正是时点固定效应 模型 形式 。对于每个截面 ,回归函数的斜率相同 (都是 1), t 却因截面 (时点 )不同而异 。可见时点固定效应 模型 中的截距项 t 包括了那些随不同截面 (时点)变化 ,但不随个体变化的难以观测的变量的影响 。 t是一个随机变量 。 9图 11 EViwes 5.1 时点固定效应 模型 估计结果 以例 1 为例得到的时点固定效应模型估计结果见图 11,代数式如下 : 1iLncp= 0 + 1996 + 1 Lnip

26、i1 = (-0.2474 + 0.0257) + 1.00 Lnipi1 , t = 1996 (-2.1) (72.9) 2iLncp= 0 + 1997 + 1 Lnipi2 = (-0.2474 + 0.0266) + 0.78Lnipi2 , t = 1997 (-2.1) (72.9) 7iLncp= 0 + 2002 + 1 Lnipi7 = (-0.2474 0.0204) + 0.78 Lnipi7 , t = 2002 (-2.1) (72.9) R2 = 0.9867, SSEr = 4028843, t0.05 (97) = 1.98 注意 : 时点固定效应 模型 中不

27、可以加 AR 项。 2.2.3 个体时点固定效应 模型 ( time and entity fixed effects model) 如果一个 面板数据 模型定义为 , yit = 0 +i +t + Xit +it, i = 1, 2, , N; t = 1, 2, , T (11) 其中 yit为被回归变量 (标量 ); i是随机变量 ,表示对于 N 个个体有 N 个不同的截距项 ,且其变化与 Xit有关系 ; t是随机变量 ,表示对于 T 个截面 (时点 )有 T 个不同的截距项 ,且其变化与 Xit 有关系 ; Xit为 k 1 阶回归变量列向量 (包括 k 个回归量 ); 为 k 1

28、 阶回归系数10 列向量 ; it为误差项 (标量 )满足通常假定 (it Xit, i, t) = 0;则称此模型为个体时点固定效应模型 。 个体时点固定效应 模型 还可以表示为 , yit = 0 +1 D1+2 D2 +N DN + 1W1+ 2W2 + TWT + Xit +it, (12) 其中 Di = =其他 ,个个体如果属于第 ,,0., ,2,1,1 Nii (13) Wt = =,0;,.,2,1 ,1)( 。,个截面不属于第其他个截面如果属于第tt Tt (14) 如果模型形式是正确设定的 ,并且满足模型通常的假定条件 ,对模型 ( 12)进行 混合OLS 估计 ,全部参

29、数估计量都是不一致的 。正如个体固定效应 模型 可以得到一致的 、甚至有效的估计量一样 ,一些计算方法也可以使个体时点双固定效应 模型 得到更有效的参数估计量。 以例 1 为例得到的截面 、时点固定效应模型估计结果如下 : 图 12 EViwes 5.1 截面 、时点 双固定效应模型估计结果 注意 : 11 ( 1)对于第 1 个截面 ( t=1) EViwes 输出结果中把 (1 +i), (i = 1, 2, , N)估计在一起 。 ( 2)对于第 2, , T 个截面 ( t=1) EViwes 输出结果中分别把 (1 +t), (t = 2, , T)估计在一起 。 输出结果如下 :

30、1996,1Lncp = 0 + 1+ 1996 + 1 Lnip1,1996 = 2.40 - 0.04 - 0.06 + 0.70 Lnip1,1996 (安徽省 ) 1996,2Lncp = 0 + 2+ 1996 + 1 Lnip2,1996 = 2.40+0.17 0.06 + 0.70Lnip 2,1996(北京市 ) 1997,1Lncp = 0 + 1+ 1997 + 1 Lnip1,1997 = 2.40 0.04 +0.02 + 0.70Lnip1,1997(安徽省 ) 1997,2Lncp = 0 + 2+ 1997 + 1 Lnip2,1997 = 2.40 + 0.1

31、7 +0.02 +0.70 Lnip2,1997(北京市 ) 2002,15Lncp = 0 + 15 + 2002+ 1 Lnip15,2002 = 2.40 +0.12+0.06+0.70 Lnip15,2002(浙江省 ) R2 = 0.9947, SSEr = 0.0562, t0.05 (83) = 1.98 注意 :( 1) 个体时点固定效应 模型 中不可以加 AR 项。 ( 2)在上述三种固定效应 模型 中,个体固定效应 模型 最为常用 。 2.3 随机效应模型 对于面板数据模型 yit = i + Xit +it, i = 1, 2, , N; t = 1, 2, , T (1

32、5) 如果 i 为随机变量 ,其分布与 Xit 无关 ; Xit为 k 1 阶回归变量列向量 (包括 k 个回归量 ),为 k 1 阶回归系数列向量 ,对于不同个体回归系数相同 , yit为被回归变量 (标量 ), it为误差项 (标量 ), 这种模型称为个体随机效应 模型 (随机截距模型 、随机分量模型 )。 其假定条件是 i iid(, 2) it iid(0, 2) 都被假定为独立同分布 ,但并未限定何种分布 。 同理也可定义时点随机效应 模型 和个体时点随机效应 模型 ,但个体随机效应 模型 最为常用。 这里所说的个体随机效应 模型 其实是有别于真正的随机效应 模型 。 个体随机效应模

33、型又称为等相关模型 ( Equicorrelated model)。 原因如下 。 随机效应模型可以看作是混合模型的特例 。 对于个体随机效应 模型 yit = i + Xit +it,可以把 i 并入误差项 it。模型改写为 yit = Xit + (i +it) = Xit + uit (16) 其中 uit = (i +it)。如果有 i(, 2), it (0, 2)成立 ,那么 , Cov(uit,uis) = Cov(i +it)( i +is) = =+st st ,222 (17) 因为对于 t s,有 12 r(uit,uis) = ( , )( ) ( )it isit i

34、sCov u uVar u Var u=222+(18) 相关系数 r(uit,uis)与 (t s) 即相隔期数长短无关 。所以个体随机效应模型也称作等相关模型,或者可交换误差模型 ( exchangeable model)。 对于个体随机效应模型 , E(i Xit) = ,则有 , E(yit xit) = + Xit,对 yit可以识别 。所以 随机效应模型参数的混合 OLS 估计量具有一致性 ,但不具有有效性 。 例 1 的个体随机效应模型估计结果如下 : 图 13 个体随机效应模型估计结果 注意 :术语 “随机 效应模型 ”和“固定效应模型 ” 用得并不十分恰当 ,容易产生误解 。

35、其实固定效应模型应该称之为 “相关效应模型 ”,而随机效应模型应该称之为 “非相关效应模型 ”。因为固定效应模型和随机效应模型中的 i都是随机变量 。 3面板数据模型估计方法 面板数据模型中 的估计量既不同于截面数据估计量 ,也不同于时间序列估计量 ,其性质随设定固定效应模型是否正确而变化 。回归变量 xit 可以是时变的 ,也可以是非时变的 。 3.1 混合最小二乘 ( Pooled OLS)估计 混合 OLS 估计方法是在时间上和截面上把 NT 个观测值混合在一起 ,然后用 OLS 法估计模型参数 。给定混合模型 yit = + Xit +it, i = 1, 2, , N; t = 1,

36、 2, , T (19) 把上模型写成向量形式 , uWy += 13 其中 ( )1 Nyyy = 和 ( )1 Nuuu = 是 NT1 阶列向量 。 =( ), 是 (k+1)1 阶列向量。 W 是 NT(k+1)阶矩阵 ,其第 1 列是单位列向量 。假定条件是 E(u W) = 0,误差项 u 是严格外生的 。 E(u u W) = ,则 的混合 OLS 估计 公式是 = (WW)-1Wy 如果模型是正确设定的 ,且解释变量与误差项不相关 ,即 Cov(Xit,it) = 0。那么无论是N,还是 T,模型参数的混合最小二乘估计量都具有一致性 。 对混合模型通常采用的是混合最小二乘 (

37、Pooled OLS)估计法 。 然而 ,在误差项服从独立同分布条 件下由 OLS 法得到的方差协方差矩阵 ,在这里通常不会成立 。因为对于 每个个体 i 及其误差项来说通常是序列相关的 。 NT 个相关观测值要比NT 个相互独立的观测值包含的信息少 。从而导致误差项的标准差常常被低估 ,估计量的精度被虚假夸大 。 如果模型存在个体固定效应 ,即 i 与 Xit 相关 ,那么对模型应用混合 OLS 估计方法 ,估计量不再具有一致性 。 解释如下 : 假定模型实为个体固定效应模型 yit = i + Xit +it,但却当作混合模型来估计参数 ,则模型可写为 yit = + Xit + (i -

38、 +it) = + Xit + uit (20) 其中 uit = (i - +it)。因为 i 与 Xit相关 ,也即 uit 与 Xit 相关 ,所以个体固定效应模型的参数若采用混合 OLS 估计 ,估计量不具有一致性 。 3.2 平均 数( between) OLS 估计 平均数 OLS 估计法的步骤是 首先对面板数据中的每个个体求平均数 ,共得到 N 个平均数(估计值 )。 然后利用 yit 和 Xit的 N 组观测值估计参数 。以个体固定效应 模型 yit = i + Xit +it (21) 为例 ,首先对面板中的每个个体求平均数 ,从而建立模型 iy = i + iX + i ,

39、 i = 1, 2, , N (22) 其中 iy = =TtityT11 ,iX = = TtitT11 X ,i = =TtitT11 , i = 1, 2, , N。变换上式得 iy = + iX +( i - + i ), i = 1, 2, , N (23) 上式称作 平均数 模型 。对上式应用 OLS 估计 ,则参数估计量称作 平均数 OLS 估计量 。此条件下的样本容量为 N,( T=1)。 如果 iX 与 ( i - + i )相互独立 , 和 的平均数 OLS 估计量是一致估计量 。 平均数 OLS估计法适用于短期面板的混合模型和个体随机效应模型 。 对于个体固定效应模型来说

40、 ,由于i 和 Xit相关 ,也即 i 和 iX 相关 ,所以 ,回归参数的 平均数 OLS 估计量是非一致估计量 。 3.3 离差 变换 ( within) OLS 估计 对于短期面板数据 , 离差变换 OLS 估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值 ,然后利用 离差变换 数据估计模型参数 。 具体步骤是 ,对于个体固定效应 模型 yit = i + Xit +it (24) 中的每个个体计算平均数 ,可得到如下模型 , 14 iy = i + iX + i 其中 iy 、 iX 、 i 的定义见 ( 22)式。上两式相减 ,消去了 i,得 yit - iy

41、 = (Xit - iX ) + (it - i ) 此模型称作 离差变换 数据模型 。对上式应用 OLS 估计 , = = =NiTtNiTtiit yy1 11 1)()(iitiitiitXXXXXX所得 的估计量称作 离差变换 OLS 估计量 。对于个体固定效应 模型 , 的离差变换 OLS 估计量是一致估计量 。 如果 it 还满足独立同分布条件 , 的离差变换 OLS 估计量不但具有一致性而且还具有有效性 。如果对固定效应 i感兴趣 ,也可按下式估计 。 i = iy - iX (27) 利用中心化 (或离差变换 )数据 ,计算回归参数估计量 的方差协方差矩阵如下 , Var (

42、) = 211 1)(= = NiTtiitiit XXXX (28) 其中 2 = kNNTNiTtit= =1 12。 个体固定效应 模型 的估计通常采用的就是 离差变换 ( within) OLS 估计法 。 在短期面板条件下 ,即便 i 的分布 、以及 i 和 Xit 的关系都已知到 , i 的估计量仍不具有一致性 。当个体数 N 不大时 ,可采用 OLS 虚拟变量估计法估计 i 和 。 离差变换 OLS 估计法的 主要缺点 是不能估计非时变回归变量构成的面板数据模型 。比如 Xit = Xi(非时变变量 ), 那么有 iX = Xi,计算离差时有 Xi - iX = 0。 3.4 一

43、阶差分 ( first difference) OLS 估计 在短期面板条件下 ,一阶差分 OLS 估计就是 对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行 OLS 估计 。具体步骤是 ,对个体固定效应 模型 yit = i + Xit +it 取其滞后一期关系式 yit-1 = i + Xit-1 +it-1 上两式相减 ,得一阶差分模型 ( i被消去 ) yit -yit-1 = (Xit - Xit -1) + (it -it-1) , i = 1, 2, , N; t = 1, 2, , T 对上式应用 OLS 估计得到的 的估计量称作 一阶差分 OLS 估计量

44、。尽管 i 不能被估计 , 的估计量 是一致估计量 。 在 T2, it独立同分布条件下得到的 的一阶差分 OLS 估计量不如 离差变换 OLS 估计15 量有效 。 3.5 随机效应 ( random effects)估计法 (可行 GLS( feasible GLS)估计法 ) 有个体固定效应模型 yit = i + Xit +i i, it 服从 独立同分布 。对其作如下变换 yit - iy = (1- ) + (Xit - iX ) + vit ( 29) 其中 vit = (1- )i + (it - i )渐近服从独立同分布 , = 1-22T+,应用 OLS 估计 ,则所得估计

45、量称为随机效应估计量或可行 GLS 估计量 。 当 = 0 时,( 29)式等同于混合 OLS估计 ;当 =1 时,( 29)式等同于 离差变换 OLS 估计 。 对于随机效应模型 ,可行 GLS 估计量不但是一致估计量 ,而且是有效估计量 , 但对于个体固定效应模型 ,可行 GLS 估计量不是一致估计量 。 面板数据模型估计量的稳健 统计推断 。在实际的经济面板数据中 , N 个个体之间相互独立的假定通常是成立的 ,但是每个个体本身却常常是序列自相关的 ,且存在异方差 。为了得到正确的统计推断 ,需要克服这两个因素 。 对于第 i 个个体 ,当 N, Xi的方差协方差矩阵仍然是 TT 有限阶

46、的 ,所以可以用以前的方法克服异方差 。采用 GMM 方法还可以得到更有效的估计量 。 EViwes 中对随机效应 模型 的估计采用的就是可行 ( feasible ) GLS 估计法 。 4面板数据模型 检验 与设定 方法 ( 1)面板数据 模型 中参数约束是否成立的 Wald 检验 )1(1 )( )1( )()()( = mmmmW ffVarf 2(m) 其中 f() 表示由约束条件组成的列向量 。 m 表示被检验的约束条件的个数 , )()()()()()()(mkkkkm = fVarffVar ,其中 k 表示解释变量个数 。 ( 2)面板数据 模型 中丢失变量或存在多余变量的检验 F = )1/( /)( kNTSSE mSSESSEuur F (m, NT- k -1) 其中 SSEr 表示施加

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报