1、1,计量经济学,2,第十四章 面板数据计量模型,3,前面的章节讨论了如何处理横截面计量模型和时间序列计量模型。在这一章中,将讨论如何处理将横截面数据与时间序列数据结合在一起的数据,通常将这类数据叫做“面板数据”。本章首先将介绍什么是面板数据,以及面板数据在数据分析中具有哪些优势;然后再介绍几种最常用的面板数据模型混合回归模型,固定效应模型和随机效应模型;最后对固定效应模型和随机效应模型加以比较。,4,第一节 面板数据,一、面板数据的定义其他的名称: “纵列数据”,“平行数据”,“固定调查对象数据”,“时间序列和横截面数据的联合”等等。 按照比较权威的理解,面板数据用来描述一个总体中给定样本在一
2、段时间的情况,并对样本中每一个样本单位都进行多重观察。这种多重观察包括对样本单位在某一个时期(时点)上多个特性进行观察,也包括对这些特性在一段时间的连续观察,通常观察将得到数据集称为面板数据。在宏观经济领域,它被广泛应用于劳动经济学、国际金融、经济增长、产业结构、技术创新、金融、税收政策等领域;在微观经济领域,它被大量应用于就业、家庭消费、企业管理、市场营销等领域。,5,面板数据从横截面看,是由若干个体在某一时点构成的横截面观测值,从纵剖面看每个个体都是一个时间序列。面板数据用双下标变量表示。例如Yit,, i = 1, 2, , N; t = 1, 2, , Ti对应面板数据中的不同个体,N
3、表示面板数据中含有N个个体;t对应面板数据中不同时点,T表示时间序列的最大长度。若固定t不变,Yi., ( i = 1, 2, , N)是第t期横截面上的N个随机变量;若固定i不变,Y.t, (t = 1, 2, , T)是第i个纵剖面上的一个时间序列(个体)。,6,1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入(不变价格)数据见表14.1和表14.2。人均消费和人均收入两个面板数据都是平衡面板数据,各有15个地区。两个面板的数据都是7年的,每年都有15个数据,共105组观测值。,7,表14.1 1999-2002年中国东北、华北、华东15个省级
4、地区的居民家庭人均消费数据(不变价格),8,表14.2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格),9,二、面板数据模型的优点,(1)与截面数据模型比较,面板数据模型控制了不可观测经济变量所引起的OLS估计的偏差,使得模型设定更合理、模型参数的样本估计量更准确。(2)与时间序列模型相比较,面板数据模型扩大了样本量,提供了更多有效信息、更多变化性、更少共线性、更多自由度,降低了经济变量间的多重共线性,提高了估计量的有效性。(3)面板数据能更好地识别和度量时间序列数据或截面数据不可发觉的潜在因素对被解释变量的影响。(4)相对于纯横截面和纯时间序列数据而
5、言,面板数据有利于建立和检验更复杂的行为模型。,10,(5)有效样本容量不足一直是经济计量方法应用时面临的难题,而面板数据可以有效解决样本容量不足的问题。(6)动态面板数据模型能够更准确地反映经济变量的动态调整;而且通过滞后期因变量能够间接反映潜在因素对当期自变量的影响。(7)微观面板数据能够收集到更准确的微观单位(个体,企业,家庭,省市区)的数据,可以降低由此得到的宏观统计数据测量误差的影响。(8)宏观面板数据可以用来研究经济合作组织内各成员单位的协同效应。因此,面板数据的计量经济分析的研究具有重要的理论意义和应用价值。,11,三、面板数据模型类型,在面板数据建立过程中,不但可以建立线性模型
6、,还可以建立非线性模型;不仅可以建立静态计量模型,还可以建立动态计量模型。线性的静态模型的形式主要包括六大类: (1)截距项和解释变量的系数都不变的混合估计模型 (2)截距项变化但是解释变量的系数不变的固定效应模型和随机效应模型 (3)截距项和解释变量的系数都改变的确定系数面板数据模型和随机系数面板数据模型 (4)以及特别适用于微观面板数据的平均个体或平均时间的平均回归模型,12,(5)线性的动态面板数据模型通常包括含有因变量的滞后项的动态面板数据,以及将VAR推广到面板数据的Panel data VAR(P-VAR)(6)利用面板数据模型还可以建立联立方程模型和多种带测量误差形式的模型。非线
7、性的面板数据模型包括:(1)离散面板数据模型和非平衡面板数据模型(2)受限因变量的模型(Logit和Probit模型)(3)生存模型以及点过程模型 时间跨度较长的时间序列的出现,为面板数据分析提供了两个重要的研究方向,面板数据序列的稳定性及数据序列的长期均衡性,即面板数据研究的热点领域面板单位根检验和面板协整检验。,13,混合回归模型的特点是对任何个体和截面,回归系数和都相同。可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it) = 0。那么无论是N,还是T,模型参数的混合最小二乘估计量(Pooled OLS)都
8、是一致估计量。,14,四、混合回归模型(Pooled model),如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不穿在显著性差异,即不存在显著的随时间或者是个体变化的效应,那么就可以利用如下模型 i = 1, 2, , N, t = 1, 2, , T,k=1,2,K其中Yit为被被解释变量,表示截距项,Xkit 为解释变量,k为相应的回归系数, 为误差项(标量)。则称此模型为混合回归模型。,15,第二节 固定效应模型(Fixed Effects Model),如果自变量对因变量的效应不随个体和时间变化,并且解释因变量的信息不够完整,即自变量中遗漏了一些影响因变量的
9、不可观测的且随个体或时间变化的潜在因素时,可以加入虚拟变量以反映潜在因素对因变量的影响,通常称此种模型为固定效应模型。固定效应模型的特点是,对于不同的时间序列(或不同的横截面)模型的自变量的系数保持不变,截距项随个体(或时点)变化而改变。固定效应模型可分为3种类型,即个体固定效应模型、时点固定效应模型和个体时点固定效应模型。,16,一、个体固定效应模型,如果对于不同的时间序列(个体)截距项是不同的,但对于不同的横截面,模型的截距项没有显著变化,那么就应该建立个体固定效应模型,其模型的一般形式如下: Yit和Xkit, i = 1, 2, , N; t = 1, 2, , T, k=1,2,.,
10、K,分别表示因变量和自变量, it, i = 1, 2, , N; t = 1, 2, , T,表示随机误差项。,17,用虚拟变量表示为,写成矩阵形式如下:,其中,,18,进一步简化,可写为,其中,19,1.最小二乘虚拟变量(LSDV)估计 面板数据模型用OLS方法估计时应满足如下5个假定条件:,20,当模型满足上述假定条件时,则模型(*)是一个包含N个虚拟变量(禁止了共同的截距项)的多元线性回归模型,用最小二乘法估计模型的系数,可以得到系数的最佳线性无偏估计量。,21,22,2.离差(within)OLS估计,在实际应用时,利用LSDV估计法估计个体固定效应模型,引入N个虚拟变量 ,就容易陷
11、入虚拟变量陷阱;当N较大的时候,由于引入的虚拟变量过多,消耗了许多自由度,导致需要的虚拟变量系数过多,使得估计过程变得非常复杂。于是,出于估计的简便性,通常采用一种名为离差OLS估计的方法来替代最小二乘虚拟变量估计。,23,为了说明离差OLS的原理,先定义两个有用的算子:,容易验证,P,Q为幂等矩阵,,,且PQ=O。,24,以Q左乘公式(*)得QY=QXB+QU,其中,25,这样在模型中截距项和虚拟变量就消失了, 变形后的模型用最小二乘法得到离差OLS估计量用OLS法估计混合回归模型和个体固定效应模型中,结果是一样的,但用个体固定效应模型估计,可以减少被估参数个数,并且得到的的估计参数也具有一
12、致性。进而得到模型的参数,26,如果想估计确定性的个体效应,则必须做出假定 ,则此时,估计量,的方差阵为,27,三、个体固定效应的检验,面板数据模型设定形式的多样性,如何确定面板数据的模型形式就显得非常重要。对于混合回归模型和个体固定效应来说,两者最大的不同在于截距项的约束性不同,即混合回归模型的截距项全部相同,约束性较强,个体效应的截距项随着个体的变化而变化,约束性较弱。于是,相对于混合回归模型模型来说,是否有必要建立个体固定效应模型可以通过对残差平方和进行方差分析,构造F检验来完成。原假设H0: 不同个体的模型截距项相同(应建立混合估计模型)。备择假设H1:不同个体的模型截距项不同(应建立
13、个体固定效应模型)。,28,F统计量定义为其中SSEr,USSu分别表示约束模型(混合估计模型)和非约束模型(个体固定效应模型)的残差平方和。非约束模型比约束模型多了N-1个被估计参数(混合估计模型给出公共截距项)。本例中所谓的约束,主要是指对于截距项设定形式的约束。在给定的显著性水平下,计算F统计量,与F分布表中相应临界值进行比较,如果拒绝了原假设,则倾向于建立个体固定效应模型,否则就倾向于建立混合回归模型。,29,四、时点固定效应模型,时点固定效应模型就是对于不同的截面(时点)有不同截距的模型。如果确定对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该
14、建立时点固定效应模型,表示如下Yit, Xkit分别表示被解释变量和解释变量, it表示随机误差项,30,用虚拟变量表示为 如果满足上述模型假定条件,可对时点固定效应模型进行OLS估计,全部参数估计量都具有无偏性和一致性。,其中,31,五、个体时点固定效应模型,个体时点固定效应模型就是对于不同的时间序列(个体)、不同的截面(时点)都有不同截距的模型。如果确知对于不同的时间序列(个体)、不同的截面模型的截距都显著地不相同,那么应该建立个体时点固定效应模型,表示如下 uit,表示随机误差项,Yit, Xit分别表示被解释变量和解释变量(i = 1, 2, , N; t = 1, 2, , T) 。
15、 如果满足上述模型假定条件,对模型进行OLS估计,全部参数估计量都是无偏的和一致的。,32,第三节 随机效应模型(Random Effects Model),一、随机效应的概念 在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整,但是固定效应模型中包含了许多虚拟变量,减少了模型估计的自由度,使得建立模型的代价非常高昂;实际应用中,固定效应模型的随机误差项难以满足模型的基本假设,易于导致参数的非有效估计。随机效应模型可以用来弥补这些不足。,33,基本的想法是假定误差项在时间序列(个体)上和截面上都是相关的,因而可以将随机误差项分解为3个分量,表示如下 uit = i +t + wi
16、t 其中i N(0, 2)表示个体随机误差分量;t N(0, 2)表示截面随机误差分量;wit N(0, w2)表示混和随机误差分量。同时还假定i,t,wit之间互不相关,各自分别不存在截面自相关、时间自相关和混和自相关。,34,随机效应模型的基本形式: 一般把上式称为双分量误差分解模型或者是个体时点随机效应模型。如果模型中只存在个体随机误差分量i 而不存在时间随机误差分量,则称为个体随机效应模型;如果只存在时间随机误差分量t而不存在个体随机误差分量i,则称为时点随机效应模型。实际中,个体随机效应最常用。 随机效应模型和固定效应模型比较,相当于把固定效应模型中的截距项看成两个随机变量。一个是个
17、体随机误差项i,一个是截面随机误差项t。如果这两个随机误差项都服从正态分布,对模型估计时就能够节省自由度,因为此条件下只需要估计两个随机误差项的均值和方差。,35,二、 个体随机效应模型,个体随机效应模型的基本形式:个体随机误差项i是属于第i个体的随机误差,并在整个时间范围内(t = 1,2, , T)保持不变。随机误差项ui, wit应满足如下条件:,36,实质上可理解为,样本中的N个个体是取自某个体数量很大的总体,该总体截距项的均值为,而样本中第i个体的截距项对的偏离为i,这样单个个体截距项的差异都体现在误差项uit中。,37,38,39,三、随机效应模型的估计,假定要估计的模型形式为,4
18、0,估计的步骤,41,42,三、个体随机效应模型设定检验,43,44,第四节 固定效应模型和随机效应模型的比较,一、 Hausman检验 对同一参数的两个估计量差异的显著性检验称作Hausman检验,简称H检验。H检验由Hausman于1978年提出,是在Durbin(1914)和Wu(1973)研究的基础上发展起来的。所以H检验也称作Wu-Hausman检验和Durbin-Wu-Hausman检验。,45,46,47,二、两种模型的比较,48,第十五章 二元选择摸型,49,如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列
19、解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。这里主要介绍Tobit(线性概率)模型,Probit(概率单位)模型和Logit模型。,50,第一节 Tobit(线性概率)模型,Tobit模型的形式如下, yi= + xi + ui (15.1) 其中u 为随机误差项,xi为定量解释变量。yi为二元选择变量。此模型由James Tobin 1958年提出,因此得名。如利息税、机动车的费改税问题等。设,51,52,以pi = - 0.2 + 0.05 xi 为例,说明xi 每增加
20、一个单位,则采用第一种选择的概率增加0.05。,53,Tobit模型误差的分布,54,上两式说明,误差项的期望为零,方差具有异方差。当pi接近0或1时,ui具有较小的方差,当pi接近1/2时,ui具有较大的方差。所以Tobit模型(15.1)回归系数的OLS估计量具有无偏性和一致性,但不具有有效性。假设用模型(15.4)进行预测,当预测值落在 0,1 区间之内(即xi取值在4, 24 之内)时,则没有什么问题;但当预测值落在0,1 区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是 0,1,所以此时必须强令预测值(概率值)相应等于0或1。,55,然而这样做是有问题的。假设预测某个事件
21、发生的概率等于1,但是实际中该事件可能根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。,56,由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然累积概率分布函数F(z ) 能满足这样的要求。采用累积正态概率分布函数的模型称作Probit模型。用正态分布的累积概率作为Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函
22、数的模型称作logit模型。,57,累积正态概率分布曲线 logistic曲线,58,第二节 Probit(概率单位)模型,59,第三节 logit模型,60,Probit曲线和logit曲线很相似。两条曲线都是在pi = 0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。利用(15.6)和(15.7)式得到的概率值,61,Probit曲线、logit曲线比较示意图 logit曲线计算上也比较方便,所以Logit模型比Probit模型更常用。,62,63,由上式知回归方程的因变量是对数的某个具体选择的机会比。logit模型的一个重要优点是把在 0,1 区间上预测概率的问题转化为
23、在实数轴上预测一个事件发生的机会比问题。logit累积概率分布函数的斜率在pi = 0.5时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于pi = 0.5附近的解释变量xi的变化对概率的变化影响较大,而相对于pi接近0和1附近的xi值的变化对概率的变化影响较小。,64,使用极大似然法估计Logit模型参数,首先分析含有两个参数( 和)的随机试验。假设被估计的模型如下 在样本中pi是观测不到的。相对于xi的值,只能得到因变量yi取值为0或1的信息。极大似然估计的出发点就是寻找样本观测值最有可能发生条件下的 和 的估计值。 从样本看,如果第一种选择发生了n次,第二种选择发生了N-n次。设采取第
24、一种选择的概率是pi。采取第二种选择的概率是(1- pi)。重新将样本数据排列,使前n个观测值为第一种选择,后N-n个观测值为第二种选择(观测值是0,1的,但相应估计的概率却各不相同),则似然函数是,65,66,分别求上式对 和 的偏导数,并令其为0,即 便可求到 和 的极大似然估计值。 和 的极大似然估计量具有一致性和渐近有效性,且都是渐近正态的。,67,离散选择模型的其他几种形式,删改模型或删截模型(censored regression model)。把小于或大于某一点的数值用该点数值替代的模型。Tobit模型就是一种删截模型,被解释变量在删改点1之上或0之下的值分别被赋值1或0。截尾模
25、型或截断模型(truncated regression model)。应用于某个截断点之上或之下的观测值数据得不到或故意舍弃的一种回归模型。例如某种产品,见到的只是分等级的合格品,不合格品已经看不到,被舍弃。,68,计数模型(count model)。当被解释变量表示次数时,离散模型就变成了计数模型。例如每年华北地区发生沙尘暴次数的模型,公司申请专利数模型。因变量服从泊松分布。有序响应模型(ordered response model)。当相互排斥的定性分类有一个正常的顺序时,可用有序响应模型描述。例如描述某人的受教育程度时,建立的模型。有序响应模型与计数模型有些类似,但又不同。有序响应数据没有自然的数值。多元离散选择模型(multiple choice model)。被解释变量的选择不是二元的,而是多元的。,