1、第五章 经典单方程计量经济学模型:专门问题,5.1 虚拟变量模型5.2 滞后变量模型,5.1 虚拟变量模型,一、虚拟变量的实质二、截距变动模型三、斜率变动模型四、截距和斜率同时变动模型五、折线回归,一、虚拟变量的实质,回归变量:量变量,质变量 量变量是可以定量度量的,如:商品需求量、价格、收入、产量等 质变量:不是数量的反映,而是反映某种质量和属性,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”,,1、虚拟变量(哑变量,虚设变量,二进制变量) ( Dummy Varia
2、ble),是量化了的质变量,通常取值为1或0(非绝 对), 用D表示取1表示存在某种性质或具有某种属性取0表示不存在某种性质或不具有某种属性,例5.1.1,0y: 一个工人每年的收入,作用:女工平均年收入:,男工平均年收入:,检验: 看=0 是否显著,可知有无性别差异,2、虚拟变量的性质 以“0”“1”取值的虚拟变量所反映的内容可随 意设定; D=0通常用以说明基础类型; 虚拟变量也可以用来表示数量变量。,3、虚拟变量的作用 可以描述和测量定性(或属性)因素的影响; 能够正确反映经济变量之间的相互关系,提高模型的精度; 便于处理异常数据。,二、截距变动模型,1、一个数量变数和一个虚拟变数,例5
3、.1.2 研究城镇居民家庭和农村居民家庭的消费函数,设:,消费函数为:,其中:Yi为第i个家庭消费水平,Xi为第i个家庭的收入水平,上式可以写成:,Y,X,城,农,例5.1.3 研究战时和平时个人收入与个人储蓄的关系,战时:,设平时:,其中: S:个人储蓄 y:个人收入,引入虚拟变量D:,注意:如果一个质变量有m个类型,只引 入m-1个虚拟变量,否则不能进行ols估计;但如果模型不含截距项,可引入m个虚拟变量。, 例5.1.2引入2个虚拟变量,由于D1+D2=1,而截距项0对应的变量值就是1,解释变量之间存在完全的多重共线性,该模型无法估计。而例5.1.3可以引入2个虚拟变量:,2、一个数量变
4、数和同一属性两个以上虚拟变数,例5.1.4, 教师学历:大专,本科,研究生,其中:,:一个大学教师每年的收入,:教龄,Y,X,专,研,例5.1.5,季节分析一家百货公司的销售额严重受季节性的影响 设:,3、一个数量变数和多个属性变数,例5.1.6 消费函数考虑: 家长性别 男,女 家长年龄 30岁以下,3050岁,50岁以上 设三个虚拟变量:,当,时,表示家长年龄在50岁以上,消费函数:,三、斜率变动模型,例5.1.7 城镇居民家庭和农村居民家庭的消费函数,,Y,城镇,农村,X,消费函数为:,即:,设:,四、截距和斜率同时变动模型,例5.1.8 ,城镇居民家庭与农村居民家庭的消费函数, 截距和
5、边际消费倾向(即斜率)都有所不同。,城镇,农村,五、折线回归,例5.1.9,,y,设:两段方差无明显差异,其中,x* x,作业:,某地区家庭消费C,除依赖于收入Y之外,还同 下列因素有关:(1)民族:汉,蒙,满,回,藏(2)家庭月收入:500元以下,5001000元,1000元以上(3)家庭的文化程度:高中以下,高中,大专以上试设定该地区消费函数的回归模型。(截距和斜率同时变动模型),5.2 滞后变量模型,一、滞后变量模型 二、分布滞后模型的参数估计 三、格兰杰因果关系检验,通常把过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable),含有滞后变量的模型称为滞后变量模型。
6、,一、滞后变量模型,如:消费函数Ct=0+1Yt+2Yt-1+3Yt-2+tYt-1,Yt-2为滞后变量。,滞后变量模型考虑了时间因素的作用,使静态分析 的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型,1、滞后效应与与产生滞后效应的原因,因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。表示前几期值的变量称为滞后变量。, 产生滞后效应的原因,* 心理原因 * 技术原因 * 制度原因,2、滞后变量模型,以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为:,q,s:滞后时间间隔,自回归分布滞后模型(ADL):既含有Y对自身滞后变量的回归,还包括着X分布在不同时期
7、的滞后变量有限自回归分布滞后模型:滞后期长度有限无限自回归分布滞后模型:滞后期无限,(1)分布滞后模型,分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X的当期值及其若干期的滞后值:,0:短期或即期乘数,表示本期X变化一单位对Y平均值的影响程度。 i (i=1,2,s):动态乘数或延迟系数,表示各滞后期X的变动对Y平均值影响的大小。,称为长期或均衡乘数,表示X变动一个单位,对Y平均值总影响的大小。,(2)、自回归模型(autoregressive model),而,称为一阶自回归模型(first-order autoregressive model)。,自回归模型:模型中的解释变量仅包含X
8、的当期值与被解释变量Y的一个或多个滞后值,二、分布滞后模型的参数估计,无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。有限期的分布滞后模型,OLS会遇到的问题: 没有先验准则确定滞后期长度; 如果滞后期较长,将缺乏足够的自由度进行估计和检验; 同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。,1、分布滞后模型估计的困难,2、分布滞后模型的修正估计方法,基本思想:通过对各滞后变量加权,组成线性合成变量而有目的地减少滞后变量的数目,以缓解多重共线性,保证自由度。,(1)经验加权法根据实际问题的特点、实际经验,给各滞后变量指定权数,滞后变量按权数线性组合,
9、构成新的变量。,权数的类型有:,递减型:,权数是递减的,X的近期值对Y的影响较远期值大。如消费函数中,收入的近期值对消费的影响作用显然大于远期值的影响。例如:滞后期为 3的一组权数可取值如下:1/2, 1/4, 1/6, 1/8 则新的线性组合变量为:,权数是相等的,X的逐期滞后值对值Y的影响相同。如滞后期为3,指定相等权数为1/4,则新的线性组合变量为:,矩型:,权数先递增后递减呈倒“V”型。例如:在一个较长建设周期的投资中,历年投资X对产出Y的影响,往往在周期期中投资对本期产出贡献最大。如滞后期为4,权数可取为1/6, 1/4, 1/2, 1/3, 1/5 则新变量为,倒V型,例5.2.1
10、 对一个分布滞后模型:,给定递减权数:1/2, 1/4, 1/6, 1/8,令,原模型变为:,该模型可用OLS法估计。假如参数估计结果为,=0.5,=0.8,则原模型的估计结果为:,经验权数法的优点是:简单易行缺点是:设置权数的随意性较大,通常的做法是:多选几组权数,分别估计出几个模型,然后根据常用的统计检验(方检验,检验,t检验,-检验),从中选择最佳估计式。,(2)阿尔蒙(Almon)多项式法,主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用OLS法估计参数。,第一步,阿尔蒙变换 对于分布滞后模型,假定其回归系数i可用一个关于滞后期i的适当阶数的多项式来
11、表示,即:,(*),其中,ms,阿尔蒙变换要求先验地确定适当阶数m,例如取m=2,得,将上式代入(*) 式得:,定义新变量,将原模型转换为:,第二步,模型的OLS估计,对变换后的模型进行OLS估计,得,然后根据,求出滞后分布模型参数的估计值:,由于ms,可以认为原模型存在的自由度不足和多重共线性问题已得到改善。,需注意的是,在实际估计中,阿尔蒙多项式的阶数m一般取2或3,不超过4,否则达不到减少变量个数的目的。,三、格兰杰因果关系检验,自回归分布滞后模型旨在揭示:某变量的变化受其自身及其他变量过去行为的影响。 然而,许多经济变量有着相互的影响关系,GDP,消费,问题:当两个变量在时间上有先导滞
12、后关系时,能否从统计上考察这种关系是单向的还是双向的? 即:主要是一个变量过去的行为在影响另一个变量的当前行为呢?还是双方的过去行为在相互影响着对方的当前行为?,格兰杰因果关系检验(Granger test of causality),对两变量Y与X,格兰杰因果关系检验要求估计:,(*),(*),可能存在有四种检验结果: (1)X对Y有单向影响,表现为(*)式X各滞后项前的参数整体不为零,而(*) 式Y各滞后项前的参数整体为零;,(2)Y对X有单向影响,表现为(*)式Y各滞后 项前的参数整体不为零,而(*)式X各滞后项前的 参数整体为零;,(3)Y与X间存在双向影响,表现为Y与X各滞后项前的参
13、数整体不为零;,(4)Y与X间不存在影响,表现为Y与X各滞后项前的参数整体为零。,通过受约束的F检验完成。如:,假设:X不是Y的格兰杰原因 (或: X各滞后项前的参数整体为零),分别做包含与不包含X滞后项的回归,记前者与后者的残差平方和分别为RSSU、RSSR;再计算F统计量:,m为X的滞后项的个数,n为样本容量,k为无约束回归模型的待估参数的个数。,如果: FF(m,n-k) ,则拒绝原假设,认为X是Y的格兰杰原因。,注意:格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全不同的检验结果。因此,一般而言,常进行不同滞后期长度的检验,以检验模型中随机误差项不存在序列相关的滞后期长度来选取滞后期。,