1、,自相关原因是什么? 如何检验自相关? 如何消除自相关?,上章回顾,第九章 虚拟变量及其设置的方法,可直接度量的变量不可直接度量的变量建立和应用计量经济学模型时,经常要考虑属性因素的 影响。例如,职业对个人收入的影响、战争与和平对经济发展的影响、繁荣与萧条对就业的影响、文化程度对工资的影 响、自然灾害对农业生产的影响、季节对销售量的影响。所 以需要考虑是否在模型中引入属性因素。,虚拟变量,经济变量,一、虚拟变量的定义,根据属性类型,构造只取“0”或“1”的人工变量,称为虚拟变量(Dummy Variable)。通常记为 D。1 男0 女含有虚拟变量的模型称为虚拟变量模型。二、虚拟变量的引入虚拟
2、变量在模型中可以作解释变量,也可以作被解释变量。一般是作解释变量。虚拟变量的引入有两种基本方式:加法方式和乘法方式。,D =,1 反常情况0 正常情况 Y = b0 + b1 X + b2 D + u反常情况: Y = (b0 + b2 ) + b1 X + u 正常情况: Y = b0 + b1 X + u,1、加法方式,D =,X,Y,b0,b2,增加的一个截距可认为是虚拟变量 带来的影响。,正常,反常,企业男职工的平均薪金为:,假设职工工资主要与教龄相关,但性别会对工资产生影响。检验男职工是否比女职工工资更高,在该模型中, 企业女职工的平均薪金为:,几何意义:,假定20,则两个函数有相同
3、的斜率,但有不同的截距。意即,男女职工平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差2。 可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。,0,2,又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。,教育水平考虑三个层次:高中以下,高中,大学及其以上,模型可设定如下:,这时需要引入两个虚拟变量:,在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:,高中以下:,高中:,大学及其以上:,假定32,其几何意义:,还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。,如在上述职工
4、薪金的例中,再引入代表学历的虚拟变量D2:,本科及以上学历 本科以下学历,职工薪金的回归模型可设计为:,女职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,于是,不同性别、不同学历职工的平均薪金分别为:,男职工本科以下学历的平均薪金:,男职工本科以上学历的平均薪金:,书84页例4.4,请同学自习,然后回答下列问题: 为何虚拟变量只设中部与西部,东部为何不设? 代表中西部的系数为何会是负数?,1 反常情况0 正常情况 Y=b0+b1 X+b11 DX+ u反常情况: Y = b0 + (b1+ b11)X + u 正常情况: Y = b0 + b1 X + u,2、乘法方式,D =,
5、X,Y,b0,斜率发生了变化,可认为是虚拟变量 带来的影响。,正常,反常,例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。,这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。 假定E(i)= 0,上述模型所表示的函数可化为:,正常年份:,反常年份:,如,设,消费模型可建立如下:,书85页例4.5,假说:市场经济(经济制度)让农民对价格更敏感。 注意:调整后的公式如下: Y=b0+b1Pt+b2Xt+a1(Pt
6、Dt) 问: 如果b1不显著,但 a1显著,说明了什么?本题假说是否正确? 如果上述参数显著性正好相反呢?,1 反常情况0 正常情况 Y=b0+b01D+b1 X+ b11D X反常情况: Y=(b0+b01)+(b1+b11) X 正常情况: Y = b0 + b1 X,3、加法乘法并用,D =,X,Y,b0,b01,截距和斜率均发生变化,正常,反常,1 t t*0 t t* Y=b0+ b1X+ b2 (X X *)D反常情况: Y=b0 b2 X *+ (b1+b2) X 正常情况: Y = b0 + b1 X,4、临界指标的虚拟变量的引入,D =,X,Y,b0,两条不同时期的直线可在转
7、折 期连起来成为一条折线,在经济发展的转折时期 以 t* =1979 为转折期 以转折期的自变量 X 为临界值,X*,三、模型中引入虚拟变量的作用1、分离异常因素的影响2、检验不同的属性类别因素对因变量的影响3、提高模型的精度,四、虚拟变量设置的原则在模型中引入多个虚拟变量时,虚拟变量的个 数应按下列原则确定:如果有 m 种互斥的属性类型,在模型中引入 m-1 个虚拟变量。如研究季节对销售量的影响 C = b0+ b1 X + a1 D1 + a2 D2 + a3 D3 + u1 春季0 其它季节 当心1 夏季 虚拟变量陷阱0 其它季节1 秋季0 其它季节,D1 =,D2 =,D3 =,在 E
8、views 中直接输入变量 data D1 D2 D3,五、Chow检验,在现实生活中,有时会由于某些重大的政策和制度变化或偶发事件,导致经济运行机制或行为改变。 不同的经济体制 不同的生产条件 对于计量经济学研究工作来说,这种情况表现为模型的参数发生改变。 如果在样本资料所涉及的期间内发生过这样的情况,那么就有必要检验模型参数的稳定性。 Chow检验考虑样本是否包括了不同质的组,即检验不同组间的参数是否相同。,Chow检验,在EVIWES中,Chow检验有两种不同的方式: 转折点检验(breakpoint test): 预测检验(forecast test),Chow检验,Chow转折点检验
9、基于这样一种思路: 如果确实存在结构变化,那么分别对结构变化发生前和发生后的子样本数据做回归时得到的残差平方和要小于利用全部样本数据估计模型得到的残差平方和。 这是由于前者允许两个子模型有不同的参数,而后者则令两个时期的参数相同,因而前者通常可以得到对样本数据的较好拟合。 我们将前者称作是无参数限制的模型,后者是有参数限制的模型。 通过比较加上参数约束后是否使残差平方和显著增大,我们可以检验模型是否存在结构变化。,Chow检验,考虑分两个组的情况,检验过程分以下步骤: 依据对转折发生时间的了解,将全部样本分为两个部分; 分别用两个组的数据做回归(即参数未受限制的情况) ,得到残差平方和SSR1
10、和SSR2(注意有RSSur=RSS1+RSS2); 用全部数据做回归(即参数受限制的情况),得到残差平方和SSR; 计算F统计值 检验其显著性。 用全部数据做回归等同于加上k个约束条件,即两个方程的所有参数都相同; 用两组数据分别做回归则得到两套不同的截距和斜率系数,因而相应的自由度为T-2k,T为样本总量。,注:邹检验的自由度,SSRR:T-K-1,在大样本条件下1可忽略,即T-K; SSR1+SSR1:受约束增加一倍,即2K,其自由度为T-2K; SSRR-(SSR1+SSR1)自由度:T-K-(T-2K)=k;,Chow预测检验,Chow转折点检验方法存在一个问题,若某个子样本包括的观
11、察值太少,那么可能无法用其估计子模型。此时可以考虑采用Chow预测检验。 Chow预测检验同样需要将全部样本分为两个部分,检验的步骤为: 利用全部样本估计模型,得到RSSr; 利用第一个子样本(假定容量为T1)估计模型,得到RSSu ; 用估计的模型预测第二个子样本(假定容量为T2)的因变量; 计算F统计量:若预测与实际情况有很大偏差, RSSr会显著大于RSSu ,这意味着两个子样本之间可能出现结构变化。,自由度:,SSRR=T1+T2-K-1,1忽略之后,即T1+T2-K; SSRU=T1-K-1,1忽略之后,即T1-K,因为未受约束的样本量是预测之前的样本量,即T1。,案例1:地理区位影
12、响,研究安徽省粮食可挖掘生产潜力的影响因素,假说如下: 人口的老化与非农化导致粮食生产潜力没有挖掘; 基础设施的不完善导致粮食生产潜力无法实现。 地理区位因为即影响基础设施又影响劳动力转移所以是比较重要的影响因素。,数据与虚拟变量设置,数据:共894个农户,分布区域包括: 平原; 丘陵; 山区。,Variable Coefficient Std. Error t-Statistic Prob. C 1520.291 257.6199 5.901295 0.0000 AGE -9.528255 4.416825 -2.157263 0.0313 EDU -138.9207 16.44906 -8
13、.445509 0.0000 HILL 491.9524 124.4252 3.953801 0.0001 MOU 135.0279 85.84877 1.572858 0.1162 ROAD -180.0771 149.4807 -1.204685 0.2287 LAND 827.9669 70.37880 11.76444 0.0000 IRRI -597.7996 118.0740 -5.062923 0.0000 RGIN -0.944183 0.103780 -9.097896 0.0000 DISS 7.665067 2.227820 3.440613 0.0006,案例2:CHO
14、W检验,数据:安徽省粮食种植面积; 目的:预测十二五我省粮食种植面积;,散点图:,CHOW判断 VIEW-STABILITY TEST-CHOW BREAK POINT TEST-填入断点时间-OK,如果F值对应的概率比较小,说明受约束的残差平方和远远大于未受约束的残差平方和,这表明存在转折点。,如何建模?,分断建立回归模型,可以提高预测精度; 还可以引入虚拟变量:加法与乘法方式 GFIELD = C(1) + C(2)*D1 + C(3)*T + C(4)*D1*T,建模结果,以临界值方式引入虚拟变量(分段线性回归):,GFIELD = C(1) + C(2)*T + C(3)*D1*(T-13),小结,虚拟变量设置类型 CHOW检验作用与思路 虚拟变量与CHOW检验演示 CHOW(邹检验)与加法、乘法并用的虚拟变量引入以及临界值方式引入。,