1、1第四章 线性模型的扩展线性模型扩展的含义:研究非标准线性模型的估计、预测等问题。基本的方法:通过适当的变换,将非线性的经济模型转换为标准线性模型。进而用标准线性回归方法进行估计。第一节 模型的类型与转换一、变量取倒数的模型1、模型的基本形式:,其中,随机扰动项 满足假定条件。12t ttYuX tu2、转换后的标准线性模型形式令 ,1,ttttYX则新的模型为: 。新模型为标准线性模型。12t ttYu从而可以进行估计。案例:工资率和失业率之间函数关系的菲利普斯曲线的拟合。二、对数线性模型1、模型的基本形式(以柯布道格拉斯函数为例) 32 tuQAKLe2、转换后的标准线性模型形式首先对原有
2、模型两边取自然对数得:223lnllnlntQAKLu令 123,lnYXXL则上述方程转化为:。123tu估计之后,1、常数项怎么得到?2、参数估计值的含义是什么?其经济含义是什么?注意:无量纲系数的作用是什么?三、幂函数模型1、模型的基本形式YX对应图形32、转换后的标准线性模型形式对原模型 两端取对数得:YXlnlnlnX令:,得标准线性回归模型:ln,ln,lnYcX 估计之后,第一,常数项怎么得到?第二,参数估计值的含义是什么?其经济含义是什么?四、指数函数模型1、模型的基本形式 XYe对应图形42、转换后的标准线性模型形式对原有模型 两端取对数得:XYe。lnl令 ,则有:,lnc
3、YX估计之后,第一,常数项怎么得到?五、对数函数模型51、模型的基本形式 lnYX对应图形:2、转换后的标准线性模型形式对于原有模型: lnYX令 则有:lnX6YX六、双曲线模型1、模型的基本形式 XY2、转换后的标准线性模型形式令 ,则有:l1,YX七、Logit 模型1、模型的基本形式 XeY对应图形:72、转换后的标准线性模型形式设 ln1YY则有:YX八、 多项式方程模型1、模型的基本形式 2301YbXbX其中 b10, b20, b30 和 b10, b30, b20, b30b10, b30, b20, b30 时,这个三元线性回归模型如经济学中的总成本曲线。另一种多项式方程的
4、表达形式是: 201YbX其中 b10, b20 和 b10, b20此曲线如经济学中的边际成本曲线、平均成本曲线。10b10, b20令 则上述模型转化为:2=X,。012YbbX第二节 特殊变量的使用影响经济现象的因素:可量化的因素和不可量化的因素。不可量化因素的处理方法:通过引入虚拟变量(哑变量)来进行处理。一、时期虚拟变量案例:某一地区的消费与收入之间的关系,Y 表示消费,X表示收入。数据如下:某地区消费与收入数据Y X D1 20 35 02 30 40 03 35 50 04 35 55 05 38 56 06 40 57 0117 70 40 1消费与收入的散点图如下:10203
5、04050607080323640448525660XY当估计区间为第 1 期至第 7 期时的输出结果为:Dependent Variable: YMethod: Least SquaresDate: 10/29/12 Time: 22:22Sample: 1 7Included observations: 7Variable Coefficient Std. Error t-Statistic Prob. C 35.02344 36.78102 0.952215 0.3847X 0.068576 0.761401 0.090066 0.9317R-squared 0.001620 Mean
6、dependent var 38.28571Adjusted R-squared -0.198056 S.D. dependent var 15.45654S.E. of regression 16.91808 Akaike info criterion 8.729599Sum squared resid 1431.107 Schwarz criterion 8.71414512Log likelihood -28.55360 F-statistic 0.008112Durbin-Watson stat 0.765576 Prob(F-statistic) 0.931731估计结果为:当估计区
7、间为第 1 期至第 6 期时的输出结果为:Dependent Variable: YMethod: Least SquaresDate: 10/29/12 Time: 22:26Sample: 1 6Included observations: 6Variable Coefficient Std. Error t-Statistic Prob. C -2.924248 6.459266 -0.452721 0.6742X 0.735650 0.130342 5.644008 0.0049R-squared 0.888439 Mean dependent var 33.00000Adjusted
8、 R-squared 0.860549 S.D. dependent var 7.211103S.E. of regression 2.692854 Akaike info criterion 5.080282Sum squared resid 29.00586 Schwarz criterion 5.010869Log likelihood -13.24085 F-statistic 31.85483Durbin-Watson stat 2.267577 Prob(F-statistic) 0.004853两个时期的结果比较:第一、系数显著性;第二,拟合优度;第三,回归模型的标准差。两个时期
9、的比较结论:第七期的数值可以看作异常值。通过引入虚拟变量对这种异常值进行处理。怎么处理呢?观察如下模型: 123YXDu运用上述数据估计,输出结果为:Dependent Variable: Y13Method: Least SquaresDate: 10/29/12 Time: 22:39Sample: 1 7Included observations: 7Variable Coefficient Std. Error t-Statistic Prob. C -2.924248 6.459266 -0.452721 0.6742X 0.735650 0.130342 5.644008 0.00
10、49D0 43.49824 3.128203 13.90519 0.0002R-squared 0.979765 Mean dependent var 38.28571Adjusted R-squared 0.969647 S.D. dependent var 15.45654S.E. of regression 2.692854 Akaike info criterion 5.116608Sum squared resid 29.00586 Schwarz criterion 5.093426Log likelihood -14.90813 F-statistic 96.83718Durbi
11、n-Watson stat 2.301516 Prob(F-statistic) 0.000409第 1 期至第 6 期时的输出结果与引入虚拟变量时第 1 期至第 7 期的输出结果基本一致:参数估计值、回归模型标准差等方面。这说明通过引入虚拟变量很好地解决了异常值的问题。二、关于虚拟变量事实上,在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素通常以虚拟变量的形式也包括在模型中。由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为 1 或 0。这种变量称作虚拟变量,用 D表
12、示。虚拟变量应用于模型中,对其回归系数的估计与检14验方法与定量变量相同。三、常数项变化时的虚拟变量1、一个例子讨论个人收入和受教育年限的关系时,根据观察对象受教育年限的不同进行分组,比如以受教育年限 16 年为分界点分为 2 组,一组是受教育年限为 16 年,另一组是受教育年限为不足 16 年。Y 表示收入,X 表示受教育年限。则可以设定:受教育年限为 16 年的模型1Yu受教育年限不足 16 年的模2X型观察上述两个模型,可以发现,两个模型只有常数项不同。这可以表示为,受教育年限的不同带来的收入差异由常数项的不同来反映。类似地,上述两个模型也可以表示经济发展不同时期的消费函数,一个表示经济
13、危机时期,一个表示经济没有发生危机的函数。此时,不同时期,消费的差异体现在两个模型的常数项的不同上。2、两个模型的统一现在引入虚拟变量 D,定义:1 (受教育年限为 16)D = 150 (受教育年限不足 16)设定如下模型: 212)YDXu(则此模型等价于如下两个模型:受教育年限为 16 年的模型1Xu受教育年限不足 16 年的模2Y型因此,可以设定模型: 12YDXu来进行估计。D = 1 或 0 表示某种特征的有无。反映在数学上是截距不同的两个函数。若 2显著不为零,说明截距不同;若 2为零,说明这种分类无显著性差异。实际上,以虚拟这种形式的虚拟变量反映的只是常数项的不同。其图示如下:
14、16020406020 40 60XY3、为什么要引入虚拟变量?第一,分别估计不能给出一个统一的估计结果;二,合并估计比单一区间估计得出的系数稳定性好(为什么?) 。4、其他形式的虚拟变量季节性虚拟变量、月份虚拟变量、性别虚拟变量等等。5、虚拟变量个数引入的原则 若定性变量含有 m 个类别,引入虚拟变量个数的原则是:第一,如果模型含有常数项,应引入 m-1 个虚拟变量,否则会导致多重共线性(为什么?) ,这在计量经济学上通常称作虚拟变量陷阱(dummy variable trap) ;在这里研究的就是常数项存在时的情况,因此,书本上说的是引入m-1 个虚拟变量。第二,如果模型不含有常数项,可以
15、引入17m 个虚拟变量。 关于定性变量中的哪个类别取 0,哪个类别取 1,是任意的,不影响检验结果。 定性变量中取值为 0 所对应的类别称作基础类别(base category) 。 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。案例:中国季节 GDP 数据的拟合数据:年 GDP t D1 D2 D31996:1 1.3156 1 1 0 01996:2 1.6600 2 0 1 01996:3 1.5919 3 0 0 11996:4 2.22096 4 0 0 01997:1 1.46856 5 1 0 01997:2 1.84948 6 0 1 019
16、97:3 1.7972 7 0 0 11997:4 2.3620 8 0 0 01998:1 1.58994 9 1 0 01998:2 1.88316 10 0 1 01998:3 1.97044 11 0 0 11998:4 2.51176 12 0 0 01999:1 1.6784 13 1 0 01999:2 1.9405 14 0 1 01999:3 2.0611 15 0 0 11999:4 2.5254 16 0 0 02000:1 1.8173 17 1 0 02000:2 2.1318 18 0 1 02000:3 2.2633 19 0 0 12000:4 2.7280 2
17、0 0 0 0181.21.41.61.82.02.2.42.62.82468101214161820GDP不采用虚拟变量的输出结果:Dependent Variable: GDPMethod: Least SquaresDate: 10/30/12 Time: 09:51Sample: 1 20Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C 1.542733 0.140446 10.98452 0.0000T 0.040534 0.011724 3.457296 0.0028R-squa
18、red 0.399056 Mean dependent var 1.968340Adjusted R-squared 0.365671 S.D. dependent var 0.379609S.E. of regression 0.302339 Akaike info criterion 0.540104Sum squared resid 1.645360 Schwarz criterion 0.639677Log likelihood -3.401042 F-statistic 11.95289Durbin-Watson stat 2.600147 Prob(F-statistic) 0.0
19、0281119定义1 (1 季度) 1 (2 季度) 1 (3 季度) D1 = D2 = D3 =0 (2, 3,4 季度) 0 (1, 3, 4 季度) 0 (1, 2, 4 季度)则含有虚拟变量的输出结果为:Dependent Variable: GDPMethod: Least SquaresDate: 10/30/12 Time: 09:54Sample: 1 20Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C 2.092221 0.032575 64.22740 0.0000T
20、 0.031450 0.001975 15.92287 0.0000D1 -0.801313 0.032153 -24.92164 0.0000D2 -0.513735 0.031849 -16.13059 0.0000D3 -0.501386 0.031664 -15.83444 0.0000R-squared 0.986321 Mean dependent var 1.968340Adjusted R-squared 0.982673 S.D. dependent var 0.379609S.E. of regression 0.049968 Akaike info criterion -
21、2.942546Sum squared resid 0.037452 Schwarz criterion -2.693613Log likelihood 34.42546 F-statistic 270.3959Durbin-Watson stat 1.962063 Prob(F-statistic) 0.000000三、系数变化时的虚拟变量考虑如下两个模型:受教育年限为 16 年的模型1YXu受教育年限不足 16 年的模2型这两个模型的不同只是解释变量系数的差异。现在引入虚拟变量 D,定义:201 (受教育年限为 16)D = 0 (受教育年限不足 16)则原有上面两个模型可以写为模型:,YXDu通过检验 是否为零,可判断模型斜率是否发生变化。此等价于:,YDXu表明了斜率发生了变化。