1、1实验(三)多变量线性模型及面板数据初步处理【实验目的】掌握多变量线性回归模型的参数估计及相关内容;面板数据初步处理【实验内容】建立多变量线性回归模型,参数估计,残差图等。建立 Pool 并处理数据。【实验步骤】实验步骤一:如何在数据表删除某一列数据,或在两列数据中插入一列数据,在数据表删除某一列数据的操作:双击数据组标示打开数据组表编辑一组数据点击鼠标右键拉出一菜单点击 Remove Series。在两列数据中插入一列数据:双击数据组标示打开数据组表编辑一组数据点击鼠标右键拉出一菜单点击 Insert Series。实验步骤二:建立面板数据库并处理数据。向 EViews6.0 中输入截面数据
2、名称的时候,应先建立一个合并数据(Pool)对象。选择 EViews6.0 主菜单 ObjectNew ObjectPool在 Pool 中输入_BJ_TJ_HB_LN_SHH_JS_ZHJ_FJ_SHD_GD_HN北京 BJ天津 TJ河北 HB山西 SHX内蒙 IMG辽宁 LN吉林 JL黑龙江 HLJ上海 SHH江苏 JS浙江 ZHJ安徽 AH福建 FJ2江西 JX山东 SHD河南 HEN湖北 HUB湖南 HUN广东 GD广西 GX海南 HN重庆 CHQ四川 SCH贵州 GZH云南 YN西藏 XZH陕西 SXI甘肃 GS青海 QH宁夏 NX新疆 XJ_BJ_TJ_HB_SHX_IMG_LN_
3、JL_HLJ_SHH_JS_ZHJ_AH_FJ_JX_SHD_HEN_HUB_HUN_GD_GX_HN_CHQ_SCH_GZH_YN3_XZH_SXI_GS_QH_NX_XJ_BJ_TJ_HB_SHX_IMG_LN_JL_HLJ_SHH_JS_ZHJ_AH_FJ_JX_SHD_HEN_HUB_HUN_GD_GX_HN_CHQ_SCH_GZH_YN_SXI_GS_QH_NX_XJGDP国内生产总值GSH财政收入GZH财政支出4RJGDP人均 GDPRJGSH人均财政收入RJGZH人均财政支出东部地区东部地区包括:北京市、天津市、河北省、辽宁省、上海市、江苏省、浙江省、福建省、山东省、广东省、海南
4、省北京市 BJ天津市 TJ河北省 HB辽宁省 LN上海市 SHH江苏省 JS浙江省 ZHJ福建省 FJ山东省 SHD广东省 GD海南省 HN_BJ_TJ_HB_LN_SHH_JS_ZHJ_FJ_SHD_GD_HN中部地区山西省 SHX吉林省 JL黑龙江省 HLJ安徽省 AH江西省 JX河南省 HEN湖北省 HUB5湖南省 HUN_SHX_JL_HLJ_AH_JX_HEN_HUB_HUN中部省份包括:山西省、吉林省、黑龙江省、安徽省、江西省、河南省、湖北省和湖南省。西部地区重庆市 CHQ四川省 SCH贵州省 GZH云南省 YN西藏自治区 XZH陕西省 SXI甘肃省 GS青海省 QH宁夏回族自治区
5、 NX新疆维吾尔族自治区 XJ广西壮族自治区 GX内蒙古 IMG_CHQ_SCH_GZH_YN_XZH_SXI_GS_QH_NX_XJ_GX_IMG6西部地区包括:重庆市、四川省、贵州省、云南省、西藏自治区、陕西省、甘肃省、青海省、宁夏、新疆、广西和内蒙古。不含西藏自治区,主要原因是西藏自治区经济总量和财政收入比较小,两者的相关性较弱。据国家统计局定义:东部地区北京、天津、河北、辽宁、上海、江苏、浙江、福建、广东、广西、山东;中部地区山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南;西部地区贵州、云南、陕西、甘肃、青海、新疆。按照我国最新的划分标准,东部地区包括北京、天津、河北、辽宁、
6、上海、江苏、浙江、福建、山东、广东、海南 11 个省、直辖市。中部地区包括山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南 8 个省。西部地区包括重庆、四川、贵州、云南、西藏、陕西、甘肃、宁夏、青海、新疆、内蒙古、广西 12 个省、自治区。在 Pool 窗口点击 name,保存。在 Pool 窗口点击 sheet,打开一个窗口,输入 GDP?,RENKOU?,GSH? ,GZH? 。就得到一个东部地区 GDP,RENKOU ,GSH ,GZH 的 Poolsheet(面板数据表) 。在 Pool 窗口点击 define,回到 Pool 的标示窗口;点击 Pool 的标示窗口 sheet,打开一
7、个窗口,输入 GDP?,RENKOU?,GSH?,GZH?。得到 GDP,RENKOU,GSH,GZH 的Poolsheet(面板数据表) 。Pool 序列的序列名使用的是基本名和“?”占位符。例如,GDP?代表:GDP_BJ北京 GDPGDP_TJ天津 GDPGDP_HB河北 GDPGDP_LN辽宁 GDPGDP_SHH上海 GDPGDP_JS江苏 GDPGDP_ZHJ浙江 GDPGDP_FJ福建 GDPGDP_SHD山东 GDPGDP_GD广东 GDPGDP_HB河北 GDP还可以通过 Pool 窗口中的 PoolGenerate,通过公式可以生成以面板数据为基础的新数据。例如,RJGDP
8、?=GDP?/RENKOU?7RJGDP_BJ北京人均 GDPRJGDP_TJ天津人均 GDPRJGDP_HB河北人均 GDPRJGDP_LN辽宁人均 GDPRJGDP_SHH上海人均 GDPRJGDP_JS江苏人均 GDPGDP_ZHJ浙江人均 GDPRJGDP_FJ福建人均 GDPRJGDP_SHD山东人均 GDPRJGDP_GD广东人均 GDPRJGDP_HB河北人均 GDP利用合并数据库(Pool)进行参数估计点击合并数据库(Pool)工具栏中的 Estimate,出现对话框。 (如果要把计算机画面全屏复制下来,操作 Shift+Print,单击鼠标左键粘贴)打开 Pooled Est
9、imation 窗口,见下图。8面板数据的处理1计算各个个体 GDP 占全体 GDP 的比重步骤(1)构造 sum在普通 group 里构造 sum,即构造一序列 sum,sum 全部变为 0,如果为 NA 的话,则处于不能计算的状态,要注意把 sum 下面的 NA 全部变为 0。(2)打开面板数据 Pool在 PoolGenerate 输入:sum=sum+GDP?(把各个个体的横截面 GDP 加总)(3)把 sum 放入 Pool。即打开 Pool,点击 define,显示编辑窗口,在这个窗口点击sheet,输入 sum,点击 OK。(4)计算比重,打开面板数据 Pool,在 PoolGe
10、nerate 输入BZHGDP?=GDP?/sum2计算任意两点之间的平均增长速度比方说,计算 1978-2008 年的年均增长速度打开面板数据 Pool,在 PoolGenerate 输入:suduGDP?=(GDP?/GDP?(-30)(1/30)-1点击 OK 键实验步骤三:以三变量回归模型为例。操作:从Views 主窗口,点击 Quick点击 Estimate Equation 功能。弹出一个对话框。在 Equation Specification 选择框中输入 y c x1 x2 或者 y=c(1)c (2)*x1+c(3)*x2。在 Estimate Setting 选择框中自动给
11、出缺省选择 LS 估计法和样本区间。点击 OK 键,即可得到回归结果。然后 namesave。9多于三个变量的回归模型的操作与三变量回归模型的操作类似。1980-1995 年美国抵押贷款、个人收入和抵押贷款费用数据表年份 抵押贷款(Y)(亿美元)个人收入(X 1)(亿美元)抵押贷款费用(X 2)(亿美元)1980 1365.5 2285.7 12.661981 1465.5 2560.4 14.71982 1539.3 2718.7 15.141983 1728.2 2891.7 12.571984 1958.7 3205.5 12.381985 2228.3 3439.6 11.551986
12、 2539.9 3647.5 10.171987 2897.6 3877.3 9.311988 3197.3 4172.8 9.191989 3501.7 4489.3 10.131990 3723.4 4791.6 10.051991 3880.9 4968.5 9.321992 4011.1 5264.2 8.241993 4185.7 5480.3 7.21994 4389.7 5753.1 7.491995 4622 6115.1 7.89资料来源: 美达莫达尔E古亚拉提著, 经济计量学精要 ,机械工业出版社,2000 年 7 月第 1版,第 132 页表 7-1。一、阐述理论由经济理
13、论和对实际情况的分析可知,抵押贷款 Y 受个人收入 X1 和抵押贷款费用X2 变化的影响。当个人收入增加时,抵押贷款也随着增加,它们之间具有正向的同步变动趋势。而抵押贷款费用对抵押贷款总额的影响总体上具有反向的变动趋势。除了这两个因素,抵押贷款还受到其他一些变量的影响及随机因素的影响,将其他变量及随机因素的影响均归并到随机变量 中,由表二数据,建立美国年抵押贷款 Y 和个人收入 X1,抵押贷款费用 X2 之间的三变量线性回归模型。二、设定模型设三变量总体线性回归模型:Y i=0+1X1i+2X2i +ui 10其中,Y i 表示抵押贷款数额X1i 表示个人收入X2i 表示抵押贷款费用0、 1、
14、 2 表示待定系数ui 表示随机误差项现给定样本观测值(Y i,X 1i,X 2i) ,i=1,2,,16,16 为样本容量。建立样本回归模型: Y i= + X1i+ X2i +ei012其中, 、 、 分别为 0、 1、 2 的估计值, ei 为残差项。012样本回归方程: i = + X1i+ X2i其中, i 表示样本观测值 Yi 的估计值。三、显示估计结果利用 Eviews 的最小二乘法程序,输出的结果如下:Dependent Variable: YMethod: Least SquaresDate: 05/18/05 Time: 11:34Sample: 1980 1995Incl
15、uded observations: 16Variable Coefficient Std. Error t-Statistic Prob. C 157.0460 576.9882 0.272182 0.7898X2 0.825737 0.063401 13.02405 0.0000X3 -56.53270 31.39038 -1.800956 0.0949R-squared 0.989453 Mean dependent var 2952.175Adjusted R-squared 0.987830 S.D. dependent var 1132.051S.E. of regression
16、124.8840 Akaike info criterion 12.66001Sum squared resid 202748.2 Schwarz criterion 12.80487Log likelihood -98.28007 F-statistic 609.7820Durbin-Watson stat 0.402460 Prob(F-statistic) 0.00000011四、 说明回归系数的含义= 0.83,符号为正,表示在其他条件不变的情况下,美国全年的人均抵押贷款随1着个人收入的增加而增加,即个人年收入每增加 1 亿美元,美国全年的人均抵押贷款约增加 0.83 亿美元。因此,该
17、回归系数的符号、大小都与经济理论和人们的期望值相符合。= -56.53,符号为负,表示在其他条件不变的情况下,美国全年的人均抵押贷2款随着抵押贷款费用的增加而减少。抵押贷款费用每增加 1 亿美元,年人均贷款约减少56.53 亿美元。虽然美国在 19801995 年间,抵押贷款费用经历了由高到底,又由低到高,再有高到底的剧烈变化,但平均而言,费用呈下降趋势。所以,该回归系数的符号和大小也与经济理论和人们的期望值相一致。五、 模型检验(一) 可决系数检验R2=1-ESS/TSS=0.9895说明总离差平方和的 98.95%被样本回归直线解释,仅有 1.05%未被解释,因此,样本回归直线对样本点的拟
18、合优度是很高的。(二) F 检验提出检验的原假设 H 0: 1 =2 =0备择假设 H 1: 至少有一个 i 不等于零(i=1,2)给定显著性水平 =0.05,在分子自由度为 2,分母自由度为 13 下,查 F 分布表,得F0.05(2,13)=3.81因为 F=609.78 3.81,备择假设为真,接受 H1,说明总体回归方程是显著的,即美国的年抵押贷款与每年的个人收入水平和抵押贷款费用之间存在显著的线性关系。(三) 回归系数显著性检验(t 检验)1检验系数 1提出检验的原假设为 H0: 1 = 0备择假设为 H1: 1 0给定显著性水平 =0.05,在自由度 v=16-2-1=13 下,查
19、 t 分布表得 t0.025(13)=2.16 因 1 的 t-Statistic=13.02405,t 1=13.022.16,所以否定 H0,接受 H1, 1 显著不等于零,即可以认为美国的年个人收入对年抵押贷款有显著的影响。2检验系数 2为此建立假设 H0: 2 = 0备择假设为 H1: 2 0从 t 分布表可知,在 5%的显著性水平下,单边 t 临界值为 1.77而回归结果中, 2 的 t 值的绝对值为 1.8,即|t 2| t 0.05(13)12所以,能够拒绝零假设,接受备择假设 H1,即可以认为美国的抵押贷款费用对年抵押贷款的支出有显著的影响。六回归分析表达式i = 157.04
20、60 + 0.825737X1i - 56.53270X2i t = (0.272182) (13.02405) (-1.800956) SE= (576.9882) (0.063401) (31.39038)R2 = 0.989453 = 0.987830 F = 609.7820 n = 16 DW = 0.4024602R七 回归预测假定 1996 年个人收入为 6534.2 亿美元,抵押费用为 8.12 亿美元,预测抵押贷款额将 X1=6534.2 ,X 2=8.12 代入估计的回归方程的点估计值1996=157.0460+0.825737*6534.2-56.53270*8.12=5093.5311815093.53