1、.城镇居民消费支出的多元非线性回归模型研究摘要:以1996-2010年数据为依据,建立中国城镇居民消费支出的多元非线性回归模型。结果表明:影响居民消费支出的主要因素有收入、居住面积、商品零售价格。消费者支出随着收入的提高而提高,随着人均居住面积的增加而先增后减,随着商品零售价格的增加而增加。而且多元非线性回归模型比线性回归模型更能准确描述客观实际结果。关键词:城镇居民;消费;多元;非线性回归模型1引言消费是宏观经济必不可少的环节,完善的消费模型可以为宏观调控提供重要依据。根据不同理论可以建立不同的消费函数模型。孙敬水,马骊(2009)利用空间计量经济的空间自回归模型,侯青霞,张德生(2008)
2、等用非参数回归模型,对我国城镇居民消费支出与可支配收入之间的关系进行实证研究。朱建平,徐俊伟,乐燕波(2008)以Bernstein基函数构造一般函数数据形式的理论及方法,构建中国城镇居民消费与收入的函数关系,剖析中国各省消费函数变动状况以及发展速率等。杭斌,申春兰(2004)采用状态空间模型和变协整分析了经济转型期间中国城镇居民消费与收入得长期均衡关系。他们的研究主要是消费支出与收入的关系的单变量函数关系,由于忽略了对消费支出有显著影响的变量,那么所建立的方程必与实际有较大的偏离。本文综合影响消费的主要因素,如收入水平、消费倾向、居住面积、价格、恩格尔系数等,对消费支出的多元非线性回归模型进
3、行研究,找出能准确描述客观实际结果的最优模型。2模型的建立与求解2.1变量选择与数据来源按照经济学理论,决定居民消费支出变动的主要因素有收入水平、消费环境等。所以我们取被解释量 Y 为城镇居民年人均消费性支出,解释变量为城镇居民的年人均可支配收入 X1、人均住宅建筑面积 X3、商品零售价格定基指数(1978=100)X4、消费价格定基指数(1978=100)X5。取 1996-2010 年的数据(数据来源:中华人民共和国国家统计局网公布的 1996-2010 年中国统计年鉴)列于下表。.年份 Y(元) X1(元) X2() X3(元) X4(元)1996 3919.5 4838.9 17.0
4、377.8 467.41997 4185.6 5160.3 17.8 380.8 481.91998 4331.6 5425.1 18.7 370.9 479.01999 4615.9 5854.0 19.4 359.8 472.82000 4998.0 6280.0 20.3 354.4 476.62001 5309.0 6859.6 20.8 351.6 479.92002 6029.9 7702.8 22.8 347.0 475.12003 6510.9 8472.2 23.7 346.7 479.42004 7182.1 9421.6 25.0 356.4 495.22005 7942
5、.9 10493.0 26.1 359.3 503.12006 8696.6 11759.5 27.1 362.9 510.62007 9997.5 13785.8 28.0 376.7 533.62008 11242.9 15780.8 30.6 398.9 563.52009 12264.6 17174.7 31.3 394.1 558.42010 13471.5 19109.4 31.6 406.3 576.32.2 模型建立2.2.1 作散点图利用 SPSS 软件分别作 Y 关于各解释变量 Xi(i=1,2,3,4,5,6,)的散点图。.2.2.2 曲线拟合2.2.2.1 Y 与 X1
6、 的曲线拟合由第一个散点图可以看出 Y 与 X1 成线性关系, 10bXY作 Y 与 X1 的曲线拟合,R 方为 0.999,说明回归方程拟合的程度较好;统计量 F=19455.686,相伴概率值 p0.001,说明 Y 与 X1 之间确有线性回归关系。,模型汇总和参数估计值因变量:Y模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1线性 .999 19455.686 1 13 .000 778.108 .669自变量为 X1。.2.2.2.2 Y 与 X3 的曲线拟合由第三个散点图知 Y 与 X3 为非线性关系,至于属于哪一种非线性关系,还需做进一步判断。作 Y 与
7、X3 的曲线拟合,选择所有非线性模型,得到结果如下图:选择 R 方最大的几个(复合,增长,指数,Logistic),再次模拟,观察观察值和预测值的关系。模型汇总和参数估计值因变量:Y模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1复合 .995 2538.8571 13 .000 943.286 1.086模型汇总和参数估计值因变量:Y模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数对数 .922 153.042 1 13 .000倒数 .874 90.549 1 13 .000二次 .991 699.333 2 12 .000三次 .992 71
8、8.378 2 12 .000复合 .995 2538.857 1 13 .000 943.286幂 .983 759.397 1 13 .000 14.486S .958 294.797 1 13 .000 10.753增长 .995 2538.857 1 13 .000 6.849指数 .995 2538.857 1 13 .000 943.286Logistic .995 2538.857 1 13 .000 .001自变量为 X3。.增长 .995 2538.8571 13 .000 6.849 .082指数 .995 2538.8571 13 .000 943.286 .082Log
9、istic.995 2538.8571 13 .000 .001 .921自变量为 X3。由图可知,四种曲线的拟合优度几乎一致。这里取指数函数作为曲线模型。则有 0.82X3ebY2.2.2.3 Y 与 X4 的曲线拟合由第四个散点图知 Y 与 X4 为非线性关系,至于属于哪一种非线性关系,还需做进一步判断。因为方法与 Y 与 X3 的拟合过程一致,这里只给出结果,如下图:模型汇总和参数估计值因变量:Y模型汇总方程 R 方 F df1 df2 Sig.二次 .594 8.762 2 12 .005三次 .595 8.831 2 12 .004.模型汇总和参数估计值因变量:Y方程模型汇总R 方
10、F df1 df2 Sig.二次 .594 8.762 2 12 .005三次 .595 8.831 2 12 .004自变量为 X4。模型汇总和参数估计值因变量:Y参数估计值方程 常数 b1 b2 b3二次 526683.089 -2882.486 3.988三次 168191.356 .000 -3.726 .007自变量为 X4。由于 R 方的不同,选择三次函数模型拟合优度更好一些。则 4a4a4a 3210 XXY2.2.2.4 Y 与 X5 的曲线拟合由第四个散点图知 Y 与 X5 为非线性关系,至于属于哪一种非线性关系,还需做进一步判断。方法与 X3、X4 相同。得第二步结果为:.
11、模型汇总和参数估计值因变量:Y模型汇总方程 R 方 F df1 df2 Sig.倒数 .946 226.475 1 13 .000二次 .946 105.857 2 12 .000三次 .946 105.857 2 12 .000自变量为 X5。模型汇总和参数估计值因变量:Y参数估计值方程 常数 b1 b2 b3倒数 51540.856 -2.213E7二次 -102906.615 348.535 -.256三次 -102906.615 348.535 -.256 .000自变量为 X5。.最后采用二次函数作为模型,则有 5aa210XY2.3 模型求解与优化由以上分析,建立 Y 与 Xi(i
12、=1,2,3,4,5,6)的初始模型:(1)5a4aXaeX1aY 2513410.82X30 把模型(1)中的 、 、 、 分别看做是一个变量,分别记.232为 X31、X42、X43、X52 则模型(1)实际上就是一个多元线性模型。利用 SPSS软件得到以下结果:输入移去的变量模型 输入的变量 移去的变量 方法1 X52, X4, X31, X1, X43a. 输入a. 已达到容差 = .000 限制。模型汇总模型 R R 方 调整 R 方 标准 估计的误差1 1.000a 1.000 1.000 50.68970a. 预测变量: (常量), X52, X4, X31, X1, X43。A
13、novab模型 平方和 df 均方 F Sig.回归 1.365E8 5 2.729E7 10621.642 .000a残差 23125.007 9 2569.4451总计 1.365E8 14a. 预测变量: (常量), X52, X4, X31, X1, X43。b. 因变量: Y系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) -2349.535 4672.483 -.503 .6271X1 .660 .035 .987 18.991 .000.X31 70.385 45.250 .072 1.555 .154X4 15.846 18.842 .097 .
14、841 .422X43 -4.210E-5 .000 -.108 -.921 .381X52 -.004 .003 -.050 -1.204 .259a. 因变量: Y已排除的变量 b共线性统计量模型 Beta In t Sig. 偏相关 容差X42 -2.914a -.176 .865 -.062 7.664E-81X5 1.004a 2.432 .041 .652 7.140E-5a. 模型中的预测变量: (常量), X52, X4, X31, X1, X43。b. 因变量: Y由结果知 R=1.000,回归方程拟合程度极好;F=10621.642,p0.001,说明 Y 与 X1、X31
15、、X4、X42、X52 之间确有线性回归关系。其中 X42、X5 被剔除。得到结果为: 15.846X70.385e.6X1-2349.5.02X30.5X-4.21E-3(2)3 结论分析由上述模型可知,影响居民消费支出的主要因素有收入、居住面积、商品零售价格。消费者支出随着收入的提高而提高,随着人均居住面积的增加而先增后减,随着商品零售价格的增加而增加。但模型中也出现了一个问题,即 Y与 X5 的关系。从理论上讲,消费价格的提高,消费支出水平也会提高,但在模型中却出现了负向相关。这也许与模型的建立不准确有关,需要进一步验证,并对模型进行改进。或者我们可以从另一个角度来解释这种现象,即人们需求的价格弹性是很高的,消费品价格的提高,使人们减少了消费的数量,从而使消费支出减少。不过这也是一种猜测而已,需要进一步的论证。