1、中 南 民 族 大 学毕 业 论 文 (设 计 )学 院 : 数 学 与 统 计 学 学 院 专 业 : 统 计 学 年 级 : 2011 级 题 目 : 财 政 收 入 预 测 模 型 学 生 姓 名 : 刘 绍 轩 学 号 : 11151027 指 导 教 师 姓 名 : 汪 政 红 职 称 : 讲 师 2014 年 4 月 15 日中南民族大学本科毕业论文(设计)原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。作者签名:
2、 年 月 日目 录摘要 .1背景 .21 国家财政收入预测模型 .211 多元线性回归分析 .21.1.1 多元回归模型 .21.1.2 回归系数的估计 .31.1.3 显著性检验 .31.1.4 多元线性回归模型的建立与求解 .41.1.5 多重共线性 .512 主成分回归分析 .71.2.1 主成分分析 .71.2.2 主成分回归 .713 模型评估 .82 财政收入增长分析 .821 财政收入高速增长原因 .93 政策建议 .10参考文献 .12附录 .130财 政 收 入 预 测 模 型摘要:1994 年分税制改革以来,我国财政收入进入高速增长阶段,出现了近十多年来财政收入增长速度大幅
3、高于经济增长速度的现象。本文将研究国民生产总值、就业人口、固定资产投资、储蓄存款与这四个因素对财政收入的影响,建立这四个因素与财政收入的多元线性回归模型,对模型进行优化。另外,本文分析财政收入高速增长带来的影响,同时对财政收入的高速增长的原因作出解释,最后给出政策建议。关键词:多元线性回归模型;财政收入;回归分析;主成分回归The Forecast Model Of Revenue1背景随着我国社会主义市场经济体制的建立与完善,财政工作面临着重大的机遇与挑战:一方面作为了宏观经济调控的重要手段之一的财政职能已得到显著增强;另一方面财政工作不能迅速跟上当前的经济发展,急需增强预见性。在新的经济形
4、势下,对财政收入的预测变得越来越重要,财政收入预测问题已经成为经济领域的一个迫切需要研究的重大课题,对它的建模也是增强政府宏观调控能力的内在要求。为了更好地对我国的经济状况进行宏观调控,更有效地进行经济建设,就必须对我国的财政收入情况有更深的了解。1 国家财政收入预测模型一个国家或地区的财政收入受到众多因素的影响,如经济体制、财税政策、征收力度等,但归根到底取决于该地区的经济发展水平。因此,对财政收入的预测应建立在对该地区宏观经济的分析预测基础上,预测模型应该反映财政收入与经济增长的相互关系。本文将建立财政收入的对数线性回归模型,并结合 1995-2013 年的统计数据对该模型进行完善和检验。
5、数据摘自中国统计局网站,中国统计年鉴(2014)。共选取取 1995-2013 年 19 组数据进行分析,摘取“财政收入”、“国民生产总值”、“就业人口”、“固定资产投资”、“储蓄存款”五个项目指标。 411 多元线性回归分析在许多实际问题中影响因变量 y 的自变量往往不止一个,这种一个因变量同多个自变量的回归问题称为多元回归,当因变量与各自变量之间为线性关系时,称为多元线性回归。多元线性回归的原理同一元线性回归基本相同。1.1.1 多元回归模型设变量 与变量 间有线性关系YPX,.21,10PX)1.(其中 和 是未知参数, ,称此模型为多元线性回归模型。),0(2NP,.1022p设 是
6、的 次独立观测值,则多元线性niyxipi ,.),.(21),.(21YPn模型 可表示为).ixyipii ,.,10 )2.1(其中 ,且独立同分布。),(2Ni为书写方便,常采用矩阵形式,令2.,1, 21221121021 nnpnppn xxXy 则多元线性模型 可表示为).(,XY)3.(其中 是由响应变量构成的 维向量, 是 阶设计矩阵, 是 维向Yn1pn1p量, 是 维向量,并且满足n nIVarE2)(,0)(1.1.2 回归系数的估计类似于一元线性回归,求参数 的估计值 ,就是求最小二乘函数),()()XyQT)4.1(达到最小的 值。可以证明 的最小二乘估计.)(1y
7、XT)5(从而可得到经验回归方程为.10PY )6.1(1.1.3 显著性检验经由于在多元线性回归中无法用图形帮助判断 是否随 作线性变化,)(YEPX,.21因而显著性检验就显得尤为重要。检验有两种,一种是回归系数的显著性检验,粗略地说,就是检验某个变量 的系数是否为 另外一个检验是回归方程的显著性检验,简单地说,jX.0就是检验该组数据是否适用于线性方程作回归。回归系数的显著性检验 .,10,:,:10 pjHjjjj 当 成立时,统计量0jH3.,10),( pjpntcTjj 其中 是 的对角线上的第 个元素。对于给定的显著性水平 ,检验的拒jc1)(XCj 绝域为 .,10),(|2
8、/ pjpntTj 回归方程的显著性检验不全为PpHH,:,0: 1010 0当 成立时,统计量0 ),1,()1/(pnFPNSERF其中 ,)(,)(1212niinii ySy.,101 ipiini xy 通常称 为回归平方和,称 为残差平方和。SRSE对于给定的显著性水平 ,检验的拒绝域为).1,(pnF相关系数的平方定义为 STR2用它来衡量 与 之间相关的密切程度,其中 为总体离差平方和,即Y.,21PXS并且满足.)(1niiySTEST1.1.4 多元线性回归模型的建立与求解一个地区或国家的财政收入状况受到众多因素的影响,比如经济体制、税收政策、征收力度以及纳税人的意识等。但
9、归根结底仍取决于该地区或国家的经济发展水平,因此!财政收入预测模型应该建立在对该地区或国家宏观经济的分析预测的基础上,反映财政收入与经济增长的相互作用关系。基于上述经济理论本文!选取财政收入、国民生产总值、就业人口数、固定资产投资和城乡居民储蓄存款五大相关指标。财政收入作为某一地区或国家国民经济的综合反映,与众多因素密切相关,因此,本文选取多元线性回归作为财政收入的预测模型。4记财政收入为 ,国民生产总值为 ,就业人口为 ,固定资产投资为 ,储蓄存y1x2x3x款为 ,假设财政收入的预测模型为多元线性回归模型4x .43210 xxy在 软件中输入数据,调用 函数对模型求解,并用 显示计算结R
10、)(lm)(sumary果。得到的结果如下: 16-2.e tvaluEro Std Estima :Cofi 2389. 605. 19.4- 67.- 2.- MxQeinQMin:esdual revn) =dat x,+ 32 xy= l(for:C由此得到多元线性回归方程为: 4321 .5.0.8.2 xxxy 检验结果中 ,说明模型的拟合程度很高,然而,回归方程的系数检验却并9.0R不是很理想,回归方程的系数 与 均没有通过检验。产生这种结果的因素有很多,最常2x4见的就是变量之间存在着多重共线性,下面将分析变量之间的相关性。1.1.5 多重共线性下当自变量之间彼此相关时,回归模
11、型可能会让人糊涂,估计的效应会有哟模型中的其他自变量而改变数值,甚至是符号。故在分析时,了解自变量间的关系的影响是很重要的。这一复杂问题常称为共线性或多重共线性。对于自变量 ,如果存在常数 ,使得px,.21 pc,.10021xc5近似成立,则表示这 p 个变量存在多重共线性。将 是自变量 经)()2(1,.pxpx,.21过中心化和标准化得到的向量,记为 ,则度量多重共线性严重程度,.()()(xX的一个重要指标是方矩 的条件数,即T )(|)(|)( minax1XTTT其中 表示了方矩 的最大、最小特征值。),(minmaxXTTX条件数刻画了 的特征值差异的大小。从实际应用的经验角度
12、,一般若 ,10则认为多重共线性的程度很小;若 ,则认为存在中等程度或者较强的多重10共线性;若 ,则认为存在严重的多重共线性。10本文运用 R 语言计算得到本文中变量 构成的矩阵的条件数4321,x,认为变量之间存在着严重的多重共线性。359.87为解决多重共线性,下面本文将用逐步回归的方法再对模型进行拟合。用 软件中的函数 作逐步回归得到如下结果:)(step 23.041246789643781 1955.60298.7: 19.30612489621 5237544.78899.2810660194.27:34433423xnoe AICRSqofSumDfxyAICStepxnox
13、AICRSqofSumDfxyAICSar从程序的输出结果可以看到,用全部变量作回归方程时, 的值为 ,如果AIC.7去掉变量 ,得到的回归方程 值为 如果再去掉变量 ,得到的回归方程的2AIC.4x值为 ,达到了最小。因此,我们去掉变量 和 ,用剩下的另外两个变量进AIC56.7 2行回归,通过 R 语言我们可得到逐步回归的最终结果如下:6162.,16273: 980:,98.0: *597.4.56.0.12.0.125)( |)Pr(.:31 evalupDFandostaicF sqrdRAjustesqureRMulpexIntrc tvaluetEroStdstimaeCoefi
14、由计算结果可以看出,回归系数和回归方程的检验都是显著的,因此,逐步回归法得到的回归方程为 3109786.63.025xxy12 主成分回归分析上文已经用逐步回归分析的方法得出预测模型了,从残差图和 Rsquare(多元全相关系数)来看,拟合效果非常好,但是仅仅建立财政收入与国民生产总值和固定资产投资的二元线性回归方程,再用方程进行预测,这样理论依据是比较薄弱的,对于预测工作是非常不负责任的,接下来本文考虑引入另外两个变量-就业人口和储蓄存款来进行预测,更加重视经济发展对财政收入的重要程度,目的是进一步验证结果的精确度。然而在上文中我们也发现了当所有变量进行回归的时候效果并不是很理想,变量之间
15、存在严重多重共线性,下面我们用主成分回归的方法来解决多重共线性。1.2.1 主成分分析主成分分析是将多指标化为少数几个综合指标的一种统计分析方法,主成分分析通过降维技术把多个变量化为少数几个主成分,这些主成分能过反映原始数据的绝大部分信息,表示为原始变量的线性组合。本文运用 R 软件进行主成分分析。在 R 软件中,用 princomp()作主成分分析,本文选择相关矩阵作主成分分析,因此,选择的参数是 cor=TURE。最后用 summary()列出主成分分析的结果。主成分分析的结果如下: 807.214.98.0514. 59376.4.21.: 0.19725.09865.0357. 2794813421var 36.4.4.1. .:tan4321xCompCompLoadingcultiencfprtis CompopCopompetsfceimor在 R 软件输出的结果可知,前两个主成分的累积贡献率已经达到了 ,因此另外%8.9