1、课 程 设 计 报 告课程名称 统计预测与决策 专 业 班 级 学 号 姓 名 指导教师 2012 年 5 月 18 日2课 程 设 计 任 务 书课程名称 统计预测与决策 课 题 全国职工平均工资 的分析与预测 专业班级 学生姓名 学 号 指导老师 任务书下达日期 2012 年 5 月 7 日任务完成日期 2012 年 5 月 18 日3目 录 前 言 2数 据 来 源 21、描 述 性 分 析 22、 组 合 预 测 31. 组 合 预 测 的 基 本 思 想 32. 单 项 预 测 模 型 41) 非 线 性 回 归 预 测 法 42) 指 数 曲 线 趋 势 外 推 法 93) 二 次
2、 曲 线 指 数 平 滑 法 124) 灰 色 预 测 法 163. 组 合 预 测 模 型 204. 组合预测的有效性分析233、 总 结 24参 考 文 献 25附 件 26评 分 标 准 284前言就业与工资是我国面向未来的三大问题之一。它体现了我国经济发展状况与人民生活水平的联系,而平均工资是反映工资总体情况的指标,它是按工资总额除以单位的年内平均职工人数得出的。根据国家现行规定,工资总额统计的是本单位在一定时期内直接支付给本单位全部职工的劳动报酬总额,包括计时工资、计件工资、奖金、津贴和补贴、加班加点工资、特殊情况下支付的工资,不论是否计入成本,不论是否以货币形式还是以实物形式支付,
3、均包括在内。也就是说,平均工资中包含了很大程度上的扣除额度,这不同于职工的实际可支配收入。 另一方面,平均工资是一项“平均数” ,社会上存在一个对其争议的焦点是它不区分收入差距,许多人质疑这种“简单的平均统计”到底有什么实际意义。任何一个统计指标的存在(并且是长期存在)都有它的作用和意义,平均数是反映总体水平的基本指标之一。一般来讲,一项统计调查在反映总体情况时,都要用到平均数。据了解,我国制定的一系列政策,如:社会保险金征收、基本养老金和退休费发放、最低工资标准、人身损害司法赔偿等,都与平均工资数据相关。故,对平均工资的统计和研究还是很有必要的。预测就是“鉴往知来” ,即依据过去和现在的大量
4、资料,运用科学的判断方法和数量方法,对事物未来的发展趋势事先做出有效的判断。平均工资预测就是运用科学的理论方法对未来人民生活水平的变化及发展趋势做出正确判断与估计,为就业市场提供可靠的标准,是评价国家宏观调控经济效益和社会效益的重要依据之一。由此可见,对全国职工平均工资预测方法进行研究具有一定的理论价值。数据来源本次分析数据来源于国家统计局统计网站数据库,具有相当的真实性。一、描述性分析对整理后的数据指标进行总体描述性分析(表 1):描述统计量N 极小值 极大值 均值 标准差统计量 统计量 统计量 统计量 标准误 统计量5职工年平均工资 33 615.00 37147.00 8735.5758
5、 1768.73043 10160.58278有效的 N (列表状态) 33表 1采用散点图(图 1)描述数据的整体情况,图 1由图表可知,本次课题分析共统计了 33 个年度数据,全国职工平均工资整体呈指数递增趋势,从 1978 年的 615 元增至 2010 年的 37147 元,简单从数值上看(不考虑通货膨胀等因素),增长了近 60 倍,但是标准误也达到了 1769。故而,单纯的数字对比并不能说明什么问题,需要我们运用统计方法进一步进行分析。二、组合预测1、组合预测的基本思想在经济转轨时期,很难有一个单项预测模型能对宏观经济频繁波动的实现拟合得非常紧密并对其变动的原因做出稳定一致的解释。B
6、ates和Cranger首先提出可建立线性组合预测模型综合各种单项模型的信息,以产生更好的预测效果。理论和实证研究都表明,在诸种单项预测模型各异且数据来源不同的情况下,组合预测模型可能获得比任何一个独立预测值更好的预测值。组合预测模型将各种不同类型的单项预测模型兼收并蓄,各取所长,集中了更多的经济信息与预测技巧,能减少预测的系统误差,显著改进预测效果。这是因为,参与组合6的各种预测模型所产生的误差 (下标i为第i种预测, i=1,2,n)有正有负,e如果 , ,经过组合就会产生正负抵消,降低误差,提高组合预0iEeie测的精度。Makridakis和Winkler在1983年对111个时间序列
7、的外推研究中,发现用两种模型组合,预测误差降低7.3%,而当模型组合增至5种时,预测误差下降16.3%。2、单项预测模型的选取根据对数据的定性分析,在马克思主义理论指导下,依靠研究人员自身的理论知识、专业知识、实际经验和分析能力,确定变量之间的相关关系及其影响程度,选取合适的单项预测模型。本次研究选取的模型有:回归拟合(非线性回归拟合) ,指数曲线趋势外推法(指数曲线模型) ,时间序列平滑预测法(二次曲线指数平滑法) ,灰色系统预测法(GM(1,1)模型) 。1)、非线性回归预测法(转化成线性模型进行拟合)回归预测是基于事物之间这种相关关系的一种数理统计预测方法。对这种相关关系定量描述的数学模
8、型为回归模型。在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,又可以将很多的非线性回归转化为线性回归。需要注意的是,在许多情况下,现象之间只是在一定的范围内才具有相关关系,超出了这个范围去推断或预测,可能会得出错误的结论。从而,可以用线性回归方法解决非线性回归预测问题。首先对数据进行处理:令 (如表 2) ,yQln年份 1979 1980 1981 1982 1983 1984 1985 1986时序(t) 1 2 3 4 5 6 7 86.5 6.64 6.65 6.68 6.72 6.89 7.05 7.19年份 1
9、987 1988 1989 1990 1991 1992 1993 1994时序(t) 9 10 11 12 13 14 15 167.29 7.47 7.57 7.67 7.76 7.91 8.12 8.42年份 1995 1996 1997 1998 1999 2000 2001 2002时序(t) 17 18 19 20 21 22 23 248.61 8.73 8.77 8.92 9.03 9.15 9.3 9.437年份 2003 2004 2005 2006 2007 2008 2009 2010时序(t) 25 26 27 28 29 30 31 329.55 9.68 9.82
10、 9.95 10.12 10.28 10.4 10.52表 2再利用 Excel 的回归分析功能对处理后的数据进行回归分析,得到的结果如下:SUMMARY OUTPUT回归统计Multiple R 0.996955699R Square 0.993920666Adjusted R Square0.993724558标准误差 0.103657337观测值 33方差分析df SS MS F Significance F回归分析 1 54.45747517 54.45747517 5068.242715 6.36457E-36残差 31 0.333090151 0.010744844总计 32 54
11、.79056532Coefficients标准误差 t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept6.0455239390.036924999163.72441844.20535E-475.9702149086.120832975.9702149086.12083297X Variable 10.1349111850.00189504471.19159166.36457E-360.1310462180.1387761520.1310462180.1387761528线性回归的系数 Multiple R=0.997意味着此回归模型
12、解释了全国职工平均工资的99.7%,数据适合做回归分析。拟合优度及调整后的拟合优度都接近于1,说明回归效果比较好。还可知, ,说明0.536-.457EF ceSignfa模型通过检验。由回归分析结果可得到 ,其中 ,tbQ10290,故得到预测方程 ,其中349185.01b xeiy*)(。 计算预测值及残差如表3:2.60ea时序 年份 实际值 预测 Y 还原 Y 残差1 1978 615 6.180435124 483.2021633 0.2411871442 1979 668 6.315346308 552.9935338 0.1889418653 1980 762 6.450257
13、493 632.8652304 0.1856890624 1981 772 6.585168678 724.2732065 0.0638158725 1982 789 6.720079863 828.883706-0.0379712666 1983 826 6.854991048 948.6036374-0.1383962747 1984 974 6.989902233 1085.615333-0.1084909298 1985 1148 7.124813418 1242.416332-0.0790368419 1986 1329 7.259724602 1421.864905-0.06754
14、254410 1987 1459 7.394635787 1627.232157-0.10912923911 1988 1747 7.529546972 1862.261656-0.06389166212 1989 1935 7.664458157 2131.237673 -90.09659555213 1990 2140 7.799369342 2439.063277-0.13080823414 1991 2340 7.934280527 2791.349715-0.17637431815 1992 2711 8.069191712 3194.518693-0.16411886216 199
15、3 3371 8.204102896 3655.919437-0.08113818117 1994 4538 8.339014081 4183.96266 0.08122758418 1995 5500 8.473925266 4788.273879 0.13857810519 1996 6210 8.608836451 5479.868871 0.12507972420 1997 6470 8.743747636 6271.35448 0.03118375221 1998 7479 8.878658821 7177.158421 0.04119555222 1999 8346 9.01357
16、0006 8213.792279 0.01596765623 2000 9371 9.14848119 9400.152489-0.00310609724 2001 10870 9.283392375 10757.8648 0.01036960525 2002 12422 9.41830356 12311.67847 0.00892081326 2003 14040 9.553214745 14089.91743-0.00354906727 2004 16024 9.68812593 16124.99658-0.00628305228 2005 18364 9.823037115 18454.01267-0.00488960929 2006 21001 9.957948299 21119.42051 -100.00562296530 2007 24932 10.09285948 24169.8069 0.03104791431 2008 29229 10.22777067 27660.77626 0.05514597732 2009 32736 10.36268185 31655.96426 0.03354881533 2010 37147 10.49759304 36228.19778 0.025045254表3残差图(图2):图2回归拟合曲线图(图3):