1、东华大学管理学院管理科学与工程专业 2010 级统计学实验报告居民消费价格指数的统计学分析学号:100750324姓名: 指导老师:周力分数 2居民消费价格指数的统计学分析背景描述:统计学在经济管理领域有着广泛的应用,本文将应用统计学对中国 1978 年至 2006 年的居民消费者价格指数进行分析,分析的方面包括(1)历年居民消费价格指数, (2)历年城市居民消费价格指数, (3)历年农村居民消费者价格指数, (4)历年商品零售价格指数,(5)历年工业品出厂价格指数,以及(6)2006 年居民消费价格分类指数,其中前五个指数均以 1978 或者 1985 年为基年,最后一个指数以 2005 年
2、为基年。本文一共应用了统计描述、散点图、箱形图、回归、移动平均法、指数平滑法、假设检验、方差分析、定基指数、环比指数等方法进行统计学分析。其中对历年商品零售价格指数进行回归,以探究其回归方程,把握数据的变动规律;对历年商品零售价格指数进行移动平均预测和指数平滑预测;对城市居民消费价格指数和农村居民消费价格指数做假设检验,检验两者均值是否有显著性差异;对商品零售价格指数和工业品出厂价格指数做价格检验,检验两者均值是否有显著性差异;对居民消费价格分类指数中的各类(共有“食品” 、 “烟酒及用品” 、 “衣着” 、 “家庭设备用品及服务” 、 “医疗保健和个人用品” 、 “交通和通信” 、 “娱乐教
3、育文化用品及服务” 、 “居住”八大类)进行方差分析,检验各类消费价格指数的均值是否有显著性差异,探究此案例中分类型自变量是否对数值型自变量有显著性影响;将定比指数换算环比指数,探究环比指数之下变动情况并且与定比指数的情况进行对比。数据采集方式:中国统计年鉴(2007 年版) 第 309 页原始数据 1:各种价格定基指数年份 居民消费价格指数 (1978=100)城市居民消费价格指数(1978=100)农村居民消费价格指数(1985=100)商品零售价格指数(1978=100)工业品出厂价格指数(1985=100)1978 100 100 1001980 109.5 109.5 108.119
4、85 131.1 134.2 100 128.1 1001990 216.4 222 165.1 207.7 1591991 223.8 233.3 168.9 213.7 168.91992 238.1 253.4 176.8 225.2 180.41993 273.1 294.2 201 254.9 223.71994 339 367.8 248 310.2 267.31995 396.9 429.6 291.4 356.1 307.11996 429.9 467.4 314.4 377.8 3161997 441.9 481.9 322.3 380.8 3151998 438.4 479
5、 319.1 370.9 302.11999 432.2 472.8 314.3 359.8 294.82000 434 476.6 314 354.4 303.12001 437 479.9 316.5 351.6 299.232002 433.5 475.1 315.2 347 292.62003 438.7 479.4 320.2 346.7 299.32004 455.8 495.2 335.6 356.4 317.62005 464 503.1 343 359.3 333.22006 471 510.6 348.1 362.9 343.2原始数据 2:居民消费价格分类指数(2006
6、年)项目 全国居民消费价格指数食品粮食大米 104.3面粉 99.7淀粉 101.8干豆类及豆制品 100.8油脂 98.6肉禽及其制品 97.1蛋 96水产品 101.2菜鲜菜 108.2调味品 102.3糖 111.2茶及饮料茶叶 101.2饮料 100.9干鲜瓜果鲜果 121.5糕点饼干面包 101.3液体乳及乳制品 100.9在外用膳食品 101.6其他食品 101.2烟酒及用品烟草 100.2酒 101.2吸烟、饮酒用品 100.7衣着服装 99衣着材料 100.5鞋袜帽 100.2衣着加工服务费 101.5家庭设备用品及服务耐用消费品4家具 100.2家庭设备 101.2室内装饰品
7、 100床上用品 99.6家庭日用杂品 101.1家庭服务及加工维修服务费 105.8医疗保健和个人用品医疗保健医疗器具及用品 97.2中药材及中成药 99.9西药 98.4保健器具及用品 100.3医疗保健服务 103个人用品及服务化妆美容用品 99.7清洁化妆用品 99.9个人饰品 110.8个人服务 102.5交通和通信交通交通工具 97.8车用燃料及零配件 112.8车辆使用及维修费 102.4市内公共交通费 104.8城市间交通费 105.6通信通信工具 82.2通信服务 100娱乐教育文化用品及服务文娱用耐用消费品及服务 94.2教育教材及参考书 100.3学杂托幼费 100文化娱
8、乐文化娱乐用品 99.6书报杂志 100.7文娱费 102.6旅游 103.1居住建房及装修材料 103.9租房 102.7自有住房 103.7水电燃料 105.95针对原始数据 1 的分析:预处理:所有数据来源于中国统计年鉴(2007 年版) ,确保真实、完整、有效。描述性统计:统计量Consumer Price Index有效 20N缺失 20均值 345.215均值的标准误 29.0203中值 431.050众数 100.0a标准差 129.7827方差 16843.546偏度 -.858偏度的标准误 .512峰度 -.839峰度的标准误 .992全距 371.0极小值 100.0极大值
9、 471.025 227.37550 431.050百分位数75 438.625a. 存在多个众数。显示最小值由 SPSS19 中的描述统计中的频率可以得到上表,均值为 345.215,中值为431.050,标准差为 129.7827,正负三个标准差的范围为-44.1331734.5631,所有数据均在此范围内,无异常值。偏度为-0.858,为左偏,峰度为-0.839.最大值为 471,最小值为 100,全距为 371.现在针对“居民消费者价格指数”做回归分析:SPSS 输入页面如下,其中 AdjustedYear 为调整后的年份6作出散点图如下:7回归分析表如下:8曲线拟合模型描述模型名称
10、MOD_3因变量 1 Consumer Price Index1 线性2 对数3 倒数4 二次5 三次6 复合 a7 幂 a8 Sa9 增长 a10 指数 a方程11 Logistica自变量 调整后年份常数 包含其值在图中标记为观测值的变量 未指定用于在方程中输入项的容差 .0001a. 该模型要求所有非缺失值为正数。个案处理摘要N个案总数 40已排除的个案 a 20已预测的个案 0新创建的个案 0a. 从分析中排除任何变量中带有缺失值的个案。9变量处理摘要变量因变量 自变量Consumer Price Index 调整后年份正值数 20 20零的个数 0 0负值数 0 0用户自定义缺失 0
11、 0缺失值数系统缺失 20 20模型汇总和参数估计值因变量:Consumer Price Index模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1 b2 b3线性 .892 148.210 1 18 .000 57.189 15.611对数 .716 45.348 1 18 .000 -17.181 133.117倒数 .383 11.190 1 18 .004 387.879 -368.306二次 .894 71.830 2 17 .000 40.539 18.563 -.095三次 .955 112.643 3 16 .000 132.432 -23.187 3
12、.293 -.073复合 .898 157.897 1 18 .000 100.784 1.063幂 .827 86.271 1 18 .000 67.968 .560S .505 18.330 1 18 .000 5.936 -1.654增长 .898 157.897 1 18 .000 4.613 .061指数 .898 157.897 1 18 .000 100.784 .061Logistic.898 157.897 1 18 .000 .010 .941自变量为 调整后年份。10根据R 方值可以看出三次方拟合是最好的,可以得出回归方程为=132.43223.187+3.29320.0
13、733此时曲线拟合图为:11但是由明显可以看出,预测曲线在末尾是下降趋势,而实际数据在末尾确实上升趋势。所以以 1998 年(AdjusterYaer=21)为临界点,1998 年前后各做回归分析。首先是 19181998 年:SPSS 曲线回归输出结果如下:12模型汇总和参数估计值因变量:consuner模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1 b2 b3线性 .842 48.034 1 9 .000 29.316 17.897对数 .598 13.377 1 9 .005 26.225 102.295倒数 .348 4.810 1 9 .056 309.4
14、83 -258.397二次 .980 194.326 2 8 .000 123.610 -12.634 1.464三次 .983 134.540 3 7 .000 102.404 .763 -.040 .046复合 .953 181.816 1 9 .000 80.422 1.085幂 .757 27.996 1 9 .000 74.490 .493S .484 8.453 1 9 .017 5.688 -1.306增长 .953 181.816 1 9 .000 4.387 .082指数 .953 181.816 1 9 .000 80.422 .082Logistic .953 181.8
15、16 1 9 .000 .012 .922自变量为 AdjustedYear根据R 方值可以看出三次方拟合是最好的,可以得出回归方程为y=102.404+0.763x-0.04x2+0.046x313此时拟合曲线为:其次是 19982006 年:SPSS 曲线回归输出结果如下:模型汇总和参数估计值因变量:consumer模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1 b2 b3线性 .713 17.391 1 7 .004 331.997 4.518对数 .674 14.500 1 7 .007 94.526 109.050倒数 .634 12.132 1 7 .0
16、10 550.160 -2601.821二次 .950 56.439 2 6 .000 1042.211 -52.911 1.149三次 .948 54.635 2 6 .000 805.653 -24.269 .000 .015复合 .713 17.401 1 7 .004 346.108 1.010幂 .675 14.519 1 7 .007 204.283 .242S .635 12.154 1 7 .010 6.331 -5.777增长 .713 17.401 1 7 .004 5.847 .010指数 .713 17.401 1 7 .004 346.108 .010Logistic
17、 .713 17.401 1 7 .004 .003 .990自变量为 AdjustedYear。14根据R 方值可以看出二次方拟合是最好的,可以得出回归方程为y=1042.211-52.911x+1.149x2此时曲线拟合图为:15然后用移动平均值法对“居民消费价格指数”做预测:操作数据如下:由图可见三期移动平均预测的“标准误差”更小,预测的 2007 年的消费价格指数为 463.6随后用指数平滑法进行预测:16可见用 =0.5 的指数平滑产生的标准误差最小,预测 2007 年消费价格指数为 463.014=0.517=0.4=0.3然后针对“城市居民消费价格指数”和“农村居民消费价格指数”
18、做假设检验:H0: 1= 2 H1: 1 2SPSS 输入如下:18SPSS 作箱型图如下:独立样本 T 检验输出结果如下:19组统计量Bootstrapa95% 置信区间分组1 Statistic 偏差 标准 误差 下限 上限N 20均值 373.250 .931 32.006 303.293 435.137标准差 145.7669 -4.9874 17.4844 102.6945 171.33941.0均值的标准误32.5945N 20均值 280.250 -.587 16.514 246.332 310.801标准差 75.1542 -2.7073 12.1777 46.3390 93.
19、0758urban&rural2.0均值的标准误16.8050a. Unless otherwise noted, bootstrap results are based on 1000 bootstrap samples独立样本检验方差方程的 Levene 检验 均值方程的 t 检验差分的 95% 置信区间F Sig. t dfSig.(双侧)均值差值标准误差值 下限 上限假设方差相等14.547 .000 2.536 38 .015 93.0000 36.6716 18.7622 167.2378urban&rural假设方差不相等2.536 28.435 .017 93.0000 36.
20、6716 17.9333 168.0667因 P 值=0.0000.05,所以不拒绝原假设,两组数据均值不具有显著性差异。可见商品零售价格指数和工业品出厂价格指数均值之间没有显著性差异。然后作居民消费价格分类指数的方差分析:H0: 1= 2= 8H1: i(i=1,2,3,,k)不全相等SPSS 输入界面如下:22作箱形图如下所示:SPSS 假设检验输出结果如下:23描述价格指数均值的 95% 置信区间N 均值 标准差 标准误 下限 上限 极小值 极大值分量间方差1 18 102.5667 5.19513 1.22450 99.9832 105.1501 96.00 117.902 3 100
21、.7000 .50000 .28868 99.4579 101.9421 100.20 101.203 4 100.3000 1.02956 .51478 98.6617 101.9383 99.00 101.504 6 101.3167 2.28422 .93253 98.9195 103.7138 99.60 105.805 9 101.3000 3.98873 1.32958 98.2340 104.3660 97.20 110.806 7 100.8000 9.49737 3.58967 92.0164 109.5836 82.20 112.807 7 100.0714 2.90730
22、 1.09886 97.3826 102.7602 94.20 103.108 4 104.0500 1.34040 .67020 101.9171 106.1829 102.70 105.90总数 58 101.5759 4.74857 .62352 100.3273 102.8244 82.20 117.90固定效应4.92579 .64679 100.2767 102.8750模型随机效应.64679a 100.0465a103.1053a-2.03605方差齐性检验价格指数Levene 统计量 df1 df2 显著性1.983 7 50 .076ANOVA价格指数平方和 df 均方 F
23、 显著性组间 72.114 7 10.302 .425 .882组内 1213.173 50 24.263总数 1285.286 57均值图:24因为 P 值=0.8820.05,所以不拒绝原假设。即居民消费价格指数的各个分类的均值没有显著性差异,可见居民在生活的各个方面的价格指数相差不显著。因此方差分析中有较多异常值,因此本文将对异常值单独关注,并在对异常值剔除后再次进行方差分析。异常值中偏小值分别为:6 97.1 肉禽及其制品7 96 蛋46 82.2 通信工具48 94.2 文娱用耐用消费品及服务异常值中偏大值分别为:9 108.2 鲜菜11 111.2 糖14 117.9 干鲜瓜果31
24、 105.8 家庭服务及加工维修服务费39 110.8 个人饰品由此看见,2006 年时,食品方面“肉禽及其制品” 、 “蛋”是相对便宜的,可以选择多消费, “鲜菜” 、 “糖” 、 “干鲜瓜果”是相对贵的,可以选择少消费;“通信工具” 、 “文娱用耐用消费品及服务”比较便宜, “家庭服务及加工维修服务费” 、 “个人饰品”比较贵,可以在消费上有侧重。25剔除异常值后的方差分析:SPSS 输出箱形图:SPSS 方差分析输出:描述26价格指数均值的 95% 置信区间N 均值 标准差 标准误 下限 上限 极小值 极大值分量间方差1 13 101.2154 1.31329 .36424 100.42
25、18 102.0090 98.60 104.302 3 100.7000 .50000 .28868 99.4579 101.9421 100.20 101.203 4 100.3000 1.02956 .51478 98.6617 101.9383 99.00 101.504 5 100.4200 .70143 .31369 99.5491 101.2909 99.60 101.205 8 100.1125 1.91791 .67808 98.5091 101.7159 97.20 103.006 6 103.9000 5.24557 2.14149 98.3951 109.4049 97.
26、80 112.807 6 101.0500 1.44879 .59147 99.5296 102.5704 99.60 103.108 4 104.0500 1.34040 .67020 101.9171 106.1829 102.70 105.90总数 49 101.3878 2.48618 .35517 100.6736 102.1019 97.20 112.80固定效应2.23911 .31987 100.7418 102.0338模型随机效应.55797 100.0684 102.7071 1.35266方差齐性检验价格指数Levene 统计量 df1 df2 显著性3.687 7 4
27、1 .004ANOVA价格指数平方和 df 均方 F 显著性组间 91.134 7 13.019 2.597 .026组内 205.559 41 5.014总数 296.693 4827因 P 值=0.0260.05,不拒绝原假设。即居民消费价格指数的各个分类的均值没有显著性差异。单独剔除第 6 组,做箱形图和方差分析,得:30描述价格指数均值的 95% 置信区间N 均值 标准差 标准误 下限 上限 极小值 极大值分量间方差1 13 101.2154 1.31329 .36424 100.4218 102.0090 98.60 104.302 3 100.7000 .50000 .28868
28、99.4579 101.9421 100.20 101.203 4 100.3000 1.02956 .51478 98.6617 101.9383 99.00 101.504 5 100.4200 .70143 .31369 99.5491 101.2909 99.60 101.205 8 100.1125 1.91791 .67808 98.5091 101.7159 97.20 103.007 6 101.0500 1.44879 .59147 99.5296 102.5704 99.60 103.108 4 104.0500 1.34040 .67020 101.9171 106.1829 102.70 105.90总数 43 101.0372 1.66161 .25339 100.5258 101.5486 97.20 105.90固定效应1.37415 .20956 100.6122 101.4622模型随机效应.48220 99.8573 102.2171 1.04098