收藏 分享(赏)

数理统计大作业.docx

上传人:j35w19 文档编号:7778906 上传时间:2019-05-25 格式:DOCX 页数:11 大小:122.57KB
下载 相关 举报
数理统计大作业.docx_第1页
第1页 / 共11页
数理统计大作业.docx_第2页
第2页 / 共11页
数理统计大作业.docx_第3页
第3页 / 共11页
数理统计大作业.docx_第4页
第4页 / 共11页
数理统计大作业.docx_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、 研究生课程考核试卷(适用于课程论文、提交报告)科 目: 数理统计 教 师: 姓 名: 学 号: 专 业: 机械工程 类 别: 学术 上课时间: 2015 年 3 月至 2015 年 5 月 考 生 成 绩:卷面成绩 平时成绩 课程综合成绩阅卷评语: 阅卷教师 (签名) 货运总量与工业总产值、农业总产值和居民非商品支出之间多元线性回归分析摘要:随着社会的发展,货运总量、工业总产值、农业总产值和居民非商品支出也大幅增加。研究货运总量与工业总产值、农业总产值和居民非商品支出之间的关系从而对货运总量做出初步估计也变得更为重要。借助于数理统计的知识,在实际的数据的基础上,对它们之间进行一个简单的多元线

2、性回归分析。在建立起模型之后,通过显著性检验方法进行检验,以检查结果的正确性。最后并将其用于指导实际工作。关键词:货运总量;工业总产值;农业总产值;居民非商品支出;多元线性回归分析一、问题提出及分析随着我国经济的快速发展,货运总量、工业总产值、农业总产值和居民非商品支出大幅增加。为了研究货运总量、工业总产值、农业总产值和居民非商品支出之间的关系,来估算货运总量,从而能够更好地对各地进行资源配置,如运输工具等,提高利用率,减少不必要的支出。从而本文对货运总量、工业总产值、农业总产值和居民非商品支出之间进行了多元线性回归分析。建立其数学模型,以指导实际工作。二、数据描述为研究运总量与工业总产值、农

3、业总产值和居民非商品支出之间的关系,选取了十个地区的相关数据,如表1所示。表1 十个地区的相关数据编号货运总量 y(万吨)工业总产值x1(亿元)农业总产值x2(亿元)居民非商品支出x3(亿元)1 160 70 35 12 260 75 40 2.43 210 65 40 24 265 74 42 35 240 72 38 1.26 220 68 45 1.57 275 78 42 48 160 66 36 29 275 70 44 3.210 250 65 42 3(数据来源于数理统计,钟波等,高等教育出版社)三、模型建立(1)提出假设条件,理清概念,引进参数假设工业总产值X1、农业总产值X2

4、和居民非商品支出X3为自变量,货运总量Y为因变量。为确定三个自变量与因变量是否存在线性关系,故画出三个自变量分别与因变量Y之间的散点图,分别为图1-图3。图1 X1与Y的数据散点图图2 X2与Y的数据散点图图3 X3与Y的数据散点图由图1-图3可以看出,X1、X2、X3与Y基本呈现线性关系,因此,建立三元64 66 68 70 72 74 76 78 800100200300 x130 32 34 36 38 40 42 44 46150200250300x20 0.5 1 1.5 2 2.5 3 3.5 4 4.50100200300x3线性回归模型:由线性回归模型可知,若 越大,y 随 的

5、变化趋势就越明显;反之,若iix越小,y随 的变化就越不明显。特别是,当 i=0时,则表明 无论如何变iix ix化,y 的值都不受影响,因而 y与 之间不存在线性相关关系。当 0时,则i 认为y 与 之间有线性相关关系。于是,问题归结为对统计假设i:0H3,21,i的检验。若拒绝 H0,就认为 y 与 之间有线性相关关系,所求的样本回归直线x有意义;若接受 H0,则认为 y 与 之间不存在线性相关关系,它们之间可能存i在明显的非线性相关关系,也可能根本就不相关,所求的样本回归直线无意义。(2)模型构建类似于一元线性回归模型,用最小二乘法估计多元线性回归模型的参数。假设 是 的估计,称Tm),

6、(10Tm),(10mxxy为经验线性回归方程。将 ,( i=1,2, ,n) 代入上式,所得值记为21imiX 。记 ,则miixy10 ),1myY因此,残差平方和: ni imini xxyyQ1 21012 )( 2 XYXYTTT的最小二乘估计就是残差平方和达到最小的 。可以验证 是下列方程组的解0)(Q该方程又可以简化为正则方程组.,21,0),(. 212321 njCovN nixxyji iiiiXYTT在矩阵列 X 满秩的条件下,可得到上方程组的解,其中即 的最小二乘估计 YXT1)(Y(3)模型求解因为= (160 260 210 265 240 220 275 160

7、275 250)TY故 YXT1)(12.475 038-所以,Y 对自变量 X1、X2、X3 之间的线性回归方程为: 32145.38 xxy四、计算方法设计和计算机实现将数据以以下形式输入到 excel 表格。货运总量y(万吨) 工业总产值 x1(亿元) 农业总产值x2(亿元)居民非商品支出x3(亿元)160 70 35 1260 75 40 2.4 3.04265.0127 36 481.504506.102723 .40405.10137X210 65 40 2265 74 42 3240 72 38 1.2220 68 45 1.5275 78 42 4160 66 36 2275

8、70 44 3.2250 65 42 3表 2利用 excel 工作表中数据分析功能得到以下图表。y x1 x2 x3 平均 231.5 平均 70.3 平均 40.4 平均 2.33标准差 43.40059 标准差 4.44847 标准差 3.272783 标准差 0.966149方差 1883.611 方差 19.78889 方差 10.71111 方差 0.933444观测数 10 观测数 10 观测数 10 观测数 10表 3 描述性统计量回归统计Multiple R 0.897500815R Square 0.805507714Adjusted R Square 0.70826157

9、1标准误差 23.4418802观测值 10表 4 回归统计df SS MS F Significance F回归分析 3 13655.37 4551.79 8.283184172 0.014870092残差 6 3297.13 549.5217 总计 9 16952.5 表 5 方差分析表Coefficients 标准误差 t Stat P-value 下限 95.0% 上限 95.0%Intercept -348.2801695 176.4592 -1.97371 0.095855372 -780.0603287 83.49998968x1 3.754036753 1.933315 1.9

10、41761 0.100196907 -0.976614931 8.484688436x2 7.1007124 2.880281 2.465284 0.048768597 0.0529179 14.1485069x3 12.44746988 10.56933 1.177697 0.283509859 -13.4147488 38.30968856表 5 回归系数及其他统计值由系数表可以得到回归方程: 32147.10.754328.4 xxy另外,回归系数 1、 2、3 的检验 t 值分别为 1.942、2.465 、1.178,其中居民非商品支出 x3 的 P 值=0.284 最大,且高于 1

11、%的显著性水平,对 y 不高度显著,因此予以剔除,重新计算,以获得最佳回归方程。剔除数据 x3 之后重新利用 excel 进行计算,得到以下表格。回归统计Multiple R 0.872094R Square 0.760549Adjusted R Square 0.692134标准误差 24.08112观测值 10表 6 回归统计表方差析df SS MS F Significance F回归分析 2 12893.2 6446.6 11.11674 0.006718残差 7 4059.301 579.9001总计 9 16952.5 表 7 方差分析表Coefficients 标准误差 t St

12、at P-value下限 95.0%上限 95.0%Intercept -459.624 153.0576 -3.00295 0.019859 -821.547 -97.7工业总产值 x1(亿元) 4.67563 1.816071 2.574586 0.036761 0.381305 8.969956农业总产值 x2(亿元) 8.970961 2.468461 3.634232 0.008351 3.133978 14.80794表 8 回归系数及其他统计值由表 8 可以得到新的回归方程: 2197.8642.59xy五、结果检验由表 8 可知,回归系数 1、2、的检验 t 值分别为 2.57

13、5、3.634 ,但在低于 1%的显著性水平下,仍对 y 高度显著, ,另外回归系数 1 、2、的置信水平为 95%的区间估计分别为(0.381,8.970 ) 、 (3.134,14.808 ) ,常数项 0 的置信水平为 95%的区间估计为(-821.574,-97.700) 。由表 7 可以看出:检验值 F=11.11674,显著性 sig=0.0067 远小于 0.05,表明回归方程高度显著,说明 x1、x2 、整体上对 y 有高度显著的线性影响。五、结论分析(1)可用于预测货运总量的多元线性回归模型为: 2197.8642.59x(2)通过检验,剔除不显著变量得到最佳回归模型,自变量

14、与因变量之间是高度正关。说明本项研究采用的这种多元线性回归预测方法具有很好的实际应用价值。(3)通过回归模型,可以根据工业总产值和农业总产值更好地预测货运总量,从而合理进行资源配置,达到最有效果。参考资料1 刘朝林,黄光辉,刘琼荪,钟波 .数理统计 M.北京:高等教育出版社,2015.2 潘承毅,何迎晖.数理统计原理与方法M.上海:同济大学出版社, 1993.附录剔除居民非商品支出x3后由Excel分析得到以下图表。0 5 10 15 20 25 30 35 40 45 50-1000100农 业 总 产 值x2 ( 亿 元 ) Residual Plot农 业 总 产 值x2 ( 亿 元 )

15、残差64 66 68 70 72 74 76 78 800200400货 运 总 量y ( 万 吨 )预 测 货 运 总 量y ( 万 吨)工 业 总 产 值x1 ( 亿 元 ) Line Fit Plot工 业 总 产 值x1 ( 亿 元 )货运总量y(万吨)64 66 68 70 72 74 76 78 80-1000100工 业 总 产 值x1 ( 亿 元 ) Residual Plot工 业 总 产 值x1 ( 亿 元 )残差0 5 10 15 20 25 30 35 40 45 500100200300货 运 总 量y ( 万 吨 )预 测 货 运 总 量y ( 万 吨)农 业 总 产 值x2 ( 亿 元 ) Line Fit Plot农 业 总 产 值x2 ( 亿 元 )货运总量y(万吨)0 10 20 30 40 50 60 70 80 90 1000100200300Normal Probability PlotSample Percentile货运总量y(万吨)

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报