1、统计学课程(课内实验报告)系部名称 :学生姓名 :专业名称 :班 级 :统计学课程实验报告一、实验目的能够使学生在学习统计学原理课程时,掌握统计学中的计算过程,理论联系实际。由于 Excel 是目前办公软件中比较流行的软件,因此,本试验课以该软件为基础,实现它的统计计算功能。通过该试验课程的学习,使每个学生能够达到能够利用该软件的统计计算功能熟练地完成教材中有关例题、习题的计算,并通过案例的学习,培养学生一定的解决实际问题的能力。二、参考书目1、统计学 贾俊平 中国人民大学出版社2、EXCEL 统计分析与决策 于洪彦 高等教育出版社三、实验任务、内容及结果实验一根据下面的数据。1.1 用 Ex
2、cel 制作一张组距式次数分布表,并绘制一张条形图(或柱状图),反映工人加工零件的人数分布情况。从某企业中按随即抽样的原则抽出50名工人,以了解该企业工人生产状况(日加工零件数):117 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 1091.2 整理成频数分布表
3、,并绘制图形。1.3 假设日加工零件数大于等于 130 为优秀。一、实验步骤第一步 建立如图 1.1 所示的 Excel 数据文件,或打开已有的数据文件。图 1.1第二步 整理成频数分布表,如图 1.2某车间 50 名工人日加工零件数分组表累计频数 累计频率按零件数分组(个) 频数 频率 向上累计 向下累计 向上累计 向下累计105-110 4 8 4 50 8 100110-115 5 10 9 46 18 92115-120 8 16 17 41 34 82120-125 13 26 30 33 60 66125-130 10 20 40 20 80 40130-135 6 12 46 1
4、0 92 20135-140 4 8 50 4 100 8合计 50 100 图 1.2第三步 绘制直方图1. 选择“数据”的“数据分析” ,在选择“直方图”选项,弹出对话框如图 1.3。图 1.32输入输入区域、接收区域和输出区域,选择累计百分率和图表输出。按确定,如图图 1.43输出图,对图形的标题、图例、数据标志、坐标轴、等进行设置。如图 1.5 和1.6。图 1.5105-110110-115115-120120-125125-130130-135135-1400510150.00%50.00%100.00%150.00%频 率累 积 %某车间50 名工人日加工零件频数分布直方图分组界
5、限频率图 1.6第四步 频数分布表图 1.7第五步 假设日加工零件数大于等于 130 为优秀。如图 1.8。图 1.8实验二 百货公司 6 月份各天的销售额数据如下(单位:万元)257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、众数、中位数;(2)计算该百货公司日销售额的极差、标准差;(3)计算日销售额分布的偏态系数和峰度系数。实验步骤第一步 输入原始数据,如图 2.1。图 2
6、.1第二步 选择“数据”的“数据分析” ,再选择“描述统计” 。如图 2.2图 2.2第三步 输入输入区域和输出区域,选择汇总统计、平均数置信度、第 K 大值和第 K小值。如图 2.3。图 2.3第四步 输出结果,如图 2.4。图 2.4实验三 综合运用统计学中相关与回归分析的内容,根据下列数据作出一个相关回归模型。某地区 19962011 年国民生产总值和财政收入资料 单位:亿元年份 国内生产总值 财政收入1996 18667.82 2937.11997 21781.5 3149.481998 26923.48 3483.371999 35333.92 4348.952000 48197.8
7、6 5218.12001 60793.73 6242.22002 71176.59 7407.992003 78973.04 8651.142004 84402.28 9875.952005 89677.05 11444.082006 99214.55 13395.232007 109655.2 16386.042008 120332.7 18903.642009 135822.8 21715.252010 159878.3 26396.472011 183084.8 31649.29实验步骤:一、利用 Excel 做相关分析相关分析通常有两种方式,一个是绘制数据散点图,另一个是计算相关系数。
8、.绘制数据散点图(XY 散点图)第一步 建立或打开如图 3.1 所示的 Excel 数据表。图 3.1第二步 单击【插入】按钮,启动【散点图】 ,进入【所有图表类型】 ,选取 XY 散点图。如图 3.2 所示。图 3.2第三步选【布局】,进入【标签】 ,设置标题、坐标轴、图例等项目,如图 3.3 所示。图 3.3.计算相关系数用 Excel 计算相关系数,即可用 “数据分析”工具完成,也可调用 CORREL( )函数完成。其中用“数据分析”工具简单快捷。故这里只介绍用“数据分析”工具计算相关系数的过程。第一步 建立或打开如图 3.4 所示的 Excel 数据表。图 3.4第二步 依次选【数据】
9、 、 【数据分析】 、 【相关系数】 、 【确定】 ,进入相关系数对话框,如图 3.5 所示。图 3.5第三步 选定输入输出区域。其中输入区域为分析变量 X、Y 所在区域,本例的输入区域为:B1 :C13 ;输出区域为放置计算结果的区域。第四步 选【确定】 ,得到如图 3.6 所示的结果。图 3.6图为国内生产总值与财政收入的相关矩阵,其中国内生产总值与财政收入的相关系数为 0.981137。二、回归分析当两个变量间存在相关时,即可进行回归分析。在 Excel 进行回归分析,可由三种方法分别介绍如下:.绘图中加入趋势线在绘图中加入趋势线确定回归方程,时回归分析最简便的方式。而且可计算的回归种类
10、也最多,包括直线、多项式曲线、指数曲线、对数曲线等。设在 Excel 工作表中建立国内生产总值与财政收入的关系如图 5.1 所示。下面以此为例分析不同形式的回归模型。.插入回归线(趋势线)第一步 在图上的数据点按右键,选【添加趋势线】 。第二步 点【添加趋势线】,选【线性】回归线 ,对话框【选项】选项卡,勾选【显示公式】及【显示 R 平方值】,如图 3.7 所示.图 3.7第三步 单击【确定】,可看到图上已出现较粗的预测线、回归方程及 R 平方值,将此【数据标志格式】按右键修改其字号,选【不透明】,将方框来小一点,最后如图 3.8 所示.图 3.8其回归方程为:y = 0.175x - 281
11、3即财政收入=0.175国内生产总值-2813可决系数为 0.962,表示整个回归方程的解释能力不错.三、预测:取得了回归方程以后,即可用来预测不同价格的销量.用 Excel 完成回归预测的步骤为:第一步 在 B19 输入要计算的国内生产总值第二步 选点图上的回归方程式,会变成用方框包围,如图 3.9 所示。图 3.9第三步 再一次选择点击回归方程式的内容,可进入编辑状态,方程式的外围方框消失。第四步 用拖拽的方式,选定回归方程式的内容,如图 3.10 所示第五步 单击【复制】按钮,复制回归方程式的内容第六步 移动鼠标到 C19,点击其数据编辑区的 “=”按钮,进入公式编辑状态第七步 单击【粘
12、贴】按钮,将复制的回归方程式内容贴进来第八步 删除编辑区方程式前面的“y=”将 x 改为*B19,使其变成: = 0.175*B19-2813,如图 5.11 所示.图 3.10第九步 单击【确定】按钮,即可计算出国内生产总值为 203085.7 时, 财政收入为32726.9975,如图 3.11 所示.图 3.11注意:以上线性回归分析过程完全适用于曲线回归分析,只是在添加趋势线时,选择与分析相关的曲线趋势类型即可,如要进行指数回归分析,则按如图 5.13 所示的情况选择趋势类型. 为节省篇幅,不在赘述.(图 5.13)四、使用“数据分析”进行回归分析在绘图中,利用添加趋势线确定回归方程式
13、,并无法对方程式及其系数进行检验,而且很多统计数字也难提供.如果使用“数据分析工具”的“回归”项进行计算(得先安装“加载宏”的“分析工具库”)则可获得很多的统计数字.如相关系数、判定系数、F 统计量、t 统计量等.直线回归1.建立或打开 Excel 数据文件,如图 5.14 所示.(图 5.14)2.单击【数据】 、 【数据分析】,选【回归】, 确定后进入回归对话框如图 5.15 所示.(图 5.15)3.在“Y 值输入区域”处,以拖拽的方式选取销售量区域 C2:C17 区域.4.在“X 值输入区域”处,以拖拽的方式选取居民人均收入区域 B2:B17 区域.5.由于上述两区域均含标志(变量名)
14、,所以勾选“标志(L)”.6.勾选“置信度(O)”,可计算回归系数的置信区间(本例设置为 95.45%).7.在“输出选项”出确定将回归结果方在何处?,本例为原工作表的 B22 位置.8.如果要分析残差,可勾选“残差(R)”或“标准残差(T)”(本例选前者)9.如果要绘图,可勾选“残差图(D)”或“线性拟合图(I)”(本例选后者)(图 5.16)10.单击【确定】按钮,即可获得回归结果.因其内容较多,将其拆分为几个部分进行说明.所示.(图 5.17)此部分为中: “Multiple R”为相关系数,其中两变量相关为单相关系数,多变量相关为复相关系数中; “R Square”为可决系数或判定系数
15、; “Adjusted R Square”为校正的可决系数,主要用于多元回归拟合优度的判别; “标准误差” 为 knysii12)((图 5.18)此部分通过方差分析,计算 F 统计量,并检验因变量(Y)与自变量 (X,在多元回归中则为全部的自变量)间,是否存在显着的回归关系 ?判断是否显着,只需看显着性水平是否小于所指定的 值即可,如本例的显着性水平 0.00077=0.05,所以无法放弃其为 0 的假设,回归方长的常数项应为 0,所以预测时可将其省略.另外本例的自变量(国内生产总值)的回归系数为 0.181,其 t 统计量为 19.374,显着性水平(P-值)0.000769=0.05,所
16、以放弃其为 0 的假设,回归方程中的自变量 X 的回归系数不为 0,自变量与因变量之间存在显着的线性相关.所以,预测时可以只取:y=0.181x 作为回归方程式.但 Excel 仍用 :y=192.526+0.181x 进行后续的残差分析(图 5.20)此部分是将各观察值的 X(国内生产总值 )代入方程所得的预测值,以及预测与实际值之间的误差.图 5.21此部分为样本回归线图,以图平面绘出实际观察值与预测值的分布状况.由于无法画出多元空间的图形,当自变量为多个时,将分为多个平面图分别显示.注意:使用“数据分析”也可完成多元线性回归 ,其过程和回归分析结果与一元线性回归完全一致的,只是在“X 值
17、的输入区域 ”的选定上略有差别,由于多元回归中有多两个以上的自变量,所以,在选定“X 值的输入区域 ”应包括所有自变量的分布区域.此外,还可以用直线回归 LINEST( )、预测 FORECAST( )等函数进行回归分析与预测,以上函数的调用过程与其它函数类似.由于篇幅所限,就不再赘述 .四、实验地点院机房五、实验总结这次实验让我学会了运用 Excel 软件对统计数据进行分析整理,例如描述统计,绘制直方图,建立回归分析模型。通过这次实验我掌握了很多应用软件方面的知识,真正的做到了学习与实践相结合,加深知识的掌握的同时也锻炼了操作能力。更加加深了我对统计学这一学科的学习和理解,为我在以后的学习奠定了基础。