收藏 分享(赏)

统计学实验指导.doc

上传人:wspkg9802 文档编号:9323997 上传时间:2019-08-02 格式:DOC 页数:14 大小:768.50KB
下载 相关 举报
统计学实验指导.doc_第1页
第1页 / 共14页
统计学实验指导.doc_第2页
第2页 / 共14页
统计学实验指导.doc_第3页
第3页 / 共14页
统计学实验指导.doc_第4页
第4页 / 共14页
统计学实验指导.doc_第5页
第5页 / 共14页
点击查看更多>>
资源描述

1、1第二章统计学实验指导实验一:统计整理与分组实验目的:运用 excel 进行常见数据类型的统计整理,能熟练运用菜单和各类函数进行数据筛选、排序,运用数据透视表绘制统计频数分布表。实验要求:独立完成课堂各类习题和练习,按要求完成实验内容。实验形式:教师演示、指导实验内容:1、品质数据分组:利用数据透视表直接绘制,但是需要注意排序数据2、数值数据分组:对数据排序后,能分析选择数值数据的分组形式。能利用数据透视表编制单项式分组统计次数数列;熟练应用统计函数编制组距式分组统计次数分布数列。一、统计数据的预处理1、数据筛选:参见指导 P3739(1)自动筛选:将鼠标定位于数据文件的变量标题行;点击菜单“

2、数据”筛选自动筛选后,则在标题行出现下拉箭头;在需要筛选的变量下点击下拉箭头,自行选择筛选功能(前 10 个,自定义) ,后确定。自动筛选结果会自动从原数据区域中被选择出来显示,不符合条件的被屏蔽。自动筛选一次只能执行一次筛选条件。取消筛选:将数据“数据”筛选自动筛选再点击一次,去掉自动筛选前的“” 。(2)高级筛选:选择空白区域创立筛选条件区域:筛选变量、筛选条件值菜单“数据”筛选高级筛选后,进入高级筛选对话框;2筛选方式:通常是筛选结果另行放置,防止与原数据混淆。列表区域:整个数据库区域,一般系统会自动选择。条件区域:高级筛选可同时执行多个条件的综合筛选结果,选出符合条件的数据区域。如果同

3、时多个条件筛选,条件区域中将多个条件变量取值同行放置,表示“与” 。若至少满足多个条件之一,条件区域中将多个条件变量取值换行放置,表示“或” 。如:筛选文化程度为大学本科的管理员,则条件区域如此设置:编号 性别 年龄 受教育程度 岗位当前工资(元)受雇起薪(元) 受雇年份工作经历(月) 户口地别大学本科 管理员筛选文化程度为大学本科或岗位为管理员的员工则如此设置:应用 1:利用自动筛选选择男性员工;利用高级筛选选择当前工资在 3 万元以上的工人;利用高级筛选选择年龄在 40 岁以下或大学本科及以上的职工。2、数据排序:参见指导 P41将鼠标定位于待分析数据区域的任意位置;点击菜单“数据”排序后

4、,进入排序对话框;排序对话框中:主要关键字:排序变量。次要关键字:各总体单位排序变量取值相同时,若指定次要关键字,则按此排序,编号 性别 年龄 受教育程度 岗位当前工资(元)受雇起薪(元) 受雇年份工作经历(月) 户口地别大学本科管理员3否则按出现的先后顺序排。我的数据区域:选择参与排序的数据区域。有标题行,则数据区域第一行不参与排序,一般数据区域首行为变量名时如此选择。否则,无标题行,数据从第一行第一列开始排序。选项:指定升降序排列形式:次序、方向、方法,用于字符型数据的排序设置。应用 2:对加工零件数按照一定大小进行排序;对售后服务质量按照一定优劣进行排序。二、统计分组统计整理及分析结果的

5、编写通常在 word 文档中录入和编辑,只要能用 excel 生成相对规范的统计表和统计图,然后可以复制到 word 中进行美化排版即可。1、品质数据的简单分组选择菜单“数据”数据透视表和数据透视图,进入数据透视表操作向导对话框。第一步:按照向导默认即可,只生成数据透视表。第二步:选择源数据,返回 excel 文件选择包含变量名在内的整个数据库区域。第三步:设计透视表的内容和格式。透视表的显示位置:通常与原始数据放置在一起,透视表会占用一部分空间,所以最好与源数据相隔一定距离。选择源数据文件工作表的空白区域,随意定位一个空白单元格即可。布局:设计数据透视表的显示模式。拖放分组变量在行标题栏,系

6、统根据它的属性自动设置组数和类别。拖放同一分组变量到数据区域,系统会自动生成一次对应各组的数据,默认为计数,即汇总各组的频数。4再次拖放仍然执行相同操作,只要双击按钮,实验者可以根据需要进行修改,比如计算频率(双击后,进入修改界面,可以修改名称和汇总方式,点击“选项”拉开数据显示方式选择“占同列数据的百分比”即可)。其余操作按照默认即可。点击完成,分组表和普通统计表视觉上不大一致,选定已生产透视表的“数据”,右击后,选择“顺序移至列”即可。注意事项:(1)数据透视表是根据源数据生成,一旦源数据变化,则分组结果随时改变。排版过程中,最好是选择性粘贴(值)然后再排版则表中数值不再变动。(2)如果统

7、计数据为讲究顺序的品质数据,则最好对对数据进行编码排列,然后对编码后的数据再分组,系统就不会排乱顺序。或者先让系统自行排序,然后将分组结果选择性粘贴,操作者自行修改组别排列。Excel 函数和公式均以“=”开头。函数格式:=函数名(参数),以等号开始,以回车结束;如果参数有多个,参数之间必须用“,”隔开。输入函数最好在英文状态下输入,防止错误,而且还可以提示操作者函数的输入语法。1)讲究顺序的数据,在编码时利用逻辑判断函数:=if(logic-test,value-if-true,value-if-false)比如:某职工的文化程度存放在单元格 a1 中,令高中及以下=1,大学本科=2,研究生

8、=3,编码后的数据存放在 b1 单元格,则在 b1 中输入“=if(a1=高中及以下,1,if(a1= 大学本科,2,3)” ,然后回车,则自动赋值。如果编码是数字赋值,注意透视表中的数据显示方式默认是求和汇总,需修改为计数。2)选择性粘贴的操作。当采用数据透视表生成统计分组结果以后,这里面的一切输出结果都是嵌套了数据5宏工具,原始数据发生变化,结果会随时变化,并且操作者不能单独对其中的某些数据进行编辑修改。为此,当需要对整理结果进行某些编辑时,通常只将结果复制出来,而不需要复制其内含的公式和格式等内容。鼠标点击“复制”按钮,然后定位要复制的目标位置后,在“粘贴”按钮右侧有一个下拉小箭头,点开

9、以后选择“值”或者在菜单“编辑”里面点击“选择性粘贴”,在打开的对话框中选择“数值”。执行此项操作,表示只对原数据粘贴其结果,其他都不保留。应用 3:对工人分别根据户口类别和文化程度进行分组整理;对售后服务质量进行分组整理。2、数值数据的单项式分组按分组标志采用数据透视表,基本操作同前,只是要注意修改布局对话框中的默认数据显示方式为计数。应用 4:编制中学生年龄分组表3、数值数据的组距式分组:参见实验指导 P42-44组距式分组由于组数和组距、组限的设计主观性比较强,其格式需要研究人员自行编制,主要通过 excel 函数来完成。具体操作顺序按照统计分组理论顺序进行。(1)组数设计:组数 Stu

10、rges 经验公式 1+log(总体单位数)/log(2)、总体单位数 count(数据区域)(2)计算极差:最大值 max(数据区域)、最小值 min(数据区域)(3)等距组距设计:极差/组距,此计算结果通常不是整 5 或 10 的倍数,可人为认定。(4)分组结构设计:选择存放分组数据的一个空白区域,设定第一组的结构,然后利用公式填充,注意绝对引用与相对引用的关系,合理利用数学逻辑可以快速提高分组效率。(5)汇总频数:频数函数 frequency(数据区域,临界值)。输入此公式前,必须提前设定临界值,临界值用于判定总体单位的组别归属,遵循不重不漏和上限不在内原则,通常设置为比原始数据精度更精

11、确一些,同时比组上限稍小一些的数值。选定存放各组频数的所有组单元格后挪开鼠标,不要点击。因为首行是反显的,直接利用键盘输入 frequency 函数即可。该函数是一次生成所有组的频数,函数确认方法:Ctrl+Shift+Enter,三个键同时摁下,表示函数输入完毕,返回运算结果。 应用 5:编制工人加工零件数等距分组表;根据职工当前工资数据,编制科学的统计分组表。6实验二:统计图表的绘制实验目的:运用 excel 进行统计表的排版设计,会生成合适反映数据特征的美观的各类统计图。实验要求:独立完成课堂各类习题和练习,按要求完成实验内容。实验形式:教师演示、指导实验内容:熟练绘制统计表,能绘制出相

12、对专业地道的统计表;根据数据反映特征,熟练选择绘制合适的统计图形,掌握条形图、直方图、饼图、折线图等图形的绘制方法。一、统计表的绘制及编辑:参见指导 P511、统计表的结构:一张完整的统计表一般包含总标题、行标题、列标题、数据主体。通常一个 excel 工作簿会自动打开 3 张工作表,默认名称为 sheet1-3,用户可以双击更改名称,可以拖动表的存放位置,也添加或删减工作表。在工作表名称状态栏处鼠标定位添加或删减工作表,然后右击,即可快捷完成。一般,统计表的信息如果不是系统自动生成,则用户自行设计录入。系统自动生成的,则根据统计表的理论要求进行编辑即可。如果统计整理得到的各类分组表,最好是将

13、分组结果进行“复制选择性粘贴值”以后,再进行编辑比较方便。2、统计表的要求:左右开口,上下封口,顶线和底线加粗。统计表的各类边框及线的粗细利用菜单“格式单元格”操作,进入格式设置对话框,点击边框,有多种样式的边框格式可供选择。3、统计表的打印设置:如果统计数据特别多,需要打印输出,一张纸无法容纳或者需要换页输出打印,这时就需要打印设置。通过菜单“文件”来执行。(1)页面设置:用于设定打印页面纸张、页边距、页眉页脚、工作表打印选项等。这种7设置一般在其他设置完成后,在打印预览对话框中再选择。(2)打印区域:鼠标选中需打印输出的数据区域,然后点击菜单“文件打印区域设置打印区域”即可。(3)打印预览

14、。用于提前预览打印效果,防止打印效果不如人意或者错误,造成浪费。选择菜单“文件打印预览”或常用工具里的打印预览按钮,进入预览界面。1)设置:即页面设置,页面卡用于选择输出纸张大小及输出方向。页边距卡用于设计上下左右及页眉页脚的边距,表格在页面上是否居中放置。页眉/页脚卡用于设计表格外的文本内容。如统计表的总标题我们一般放于页眉位置,表外附加说明和页码放置于页脚。比如:点击自定义页眉,进入页眉设计对话框,用户可以自行输入内容并选择合适的格式。工作表卡用于专门针对表格输出进行设计,比如打印网格线,多页打印时需要统一将输出表格的首行设计为统计表的首行内容或首列内容等等。2)页边距。选择此选项,页面会

15、自动按照用户设计的页边距显示出一系列边界线,用户可以随意拖放任意修改,直到满意。应用 1:选择 A4 纸张打印员工档案资料,要求自定义页眉为员工档案信息” ,自定义页脚为“第?页,共?页” ,表格居纸张正中,并打印网格线。二、统计图的绘制:参见指导 P60-75只要求大家就次数分布绘制最常用的统计图,关于其他功能的图形,我们在具体讲课中用到再给同学们讲解,所有统计图的基本操作几乎一样。主要区别在于具体图形类型8的绘制细节上要结合数据特点来选择数据区域,即数据“系列”的选择,这些系列在于区分开分类轴和数值轴即可,关于图形的美观程度,需要根据视觉效果再不断调整优化。次数分布图都是基于次数分布表来绘

16、制的,所以必须先分组,后作图。无论什么统计图,在利用 Excel 制作时,所有的图形都是在菜单“插入图表”选项下选择使用。进入图表制作向导对话框。1、利用图表向导绘制图形图表制作向导共分四个步骤,用于引导用户生成图形。第一步,选择图的类型。分为标准类型和自定义类型,常用的在标准类型中,自定义类型多是两个图形的组合。第二步,选择源数据。即指明图形是基于哪些数据生成。如果用于制作图形的数据相邻存放,可以直接在“数据区域”中选入;如果不相邻存放,则需要用“系列”来个性化自定义。系列:选择添加后,可以给系列命名,指定系列的值,生成图形后放于数值轴,一般是频数或频率。指定系列的分类轴,对应于组别。第三步

17、,图表选项。用户格式化一些图形结果需要显示的内容,比如横纵坐标的标题、表图同时显示、图例、绘图区的细节问题。9第四步,图的存放位置。为了保证图表一致,通常是作为对象插入。提醒:(1)在根据向导完成图表的初步绘制后,用户仍然可以对它修改编辑。(2)图表区:Excel 中用来存放图表的矩形区域,它包含绘图区和一切与图形有关的数据、标题、图例等标示。Excel 允许用户修改整个图表区中的文字、填充以及对象属性,我们通常修改“图表区格式”和“图表选项” 。A、选定图表区右击,选择“图表区格式” ,进入格式修改对话框,有“图案” (用于设定图表边框样式及颜色、区域的填充颜色) 、 “字体” (用于设置图

18、表中字体和字号,类似于单元格格式里的内容设置) 、 “属性” (用于设计图表的显示位置,一般不做修改)等三个选项卡。B、选定图表区右击,选择“图表选项” ,进入图表选项设置修改对话框。其基本操作等同于操作向导的第三步。一般用户在生成图形后,美化编辑过程中可以根据需要在此重新修改图表选项。(3)绘图区:Excel 中由纵横坐标轴所框定的矩形区域,专门用于存放图形的区域。饼图的绘图区为饼的外切正方形(体) 。当用户鼠标选定绘图区后,右击,选择“绘图区格式” ,可以对图形“图案”进行修改,类似于“图表区格式”中的“图案”选项卡。2、常见几种统计分组图形的绘制(1)饼图(pie chart):制作饼图

19、后,通常数据系列不需要显示,在第三步向导中选择图例不显示,数据系列中选中类别、百分比直接标示于扇形上即可。饼图对应的圆在整个图表区中较小时,点整个饼的外切正方形对应的角部区域即可拖放实现图的大小缩放。10应用 2:绘制广告类型饼图提示:根据频数和频率绘制的图形完全一样,只是图中的具体数据有差别。(2)条形图(Bar chart):做完条形图后,鼠标点击矩形条后右击,选中“数据系列格式” ,可以对各个矩形条进行编辑修改,诸如填充颜色,添加数值,分类间距等。应用 3:绘制员工受雇年份条形图提示:条形图既可以根据频数,也可以根据频率来绘制。(3)直方图(histogram):为简化起见,在条形图的基

20、础上,修改“数据系列格式” ,定义“选项”选项卡,将数据的分类间隔设为“0”即可。应用 4:绘制加工零件直方图提示:直方图通常只根据频率来绘制。(4)折线图(polygon):Excel 制作折线图前,首先在原始统计分组表两端人为添加两个频率为“0”的空白组。在图标插入向导中,选择“自定义类型”中,然后选择“线-柱图” ,分别设置两个同样的数据系列对应于折线图和条形图,然后将条形图间隔设为 0。应用 5:绘制加工零件折线图提示:折线图通常只根据频率来绘制。且定义 2 个数据系列时,分类轴为同样的数据区域(第一组和最后一组没有信息,中间各组为真实组数) ,数值轴为同样的数据区域(包含第一组频率=

21、0 和最后一组频率=0 以及中间真实的各组频率在内) 。(5)次数分布曲线:在图表插入向导中,选择图形的“自定义类型” ,然后选择“平滑直线图” ,剩余操作根据向导提示与其他图形类似。应用:绘制员工年龄次数分布曲线提示:分别按照员工年龄进行单项式分组和组距式分组以后,对两种结果分别绘制次数分布曲线,比较其差异。3、绘制统计图时的注意事项(1)通过选择恰当的图形类型、刻度、长宽比例等,使图形能够准确反映数据中包含的信息。时间一般绘在横轴,指标数据绘在纵轴。长宽比例要适当,其长宽比例大致为1110:7。(2)图形要尽量简明。图形应该突出所要传达的信息,不必要的标签、背景、网格线等会分散读者的注意力

22、。(3)图形应该有清楚的标题和必要的说明,明确图形的含义、计量单位、坐标轴代表的变量、资料来源等等。(4)反复加工和修改是获得优秀统计图形的重要步骤。统计软件给出的统计图形没有多少可以不加修改而直接应用。12实验三:描述统计实验目的:利用 Excel 统计函数和一些基本的数学运算函数、公式进行描述统计指标的计算。利用 Excel 安装“数据分析”工具库,并输出各描述指标值,分析数据的分布特征。实验要求:熟练掌握各种描述统计指标的对应函数,计算诸如众数、中位数、四分位数、算术平均数、调和平均数、几何平均数、极差、方差、标准差等的相关操作。运用“数据分析”工具库计算的统计指标,分析数据的基本分布特

23、征。实验形式:教师演示、指导实验内容:在计算各类描述指标过程中,我们会用到常用的数学或统计函数,以及根据运算逻辑关系自行定义输入公式。函数格式:=函数名(参数 1,参数 2,)输入各类函数的参数时,一般可以鼠标拖动选择,或者手动输入数据区域。手动输入时,用数据范围的矩形对角线所对应的单元格定义即可,中间用“:”链接,表示“到” 。如:对单元格 a1 到 b3 所围成的矩形区域中的数据求和,直接输入:=sum(a1:b3) ,回车确认即可返回合计值。一、集中趋势指标的计算:P84-87计算集中趋势的函数名称有众数 mode、中位数 median、四分位数 quartile、算术平均数 avera

24、ge、调和平均数 harmean、几何平均数 geomean 等几个,但在具体计算过程中,需要根据数据是否经过整理分组选择合适的算法。如果数据未经过任何整理,可以直接通过函数计算结果。如果是分组数据,则需要按照理论分析一步步的运用公式进行计算。1、众数(1)未整理数据: mode(number1,number2,) ,将待计算的数据区域作为参数,就可以得到指定数据的众数。(2)分组整理数据:先判断众数组,然后根据分组类型,直接确定或采用近似公式计算。2、中位数(1)未整理数据:median(number1,number2,) ,将待计算的数据区域作为参数,就可以得到指定数据的中位数。(2)分组

25、整理数据:先利用累积频数判断中位数所在组,然后根据分组类型,直接判断或采用近似公式计算。计算向上累积频数,由于每组的累积频数结果都是从第一组开始累积,因此,利用求和函数 sum 时,把起始单元格必须设置成绝对引用格式,即用“$”将行、列给固定。3、四分位数(1)未整理数据:quartile(array,quart) ,将待计算的数据区域作为一个数组,指定分位数的位次 quart。若 quart=0,则输出最小值;quart=1,输出下四分位数;quart=2,输出中位数;quart=3,输出上四分位数;quart=4,输出最大值。(2)分组整理数据:先利用累积频数判断四位数所在组,然后根据分组

26、类型,直接判断或采用近似公式计算,过程等同于中位数。 4、均值(1)算术平均数131)未整理数据:average(number1,number2,) ,将待计算的数据区域作为参数,就可以得到指定数据的算术平均数。2)分组整理数据:使用加权算术平均。利用乘积求和函数 sumproduct(array1,array2, )计算总体标志值总量。将各组变量值设置为 array1,各组对应的频数设置为 array2,可以计算两个数组的对应数据的乘积和,对应于加权算术平均数的分子部分 。xf然后利用除法公式计算平均数。注意:单项式分组中,x 为各组变量值;组距式分组中, x 为各组组中值,需要事先添加计算

27、出组中值。(2)调和平均数1)未整理数据:harmean(number1,number2,) ,将待计算的数据区域作为参数,就可以得到指定数据的调和平均数。2)分组整理数据:使用加权调和平均。利用乘积求和函数 sumproduct(array1,array2, ) ,将各组变量值(同样对于组距式分组必须先计算组中值)的倒数设置为 array1,各组对应的频数设置为 array2,可以计算两个数组的对应数据的乘积和,对应于加权调和平均数的分母部分 。mx然后利用除法公式计算平均数。(3)几何平均数1)未整理数据: geomean(number1,number2,) ,将待计算的数据区域作为参数,

28、就可以得到指定数据的几何平均数。2)分组整理数据:使用加权几何平均。利用幂函数power(number,power) ,以每组的变量值为底,频数为幂指数,分组别计算出各组的变量值总量(同样对于组距式分组必须先计算组中值) ,对应于每组的 。ifx然后利用乘积函数 product(number1,number2,) ,将前一步的幂函数运算结果选入作为参数,计算总体总量。然后再利用 power()函数,以总频数的倒数为幂指数,计算得到几何平均数。(二)离散程度指标的计算计算离散程度的函数名称有总体方差 varp、总体标准差 stdevp、样本方差 var、样本标准差 stdev。如果数据未经过任何

29、整理,可以直接通过函数计算结果。如果是分组数据,则需要按照理论分析一步步的运用公式进行计算。1、极差1)未分组数据:利用 max(number1,number2,) 、min(number1,number2,) ,以数据区域作为参数,分别求出数据的最大值和最小值,然后做差计算得到。2)分组数据:理论上用最大值组的上限-最小值组的下限,但实际上计算没有意义2、四分位距,利用定义上下四分位数做差即可。3、方差或标准差(1)未分组数据:判断数据是总体数据还是样本数据。1)总体数据。总体方差:varp(number1,number2,) ,将总体数据区域作为参数。总体标准差:stdevp(number

30、1,number2,) ,将总体数据区域作为参数,得到总体标准差。或者将总体方差计算得到,然后用平方根函数 sqrt(number) ,对总体方差开平方得到总体标准差。142)样本数据。样本方差:var(number1,number2,) ,将样本数据区域作为参数,得到样本方差。样本标准差:stdev(number1,number2,) ,将样本数据区域作为参数,得到样本标准差。或者将样本方差计算得到,然后用平方根函数 sqrt(number) ,对样本方差开平方得到样本标准差。(2)分组数据:判断数据是总体数据还是样本数据,结合方差的计算公式,类似于加权算术平均数的计算过程。方差得到,然后利用平方根函数求得标准差。4、标准差系数。直接用公式计算:标准差除以算术平均数(三)统计描述指标的统一展示:P81-83、P87查看工具菜单下是否有“数据分析”子菜单。一般,office 软件选择典型安装时,都没有安装。若没有,在此菜单下点击“加载宏” ,然后加载“分析工具库” ,加载成功之后就可以找到数据分析子菜单了,然后 Excel 就配有了专门用于统计分析的宏。首先将所有原始数据排放在同一列(行) ,然后调用“工具数据分析描述统计” ,根据需要选用输出项目,常用的描述指标均有,其输出结果与我们前面采用函数计算的结果一致。注:此数据分析的宏只适用于数值型数据。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报