收藏 分享(赏)

第三章 统计数据的整理与显示.ppt

上传人:kuailexingkong 文档编号:1706366 上传时间:2018-08-19 格式:PPT 页数:94 大小:2.82MB
下载 相关 举报
第三章 统计数据的整理与显示.ppt_第1页
第1页 / 共94页
第三章 统计数据的整理与显示.ppt_第2页
第2页 / 共94页
第三章 统计数据的整理与显示.ppt_第3页
第3页 / 共94页
第三章 统计数据的整理与显示.ppt_第4页
第4页 / 共94页
第三章 统计数据的整理与显示.ppt_第5页
第5页 / 共94页
点击查看更多>>
资源描述

1、第三章 统计数据的整理和显示,第一节 统计数据整理概述 第二节 统计数据分组 第三节 频数分布 第四节 统计数据的显示,数字不会说谎,但说谎的人会想出办法。 Charles Grosvenor,了解统计数据整理意义,熟悉整理的原则和内容 掌握分组的概念、特点和原则,了解分组的种类 掌握频数分布的概念,熟悉频数分布的编制方法 掌握组限的表现形式、组距和组中值的计算 掌握统计表的含义及其构成,熟悉统计表的编制,学习目的和要求,1,统计分组的方法 频数分布的编制,学习难点,3,一、统计整理概念统计整理就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作

2、过程。对已整理过的初级资料进行再整理,也属于统计整理。,第一节 统计数据整理概述,作用:承前启后、积累历史资料,原始资料,综合资料,总体单位资料,总体资料,数据整理,数据整理的作用,整理,调查,分析,例如: 一家评估机构为调查不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对照50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。下面的表格是记录的原始数据。,顾客购买饮料的品牌名称,购买饮料的频数分布,第一节 统计数据整理概述,数据整理原则,标准性,系统性,准确性,及时性,通俗性,二、统计整理原则,(一)数据整理的流程:(见教

3、材P34)1、数据的预处理(审核、筛选、编码、排序)2、数据分类、分组、汇总3、统计图、表及指标计算 (二)统计整理的内容:1、统计数据的筛选和判别2、统计数据的排序和分类3、统计数据的计算和研究,三、数据整理的流程和内容,数据审核原始数据 (raw data),完整性审核 应调查的单位或个体是否有遗漏 所有的调查项目或变量是否填写齐全 准确性审核 数据是否真实反映实际情况,内容是否符合实际 数据是否有错误,计算是否正确等,数据的审核原始数据 (raw data),审核数据准确性的方法 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象 主要用于对分类

4、和顺序据的审核 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错误 主要用于对数值型数据的审核,数据的审核二手数据 (second hand data),适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定数据是否符合自己分析研究的需要 时效性审核 尽可能使用最新的数据 确认是否有必要做进一步的加工整理,数据筛选与修正 (data filter),当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选 数据筛选的内容 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除,数

5、据排序 (data rank),按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成,数据排序,原始数据,本节重点 统计分组的概念、作用和原则 统计分组的方法本节难点 统计分组的方法,第二节 统计分组,一、什么是统计分组?,根据现象的特点和统计研究的目的要求,按照某个(或几个)标志把总体划分为若干不同性质的组,称为统计分组。,第二节 统计分组,统计分组是在总体内部进行的一种定性分类。 1、对总体而言是“分”,即将总体区分为性质相异的若干组成部分。 2、对个体

6、而言是“组”,即将性质相同的个体组合起来。(统计分组的关键是分组标志的选择),第二节 统计分组,标志的多少,分组类型,标志性质,属性分组,变量分组,复合分组,分组体系,简单分组,二、统计分组类型,游客按照性别分组,游客按性别、年龄分组,简单分组,复合分组,例如:对全国的工业企业进行 简单分组:按经济类型分:全民所有制企业、集体所有制企业、城乡个体企业按轻重工业分:重工业、轻工业按企业规模大小分:大型企业、中型企业、小型企业复合分组:,全民所有制,集体所有制,重工业,轻工业,重工业,轻工业,大型企业,中型企业,小型企业,分组体系,三、统计分组原则,第二节 统计分组,穷尽,互斥,同一,分组原则,四

7、、如何选择分组标志?,1.符合统计研究的目的和要求性别、年龄、籍贯、民族、高考入校成绩、身高、体重、爱好 等选哪一个来分组? 2.选择最能说明事物本质特征的标志 3.选择分组标志时,要考虑到现象发展的历史条件和经济条件。 4.分组界限要明确。,第二节 统计分组,如何划分各组界限?,属性分组时:,1.有时组限是自然形成的或比较明显,2.如存在属性之间的过渡形态,划分困难 如学生与非学生的划分、城乡划分,变量分组时,注意反映组间质的差别,五、统计分组有什么作用?,A.划分现象的类型,第二节 统计分组,好人,坏人,男人,女 人,婴儿,青 年,老人,B、揭示现象的内部结构,中国人口规模 与结构变化图,

8、3、分析现象间的依存关系,身高与体重有关系吗?,哇!,咦!,学习快乐,休息是为了走更长的路,累了,迷茫时,就坐下来,静静地,想想未来路的方向,20090323,感谢关注,再见,本节重点频数、频率变量数列本节难点频数分布的编制,第三节 频数分布,一、频数分布,频数分布:在统计分组的基础上,将总体所有的单位按某一标志进行归类、排列,并计算各组的单位数称为频数分布,或次数分布。又称频数分配数列。,第三节 频数分布,频数分布包含的两要素:组别和频数。频数分布的意义:是统计整理结果的一种重要的表现形式,也是统计分析的一种重要方法。可以说明总体单位分布特征、结构状况,可以研究标志的构成、平均水平及其变动规

9、律。,组别(变量) 次数(频数) 频率(比率),各组的单位数叫频数 ,记为f。各组的单位数与总体单位总数之比叫频率。,第三节 频数分布,二、频数分布的种类,品质频数分布:它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。,第三节 频数分布,张家界市游客消费抽样调查统计表,变量频数分布:是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。,变量,变 量 值,频数,频率,单项数列:是以一个变量值为一组编制的变量频数分布。,张家界游客逗留时间统计表,组距数列是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。,某公司员工月工资水平分组表,下开口组,上开口组,上限,

10、下限,频数,频率,组中值,组距,500,500,500,500,500,500,750,1250,3250,2250,1750,2750,等距数列,分组,下,上,某地区人口年龄构成情况,不等距数列,组距,组中值,1岁,4岁,11岁,7岁,30岁,30岁,2岁,0.5岁,2岁,5岁,12.5岁,21.5岁,40岁,70岁,试计算组距和组中值,累计频数指首先列出各组的组限,然后依次累计到本组为止的各组频数。累计频率指累计频数除以频数总和。,三、累积频数和累积频率,向上累计是将各组频数和频率由变量值低的组向变量值高的组累计。(是各组上限以下的累计频数或累计频率),向下累计是将各组频数和频率由变量值高

11、的组向变量值低的组累计(是各组下限以上的累计频数或累计频率),累计频数与累计频率,向上累计 人数,下,上,6,80,20,43,72,60,向下累计 人数,8,20,37,60,74,80,(一)品质频数分布的编制?,第三节 频数分布,作属性分组,划分各组界限,作属性分组,划分各组界限,2,1,例见教材P.47-48,四、频数分布数列的编制,1、单项数列的编制,适用范围,离散型变量,且变量值的种数较少时。,步 骤,将变量值排序 计算频数和频率 编制统计表,例见教材P.48-49,二、变量数列的编制,2、组距数列的编制,适 用 范 围,1、离散型变量,且变量值的种数较多时; 2、连续型变量。,编

12、制步骤,排序,确定最大值、最小值,计算全距,确定组距数列类型。等距OR不等距?,确定组数和组距。,确定组限和组限表示方法。同限OR异限?,计算频数、频率,编制统计表,组距数列 (要点),将变量值的一个区间作为一组 需要遵循“不重不漏”的原则 上组限不在内的原则 可采用等距分组,也可采用不等距分组,案例1、单项数列分组表的编制 (实例),117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127

13、 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,【例】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,单项数列分组表 (实例),组距数列分组表的编制 (例题分析),【例1】某电脑公司2002年前四个月各天的销售量数据(单位:台)。试对数据进行分组。,等距分组表 (上下组限重叠),等距分组表 (上下组限间断),等距分组表 (使用开口组),频数分布特征:由于现象总体的性质不同,其次数分布也不同。归纳起来主要有三种类型:,钟型分布、U型分布、 J型分布,三、频数分布的类型,钟型

14、分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口钟,如下图所示。,1、钟型分布,第三节 频数分布,U型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。如人口死亡率分布,人口总体中,幼儿和老人死亡率高,而中青年死亡率低。如下图(c)。,2、U型分布,U,U,U,J型分布有两种类型,一种是次数随着变量的增大而增多。另一种 呈反J型分布,即次数随着变量增大而减少。如下图(d),第三节 频数分布,3、J型分布,J,J,J,第三节 频数分布,本节重点统计表的结构 统计表的编制

15、本节难点统计表在编制规则,第四节 统计资料的显示,一、统计表:是以纵横交叉的线条组成的表格来表现统计数据的一种形式。,第四节 统计资料的显示,资料来源:国家统计年鉴整理(2008),第四节 统计资料的显示,2008年世界几个主要粮食和畜产品消费量 (斤/人月),总标题,纵栏标题,数字资料,横行标题,表外附加,第四节 统计资料的显示,按主词是否分组,简单表,分组表,复合表,按用途不同,整理表,调查表,分析表,统计表的种类,我国城乡居民家庭人均收入,简单表,主词,宾词,我国城乡居民生活质量差别,分 组 表,E系数 59%以上 贫困 50-59% 温饱 40-50% 小康 30-40% 富裕 低于3

16、0% 最富裕,复合表见教材P.54,第四节 统计资料的显示,科学 实用 简练 显目 美观,如何设计统计表?,设计原则,表式设计,第四节 统计资料的显示,表的上下端应以粗线绘制,表内纵横线以细线绘制,表格的左右两端一般不划线,采用“开口式”,统计表各纵列、横行须合计时,一般应将合计列在最后,如栏数较多,应按顺序编号,主词栏部分可编以甲乙等序号,宾词栏可编(1)(2)等序号,长方形表格,长与宽之间保持适当比例,内容设计,第四节 统计资料的显示,数字应填写整齐,对准位数。当数字因小而忽略不计时,填写为“0”;当缺某项资料时,用符号“”表示;没有数字时用符号“-”表示,注明资料来源。必要时,在统计表下

17、加注说明,当全表只有一种计量单位时,可将其写在表头右上方。如表中各栏指标数值计量单位不同,可在横行标题后添一列计量单位,标题设计应简明扼要,简练、准确,二、统计图,统计图:用来表现统计数据的各种几何图形、具体事物的形象、符号等。,数据类型及图示,1、分类数据的图示条形图 (bar Chart),用宽度相同的条形的高度或长短来表示各类别数据的图形 主要用于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图(column chart),定类数据整理频数分布表 (实例),【例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查

18、,其中的一个问题是“您比较关心下列哪一类广告?”1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,定类数据的图示条形图 (由 Excel 绘制的条形图),2、分类数据的图示饼图 (pie Chart),也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形 主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题,定类数据的图示圆形图 (由 Excel 绘制的圆形图),3、分组数据直方图 (histogram),用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布用横轴表示数据分组,纵轴表示频数或频率,各组

19、与相应的频数就形成了一个矩形,即直方图,分组数据的图示 (直方图的绘制),某电脑公司销售量分布的直方图,我一眼就看出来了,销售量在170180之间的天数最多!,4、分组数据折线图 (frequency polygon),折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉,分组数据的图示 (折线图的绘制),折线图与直方图 下的面积相等!,140,150,210,某电脑公司销售量分布的折线图,190,200,180,160,170,220,230,240,频数分配的类型,几种常见的频数分布,5、时间序列数据线图 (line plot),表示

20、时间序列数据趋势的图形 时间一般绘在横轴,数据绘在纵轴 图形的长宽比例大致为10 : 7 4. 一般情况下,纵轴数据下端应从“0”开始,以便于比较。,时间序列数据线图 (例题分析),【例】我国19912003年城乡居民家庭的人均收入数据如表。试绘制线图,时间序列数据线图 (例题分析),本章小结,频数分布,数据的显示,数据整理 概述,统计分组,一、判 断 对 错,1、对统计资料进行分组的目的就是为了区分各组单位之间质 的不同。( ),2、组中值是根据各组上限和下限计算的平均值,所以它代表 了各组的平均分配次数。( ),3、分配数列的实质是把总体单位总量按照总体所分的组进行 分配。( ),4、某企

21、业职工按文化程度分组形成的分配数列是一个单项式 分配数列。( ),5、对资料进行组距式分组,是假定变量值在各组内部的分布 是均匀的,所以这种分组会使资料的真实性受到损害。( ),6、任何一个分布都必须满足:各组的频率大于0,各组的频数 总和等于1或100%( ),7、统计分组后掩盖了各组内部各单位的差异,而突出了各组 之间单位的差异。( ),二、单 项 选 择 题,1、统计整理的关键是( ) A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表,B,2、下列分组中属于按品质标志分组的是( ) A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程

22、度分组 D、家庭按年收入分组,B,3、有一个学生考试成绩为80分,在统计分组中,这个变量值 应归到( )组。 A、6070分 B、7080分 C、8090分 D、90100分,C,4、某主管局将下属企业先按轻、重工业分组,再按规模分组, 这种分组属于( )分组。 A、简单分组 B、复合分组 C、分析分组 D、结构分组,B,三、多项选择题部分,B C D E,2、在次数分配数列中( ) A、总次数一定,频数和频率成反比 B、各组的频数之和等于100 C、各组频率大于零,频率之和等于1 D、频率越小,则组的标志值所起的作用越小 E、频率表明各组标志值对总体的相对作用程度,C D E,、品质分配数列 、变量分配数列 、组距式变量分配数列 、等距变量分配数列 、次数分配数列,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报