1、1,第三章 统 计 整 理,教 学 目 的,统计调查搜集上来的资料,不论是哪一种类型的资料 都必须经过整理才能进一步进行分析。资料的类型不 同,研究的目的不同,资料整理的方法也不同。通过 本章的学习,要求掌握各种不同类型资料的整理方法、 整理原则、以及一些相关的概念,并能够利用所学的 方法对所给的实际资料按照研究目的的要求进行整理。,第三章 统计整理,2,在学习过程中主要解决以下几个问题,统计整理的意义和方法,统计分组的含义和种类,统计分组的方法,统计分布和分配数列的编制,统计表的结构和种类,第三章 统计整理,3,第三章 统计整理,第一节 统计整理的概念、原则和步骤 第二节 统计分组 第三节
2、次数分布 第四节 统计表,第三章 统计整理,4,第一节 统计整理的概念、原则和步骤 (1),一、统计整理的概念和意义 二、统计整理的方法 三、统计整理的原则和步骤 四、统计整理的组织形式,掌握四个问题,第三章 统计整理,5,一、统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。,二、统计整理的方法:分组、汇总、编表,第一节 统计整理的概念、原则和步骤 (2),第三章 统计整理,6,三、统计整理的原则和步骤,(一)原则:目的性原则;联系性原则;简明性原则 (二)步骤 1、设计和编制统计资料的汇总方案; 2、对原始资料进行审核; 3、用一定的组
3、织形式和方法对原始资料进行分组、汇总和计算; 4、对整理后的资料进行审核; 5、编制统计表; 6、进行统计资料汇编,系统的积累历史资料。,第一节 统计整理的概念、原则和步骤 (3),第三章 统计整理,7,调查资料的检查,准确性 完整性 及时性,准确性检查就是对调查误差的检查,登记性误差,代表性误差,由于错误判断事实或错误登记事实而发生的误差。这种误差可以避免,根据样本单位的数量特征推断总体数量特征时产生的误差。这种误差不可避免,逻辑检查:内容是否合理,有无矛盾,是否符合实际;,检查方法,第三章 统计整理,计算检查:数字有无差错,指标计算方法是否恰当,计算单位是否正确,指标之间平衡关系是否保持。
4、,8,第一节 统计整理的概念、原则和步骤(4),四、统计整理的组织形式 1、逐级汇总:自下而上一级一级地汇总本地区、本系统、本单位的调查资料。 2、集中汇总:把全部调查资料集中在一个机关或最高统计机关进行汇总。 3、综合汇总:对各地区和各级都需要的基本资料进行逐级汇总,对全国的总的数字和其他需要在全国范围内进行加工的资料或本系统的全面资料则实行集中汇总。,第三章 统计整理,9,第二节 统计分组(1),一 统计分组的概念统计分组(Statistical classification)就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。,统计分组要达 到这样的要求,同
5、一组内的单位性质相同,不 同组所包括的单位性质相异。 (组内同质性,组间差异性),第三章 统计整理,10,分组前,分组后,25,33,42,第三章 统计整理,统计分组图示,11,第二节 统计分组(2),二 作用p.40 (一)划分现象的类型 (二)揭示现象的内部结构 (三)分析现象之间的依存关系 三 分组标志的选择p.43 (一)根据统计研究的目的,选择反映事物本质的标志;例如: (二)结合具体时间地点条件来选择反映事物本质的标志。,第三章 统计整理,17,12,根据国务院的决定,继1996年第一次全国基本单位普查之后,我国于2001年进行了第二次全国基本单位普查。这次普查的标准时点为2001
6、年12月31日,普查对象为中华人民共和国境内除城乡住户和个体工商户以外的所有法人单位及其所属的产业活动单位。 对普查数据可以作如下一些分类:,分类一:按东中西部地区的分组,第三章 统计整理,13,分类二:按企业组织形式分组,第三章 统计整理,14,分类三:按营业规模分组,第三章 统计整理,15,分类四:按资产规模分组,11,第三章 统计整理,16,注一法人单位:是指依法成立,有自己的名称、组织机构和场所,能够独立承担民事责任;独立拥有和使用(或授权使用)资产,承担负债,有权与其他单位签订合同;会计上独立核算,能够编制资产负债表的单位。注二产业活动单位:是指在一个场所从事一种或主要从事一种社会经
7、济活动;相对独立组织生产经营或业务活动;能够掌握收入和支出等业务核算资料的单位。产业活动单位附属于法人单位。注三东、中、西部的划分:东部包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、广西、海南省;中部包括山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南省;西部包括重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆。,返回,第三章 统计整理,17,第二节 统计分组(3),四 统计分组及分组体系 (一)简单分组和平行分组体系p.44 (二)复合分组和复合分组体系 五 统计分组方法 (一)按品质标志分组 (二)按数量标志分组,第三章 统计整理,18,品质 分组 方法
8、,变量 分组 方法,以一个变量值代表一组。如:学生按报考科目分组等。这种分组适用于离散型变量,且变量值的个数较少的情况。,以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。,按品质标志对资料进行分组。这种分组有些比较简单, 有些非常复杂,复杂的品质分组称为分类。如:人口 按性别分组、按职业分组、国民经济按行业分组、等。,单项式 分 组,组距式 分 组,在进行组距分组时,会涉及到一些问题,包括:,等距分组和不等距分组、组限、组中值。,第二节 统计分组(4),第三章 统计整理,19,第三节 次数分布(1),一 次数分布的概念p.46在统计分组的
9、基础上,将总体中的所有单位按组归类整理,形成总体中各个单位在各组间的分布,就叫次数分布或次数分配。它由两部分组成:总体所分的各个组(的名称)和各组所拥有的单位数(次数或频数)。 二 分配数列(Distribution series)的种类 (一)品质数列只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。,第三章 统计整理,20,第三节 次数分布(2),如下例:,第三章 统计整理,各组名称,次数或频数,比率或频率,21,按数量标志分组形成为变量数列。 1、单项数列是总体按单项式分组而形成的变量数列,每个变量值是一个组,顺序排列。,(二)变量数列(单项数列和组距数列),第三
10、节 次数分布(3),变量,次数或频数,比率或频率,第三章 统计整理,22,2、组距数列是总体按组距式分组而形成的变量数列,每个组是由若干个变量值形成的区间表示,顺序排列。,次数和频率的大小反映了各组标志值对总体标志水平所起的 作用的大小。频率:各组的频率大于0小于1,各组的频率总 和等于1。,第三节 次数分布(4),第三章 统计整理,23,三、累计频数或频率分配数列的编制方法,通过累计频数分配数列可以反映累计到某一组出现的总次 数或总频率。想一想:第四组的累计结果说明什么问题?,2,7,21,52,117,169,192,200,1.0,3.5,10.5,26.0,58.5,84.5,96.0
11、,100,8,31,83,148,179,193,198,200,4.0,15.5,41.5,74.0,89.5,96.5,99.0,100,第三节 次数分布(5),第三章 统计整理,24,第三节 次数分布(6),四 影响次数分布的要素(组距数列的编制) (一)组距与组数 组距=本组上限本组下限=本组下限前组下限 (二)等距分组和异距分组,等距 分组,各组组距均相等。如:1020,2030,3040 等。组距为10。这种分组适用于均匀分布的总体。,异距 分组,各组组距不一定相等。如:1020,2050, 5060,6070等。其中第二组与其它各组 组距不同。这种分组适用于资料分布离差较 大或特
12、殊的研究目的。,第三章 统计整理,25,第三节 次数分布(7),(三)组限和组中值 1、组限。组限就是每一组两端的数值。每一组的起点值称为下限,每一组的终点值称为上限。确定组限的方法有两种:间断式确定组限和重叠式确定组限。 2、组中值。每组上限与下限之间的中点数值,代表各组变量值的一般水平,是各组的假定平均数。 闭口组组中值的计算:组中值=(上限+下限)/2 开口组组中值的计算: 缺下限:组中值本组上限相邻组组距/2 缺上限:组中值本组下限相邻组组距/2,第三章 统计整理,26,实例1:某保险公司100名营销人员的佣金资料如下,第三章 统计整理,27,根据上述原始资料编制单项式变量数列如下,从
13、这一分配数列可以看出,佣金在520元以下和820元以上的人数较少,大部分集中在520-760元之间,但由于分组较多,各组分配规律并不明显。,第三章 统计整理,28,根据上述原始资料编制组距式变量数列如下,该分配数列明显表现出现象的分配规律:两头小中间大的次数分配。,第三章 统计整理,25,29,10,30,20,40,人数,元,营销人员佣金次数分配图,第三章 统计整理,30,实例2:某电脑公司某年前四个月各天的销售量数据如下(单位:台)。试对数据进行组距式分组。,31,确定组数:根据 Sturges 提出的经验公式得组数k为:,确定各组的组距:d( 237 141) 109.6 10,Stur
14、ges 提出的经验公式,有的书上表示为:d为组距,统计出各组的频数并整理成频数分布表,32,某电脑公司销售量分组表,30,33,直方图的绘制,某电脑公司销售量分布的直方图,34,折线图与直方图 下的面积相等!,140,150,210,某电脑公司销售量分布的折线图与曲线图,190,200,180,160,170,220,230,240,折线图与曲线图的绘制,35,第三节 次数分布(8),五 次数分布的特征 (一)次数分布的表示方法 1、表示法 2、图示法: (1)直方图,(2)折线图,(3)曲线图 (二)次数分布的主要特征 1、钟型分布,2、U型分布, 3、J型分布,4、水平分布,第三章 统计整
15、理,p.65作业1,36,频数分布的类型,对称分布,几种常见的频数分布,第四节 统计表 (1),一 统计表的概念统计表(Statistical table)是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式。广义的统计表包括统计工作各个阶段中使用的一切表格。狭义的统计表则专指作为统计资料整理工具,表现统计资料整理结果的表格。 二 统计表的作用p.57,第三章 统计整理,38,第四节 统计表 (2),三 统计表的构成 (一)统计表的形式结构 从形式来看,统计表由总标题、横行标题、纵栏标题、指标数值等四部分构成。 (二)统计表的内容结构 从内容看,统计表由主词和宾词两部分组成。,第三章 统计整
16、理,39,统计表的结构,行标题,列标题,数字资料,总标题,附加,40,第四节 统计表 (3),四 统计表的种类 (一)按作用分 1、调查表 2、汇总表或整理表 3、分析表 (二)按主词的分组情况分 1、简单表 2、分组表(简单分组表) 3、复合表(复合分组表),第三章 统计整理,41,第四节 统计表 (4),五、编制统计表应注意的问题p.60 (一)统计表的标题 (二)主词、宾词的排列顺序 (三)计量单位的使用 (四)填写数字的要求 (五)统计表的线条 (六)注解,第三章 统计整理,42,一、判断对错,1、对统计资料进行分组的目的就是为了区分各组单位之间质 的不同。( ),2、组中值是根据各组
17、上限和下限计算的平均值,所以它代表 了各组的平均分配次数。( ),3、分配数列的实质是把总体单位总量按照总体所分的组进行 分配。( ),4、某企业职工按文化程度分组形成的分配数列是一个单项式 分配数列。( ),5、对资料进行组距式分组,是假定变量值在各组内部的分布 是均匀的,所以这种分组会使资料的真实性受到损害。( ),6、任何一个分布都必须满足:各组的频率大于0,各组的频数 总和等于1或100%( ),7、统计分组后掩盖了各组内部各单位的差异,而突出了各组 之间单位的差异。( ),第三章 统计整理,43,二、单项选择题,1、统计整理的关键是( ) A、对调查资料进行审核 B、对调查资料进行统
18、计分组 C、对调查资料进行汇总 D、编制统计表,B,2、下列分组中属于按品质标志分组的是( ) A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组,B,3、有一个学生考试成绩为80分,在统计分组中,这个变量值 应归到( )组。 A、6070分 B、7080分 C、8090分 D、90100分,C,4、某主管局将下属企业先按轻、重工业分组,再按规模分组, 这种分组属于( )分组。 A、简单分组 B、复合分组 C、分析分组 D、结构分组,B,第三章 统计整理,44,三、多项选择题,B C D E,2、在次数分配数列中( ) A、总次数一定,频数和频率成反比
19、 B、各组的频数之和等于100 C、各组频率大于零,频率之和等于1 D、频率越小,则组的标志值所起的作用越小 E、频率表明各组标志值对总体的相对作用程度,C D E,、品质分配数列 、变量分配数列 、组距式变量分配数列 、等距变量分配数列 、次数分配数列,第三章 统计整理,45,1、_是统计工作的第三阶段,既是_的继续,又是_的前提。 2、统计整理包括对_和_两个部分的整理,主要是对_进行的整理工作 。 3、统计分组的关键问题在于_和_ 。按数量标志分组的结果形成_ 。 4、在组距数列中,影响次数分布的要素主要有_和_ 。 5、统计表从内容结构上看,是由_和_两部分构成。 6、对同一总体选择两个或两个以上标志层叠起来进行的分组叫做: _ 。,四、填空题,统计分析,原始资料,划分分组界限,组距,主词,复合分组,统计整理,统计调查,次级资料,原始资料,变量数列,确定分组标志,组限,宾词,第三章 统计整理,