1、第三章 统计整理,学习目标:1.掌握设计统计分组的基本原则和正确选择分组标志的原则;掌握按标志特征分组和按标志多少分组的方法;掌握组距变量数列的编制步骤。2.熟悉统计分组的概念和分组类型;熟悉组距数列设计的几个概念;熟悉有关频数分布的概念和分布数列的种类。3.了解数据整理的意义和内容,了解统计分组的作用。,第一节 统计整理的意义和步骤,一、统计整理意义(一)概念统计整理是根据统计研究的目的和要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化、科学化,从而得到表现总体特征的综合统计资料的统计过程。另外,对于整理过的初级资料进行再整理,也属于统计整理。,(二)意义1.统计整理是统
2、计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。2.资料整理得是否正确,直接决定着整个统计研究任务的完成。不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值,得不到正确的结论。,二、统计整理的步骤,(一)设计和编制统计资料整理方案 (二)对原始资料进行审查1.逻辑审查:主要是从定性的角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。2.计算审查:是指审查调查表中的各项数据在计算结果和计算方法上有无错误。如各分项数字之和是否等于相应的合计数,各结构之和是否等于1或100%等。,(三)对各项原始资料进行分组并综合汇总 (四)将
3、汇总的结果以统计表或统计图的形式表现出来 (五)将统计资料进行系统积累,第二节 统计分组,一、统计分组的概念统计分组是根据研究任务的要求和现象总体内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计分析方法。目的是揭示各组之间性质差异。,二、统计分组的作用1.零星分散的统计资料,经过统计分组后,可以发现其特点及规律性。2.把复杂的现象总体区分为各个性质不同的组成部分,以认识现象之间质的差别。3.反映现象总体的内部结构及其变化。4.分析现象之间的相互依存关系。,三、选择分组标志的原则统计分组的关键问题是正确地选择分组标志与划分各组界限。选择分组标志的原则:1.要根据研究的目的与任务选
4、择分组标志。2.要选择能够反映事物本质或主要特征的标志。3.要根据现象的历史条件及经济条件来选择。,四、统计分组的方法1.根据分组标志的性质不同分为两种 (1)按品质标志分组例如按性别这一品质标志可将班级的学生分为两组。(2)按数量标志分组如按成绩这一数量标志可以将班级学生分为三组:60分以下为一组,6080分为一组,80分以上为一组。,2.根据分组标志的多少分为两种 (1)简单分组按一个分组标志分组。(2)复合分组按两个或两个以上标志重叠分组。如按性别可以将人口分为两组,在此基础上又可以按年龄将各组的人分为少年组、青年组、中年组和老年组。,第三节 分配数列,一、分配数列的概念与种类1.概念将
5、总体按某一标志进行分组,并按一定顺序排列出每组的总体单位数,所得到的数列称为分配数列,又称次数分布。,2.关于分配数列的几个常识(1)分布在各组的总体单位数叫次数,又称频数。(2)各组次数和总次数之比称为比率,又称频率。分配数列根据分组标志的性质不同,可以分为品质数列与变量数列。,(一)品质数列它是按品质标志分组形成的、用来观察总体单位中不同属性的单位分布情况的数列。品质数列的编制比较简单,但要注意在分组时应包括分组标志的所有表现,不能有遗漏,各种表现要相互独立,不得相融。,(二)变量数列它是按数量标志分组形成的、用来观察总体中不同变量值在各组的分布情况的数列。由于变量分为连续型变量和离散型变
6、量,对这两类变量,在编制变量数列,其方法是不相同的:(1)离散型变量一般按单项式分组,即将每个变量值作为一组,编制单项式变量数列。(2)连续型变量一般只能按组距式分组,即以变量值的一定变动范围为一组,编制组距式变量数列。,组距式变量数列的编制的步骤:第一步,计算全距;第二步,确定组数和组距;第三步,确定组限和组中值;第四步,计算各组次数和组中值。,在组距式变量数列中,需要明确以下各要素。1.组限 组距式变量数列中,各组的界限的变量值称为组限。组限分为上限和下限。2.组距组距=上限下限组距式变量数列有等距和异距之分。等距变量数列适用于现象的变动比较均匀的情况,如收入水平分组、单位面积农产品产量分
7、组等。而现象变动不均匀或是为了特定的研究目的时,常采用异距分组。如人口的年龄分组常采用异距分组。,3.组中值组中值是指每组下限与上限之间的中点数值。组中值=,开口组的组中值计算公式:缺下限的最小组的组中值=该组上限缺上限的最大组的组中值=该组下限,组距式分组掩盖了各组标志值的分布情况,为了反映各组标志值的一般水平,通常用组中值 作为各组的代表值。利用组中值的前提,是假定各组变量值的分布是均匀的或对称的,但在实际工作中大多数资料并非如此,因此,组中值作为各组的代表值只是一个近似值。以表3-1为例。,表3-1 某企业职工按工资额分组表,在某一变量数列中标志值构成的数列表示标志值的变动幅度,而频数构
8、成的数列则表示相应标志值的作用程度。次数分布是统计描述的一种重要方法,在自然或社会现象中,有许多变量分布是属于正态分布。例如人体的身高、体重、粮食单产等。这类分布以标志变量的平均值为中心,沿着对称轴向两边发展,愈接近中心,分配的次数愈多,愈远离中心,分配的次数愈少,形成“两头小,中间大”的钟形的分布曲线。,表33 某车间50名工人日加工零件数分组表,向上累计是将各组频数和频率从变量值低的组向变量值高的组累计,故称为向上累计。反之为向下累计。累计频数和累计频率可以更简便地概括总体各单位的分布特征。,第四节 统计表,一、统计表统计调查得来大量原始资料,经过汇总整理之后,按照规定的要求填在相应的表格
9、内,这种填有统计资料的表格叫做统计表。,作用:(1)使原始资料转变为综合反映总体数量特征的表格资料,使统计资料的表现条理化、系统化和标准化。(2)能够科学合理地组织统计资料,便于比较对照、分析研究现象的规模、速度和比例关系。,二、统计表的结构 (一)从统计表的形式看,由四部分构成(1)总标题:它是统计表的名称,用以概括表中统计资料的主要内容。(2)横行标题:它是各组的名称,反映总体单位的分组情况。(3)纵栏标题:它是分组标志或指标的名称,说明纵栏所列各项资料的内容。(4)数字资料:也称指标数值。 (二)从内容上看,统计表分为两部分(1)主词(2)宾词,2004 年 固 定 资 产 投 资 情
10、况,纵栏标题,数字资料,主 词 栏,宾 词 栏,总 标 题,横行标题,三、统计表的种类按主词是否分组和分组的程度,分为简单表、分组表和复合表。(1)简单表:主词未经任何分组的统计表。(2)分组表:主词按一个分组标志进行分组的统计表。(3)复合表:主词按两个或两个以上标志进行复合分组的统计表。,四、统计表的编制规则(1)统计表的各种标题,特别是总标题的表达,应该十分简明、确切,能够概括地反映出统计表的基本的内容,应该标出资料所属时间和空间。(2)统计表一般采用开口式。(3)栏数多时,一般要加以编号。(4)数字要填写整齐,对准位数。(5)“合计”栏的填写要注意。最后一行,最前一栏。(6)计量单位。(7)加注说明和注解的位置。,