1、第二章 统计调查与整理,一、统计调查的意义,第一节 统计调查的内容与方法,统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的过程。,二 统计调查的基本要求,准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。,三 统计调查的设计(即统计调查方案),1.确定调查的目的 即为什么调查,例:第五次全国人口普查目的:为了科学地制定国民经济和社会发展战略与规划,制定人口政策、统筹安排人民的物质和文化生活,实现人口与资源、环境的协调发展。,2.确定调查对象和调查单位 即向谁做调查,调查对象就是我们需要进行研究的总体范
2、围,即调查总体。它是由性质相同的许多调查单位所组成的。 作为调查单位乃是进行登记的标志表现的直接承担者。例:人口普查的调查单位是每一个人,3.拟订调查提纲和制定调查表 即用什么方法调查,拟订调查项目时要注意几个原则:,- 调查项目要少而精;- 调查项目含义要明确; - 尽可能做到各个调查项目之间有一定的联系。,例:全国人口普查调查项目:,1982年(第三次):13项人记录、6项户记录,1990年(第四次):15项人记录、6项户记录,2000年(第五次):26项人记录、23项户记录,调查表分为:,把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;,将一
3、个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。,调查表亦即调查问卷。问卷调查具有经济性、广泛性、匿名性、客观性、灵活性等特点,在社会经济调查中被越来越多地运用。,4.确定调查时间 即在什么时间调查,要区别调查时间和调查期限的不同:,调查时间是指调查资料所属的时间(时点或时期); - 调查期限是指调查工作的起讫时间。,5.制定调查的组织实施计划,四 统计调查的方法,另外,还有电话调查、座谈会、个别深度访谈等方法。,第二节 统计调查的组织(即调查的种类),按调查的范围分,统计调查可以分为:全面调查和非全面调查;,按登记事物的连续性分,统计调查可以分为
4、:经常调查和一时调查;,按组织形式分,统计调查可以分为:统计报表和专门调查。,统计报表分为:,按报送周期长短不同统计报表分为:,分为普查、重点调查、抽样调查、典型调查。 普查为全面调查,后三者为非全面调查。,普查:为专门组织的一次性调查,用来调查属于一定时点的社会现象的总量。,重点调查:对重点单位进行调查。重点单位指的是这些单位数占总体的很少部分,而研究的标志总量占绝大部分(或绝大比重)。,抽样调查:按随机原则从总体中抽取一部分单位进行调查。,典型调查:先对总体进行分析,然后选择有代表性的单位进行调查。,第三节 统计分组,1.概念 把同质总体中的具有不同特点的 单位分开,从而正确地认识事物 的
5、本质及其规律性。,一 统计分组的概念和作用,2.作用 主要有三个方面:,揭露社会经济现象的类型,反映各类型的特点。, 类型分组,P41表2-4,说明社会经济现象的内部结构。, 结构分组,研究经济现象之间的依存关系。, 分析分组,某乡某种农作物的耕作深度与收获率的关系,二 选择分组标志的原则,根据研究问题的目的来选择,要选择最能反映被研究现象本质特征的标志,要结合现象所处的具体历史条件或经济条件来选择,品质标志分组 反映事物属性差异,三 分组标志的种类,1.按分组标志的特征不同分为 :,- 简单分组。如人口按性别分组。 - 复杂分组,亦称分类。如人口按职业分组。,- 单项式数量分组 运用于变量变
6、动幅度 小、项目少的分组。 - 组距式分组 运用于变量变动幅度大、项目多的分组。,数量标志分组 反映事物数量差异,三 分组标志的种类,2.按总体所选择标志的个数分 :,对社会经济现象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。,简单分组 按一个标志对总体进行分组 复合分组 按两个或两个以上标志对同 一总体进行分组,第四节 分配数列,一 分配数列的概念和种类,组别(变量) 次数(频数) 频率(比率),一 分配数列的概念和种类,某班学生的性别构成情况,组别 次数 频率, 品质数列, 变量数列,单项变量数列(单
7、项数列) 按每 个变量值分别列组编制数列,适用于 不连续变量或变量能以整数表示,其 变动范围不大时。,组距变量数列(组距数列) 按组 距分组编制数列。适用于连续变量或 变量可用小数表示,其变动范围较大 时。,某厂第二季度工人平均日产量,从另一角度看,变量数列分为:,连续变量数列 可有小数,采取组距式。,非连续变量数列 整数,采取单项式或组距式 (例:一个地区的 企业按职工人数分组)。,二 组距数列的编制,因数列两端组限形式不同分:,开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。 闭口式组距:例40-60分,90-100分。,组距=上限-下限,1.确定组距和组数,若将考试成绩
8、仅分为不及格与及格两组, 则可编成如下组距数列:,某班学生统计学考试成绩表,若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。,某班学生统计学考试成绩表,2.确定组限和组中值, 关于组限问题,已知组距为5,组数为7,最大值39,最小值5,怎样分组?,按分法(c)较合适,适用于越大越好的变量,如产值。,适用于越小越好的变量,如成本。,对连续变量,组数也要连续。在登记次数时,习惯上遵守:,对不连续变量,组与组间是间断的。,闭口式分组的组中值求法:,开口式分组的组中值求法:,三 次数分布的特征,1.次数分布的表示方法, 表示法 即用统计表来表示次数分布。,某班统计学考试成绩次数分配,以下累
9、计次数(上限)即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。,以上累计次数(下限)即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。, 图示法,即用统计图来表示次数分布,直方图(或次数分配曲线图),仍以上例考试成绩数据,画成如下直方图:,直方图,折线图,在直方图的基础上连接各条形顶边的中点成折线图。 如下图红笔围成的,即为次数分配曲线图:,折线图还可用来表示累计次数分布(仍以上例数据):,曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。,向下累计,向上累计,一般次数分布呈正态分布曲线,或称正态曲线,对称型,Y,Y,右偏型 (上偏型),
10、左偏型 (下偏型),X,X,很多是偏态分布曲线,或称偏态曲线,还有其他形态,J型分配曲线,U型分配曲线,双峰曲线,第五节 统计表,一 统计表的结构和内容,某年某月某公司各企业劳动生产率统计表 单位_,横 行 标 题,主词,宾词,总标题,纵栏标题,数据资料 (指标数值),从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。,从内容上看:统计表由主词和宾词两部分构成。,说明总体或总体的分组。,用哪些指标数值来说明总体或总体的分组。,二 统计表的特点,开口式 上下有基线 编号:主词一般按A、B、C,宾词按1、2、3 有计量单位 表中不允许有空格:若不需要此资料则用“-”;暂缺某资料则用“”,三 统计表的分类,四 统计表的编制原则,1. 总标题须简明扼要表达出全表的内容; 2. 各标题要确切反映表的内容,且表格安排合理; 3. 指标数值要位数对齐,合计或总计一般放在表的尾部; 4. 对指标内容作必要说明时,可加注在表的下方; 5. 表的上下边线(基线)用粗实线或双线,表的两边是开口式; 6. 纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。 总原则:合理、科学、实用、简练、美观。,End of Chapter 2,