收藏 分享(赏)

统计学 第二章 统计数据的搜集与整理.ppt

上传人:dreamzhangning 文档编号:3351073 上传时间:2018-10-17 格式:PPT 页数:57 大小:879.50KB
下载 相关 举报
统计学 第二章 统计数据的搜集与整理.ppt_第1页
第1页 / 共57页
统计学 第二章 统计数据的搜集与整理.ppt_第2页
第2页 / 共57页
统计学 第二章 统计数据的搜集与整理.ppt_第3页
第3页 / 共57页
统计学 第二章 统计数据的搜集与整理.ppt_第4页
第4页 / 共57页
统计学 第二章 统计数据的搜集与整理.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、第二章 统计数据的搜集与整理,学习目的,本章主要掌握: 统计调查的意义和种类。 制定统计调查方案的几个问题,各种统计调查方式。 能够联系实际,制定合理的调查方案,并能够实际操作。 重点掌握统计分组的基本理论和方法,次数分布的编制,以及统计表、统计图的基本绘制方法。 结合微机操作,掌握统计整理方法。重点: 调查方案的设计 次数分布的编制,第二章 统计数据的搜集与整理,第一节 统计数据的搜集第二节 统计数据的整理,新华网北京9月4日电(记者吴晶晶、白瀛)国家汶川地震专家委员会副主任史培军4日在国务院新闻办公室举行的发布会上说,汶川地震造成直接经济损失8451亿元,其中四川的损失占到总损失的91.3

2、%,甘肃占5.8%,陕西占2.9%。 截至7月底,我国外汇资产余额为137690.05亿元,较上月增加了3440.61亿元人民币,折合成美元约503.7亿。,第一节 统计数据的搜集,一、 统计数据来源 (一)统计数据的直接来源统计数据的直接来源是指通过专门组织的调查和科学实验搜集数据。科学实验是取得自然科学数据的主要手段,如医学、生物学等的数据都是通过实验和观察取得的。 (二)统计数据的间接来源统计数据的间接来源是指对次级资料的搜集,即第二手资料的搜集。一般是搜集公开出版或公开报道的数据。,数据来源,数据来源,第一手资料,实验法,调查,观察,出版物,第二手资料,1统计调查的意义和要求统计调查,

3、是指根据统计研究的目的和要求,利用各种统计调查的方式方法,搜集统计资料的工作过程。统计调查作为统计工作的第二个阶段,在统计工作的整个过程中,担负着提供基础资料的任务,对统计资料的搜集,要求做到准确、及时和完整。,二、统计调查的种类社会经济现象错综复杂,根据不同的调查目的,需要采取不同的统计调查方式方法。统计调查的常见分类有:,是否包括全部调查单位,调查资料登记时间是否具有连续性,全面调查: 对调查对象中的全部单位一一加以调查。例如:统计报表、普查,非全面调查: 对调查对象中的部分单位进行调查。例如:抽样调查、典型调查和重点调查,经常性调查:随着调查对象的变化而进行的经常地、连续不断地登记调查。

4、,一次性调查:是间隔一段时间对调查对象进行的登记调查。例如:人口普查,资料搜集的方法不同,调查的组织方式不同,统计报表:按一定的表式和要求,自上而下统一布置,自下而上上报统计资料的一种统计调查方式方法,专门调查:是为了研究某些专门问题,由进行调查的单位专门组织的调查 。,直接观察法 采访法 报告法 问卷法,(一)统计调查方案的主要内容 1、调查目的 。统计调查中,首先要明确调查目的,既通过调查要解决什么问题。 2、调查对象、调查单位和报告单位调查对象又称调查总体,是我们所要研究事物的整体。调查单位就是调查对象范围内的各个个体单位。 报告单位又称填报单位,它是负责填报调查资料的单位。,二、 统计

5、调查方案的设计,3、调查项目和调查表 调查项目就是进行调查时向调查单位需要调查的问题。一般来说有多少个问题,便有多少个调查项目。,调查表 类 型,单一表:在一张表格上只登记一个调查单位的资料,可以容纳较多的调查项目。,一览表:在一张表上登记若干个调查单位的资料,调查的项目不能过多。,调查表制定以后,为了保证调查资料的科学性和统一性,需要编写填表说明和指标解释。,4调查时间和调查地点调查时间包括调查资料所属的时间和调查期限。(1)调查资料所属的时间。时期资料指事物在某一时期内发展过程的总量。例如,总产值、总产量 时点资料是指事物在某一时点上的水平。例如,工人数、商品库存量、耕地面积等 (2)调查

6、期限。调查期限是指调查工作的起止时间。包括搜集资料和报送资料的整个工作所需的时间。 调查地点是指登记调查资料的地点。在一般情况下,调查地点和调查单位所在地点是一致的。,5调查方式根据调查目的的不同,采取不同的调查方式。具体采用哪种调查方式,主要考虑人员、时间和经费等条件。一般来说,能够通过非全面调查解决的问题,不要进行全面调查。 6制定调查的组织实施计划 (1)建立调查队伍; (2)调查人员的组织和培训; (3)经费的预算和开支办法; (4)试点调查。,三、统计报表(一)统计报表统计报表是我国取得统计资料的一种基本的组织形式。它是基层企业、事业单位以及各级领导机关,按照国家有关部门统一规定的报

7、表格式、报告内容、报送时间和程序等,自下而上报送报表的一种调查方式。,统计报表的特点和优点: 可以在调查进行前把报表布置到基层填报单位,以便它们根据报表的要求,及时建立健全各种原始记录,使统计报表建立在可靠的基础上,做到资料准确、报送及时。 各级领导部门可以通过统计报表,经常了解经济和社会发展变化的情况 便于完整地积累资料,用来进行历史对比,较有系统地分析研究经济和社会发展变化的规律性。,统计报表分类,调查范围不同,报送周期长短不同,报送方式不同,填报单位和程序的不同,全面的统计报表 非全面的统计报表。,日报 旬报 月报 半年报 年报,邮寄报表 电讯报表,基层报表 综合报表。,电话 电报 传真

8、,(二)普查普查是为了某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。 特点: 普查通常是一次性的或周期性的 普查一般需要规定统一的标准调查时间 普查的数据一般比较准确 普查的使用范围比较窄,只能调查一些最基本及特定的现象。,(三)、抽样调查抽样调查是实际中应用最广泛的一种调查方式和方法,它是从调查对象的总体中随机抽取一部分单位做为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。,抽样调查的特点: 经济性:这是抽样调查的一个显著的优点。由于调查样本是总体中很少的一部分,调查的工作量小,可以节省大量的人力、物力、财力和时间。 时效性:抽样调查可以迅速

9、及时地获得所需要的信息。由于工作量小,调查的准备时间、调查时间、数据处理时间等都可以大大缩减,从而提高数据的实效性。 适用性:抽样调查可以获得更广泛的信息,适用于各个领域、各种问题的调查。 准确性:抽样调查的数据质量有时比全面调查更高,因为抽样调查工作量小,可使各环节的工作做的更细,误差往往很小。但是用样本资料去推断总体时不可避免的会有推断误差,但这种误差的大小可以计算并加以控制,(四)重点调查重点调查在调查总体中,选择一部分重点单位进行调查,以了解总体基本情况的一种非全面调查。重点单位,是指调查单位的标志总量在总体标志总量中占绝大比重的单位。应用重点调查的先决条件:第一,调查的任务只要求掌握

10、调查总体的基本情况。第二,在调查总体中,确实存在着重点单位。,(五)典型调查典型调查是根据调查目的和要求,在对调查对象进行初步分析的基础上,有意识的选取少数具有代表性的典型单位进行深入细致的调查研究,借以认识同类事物的发展变化规律及本质的一种非全面调查。特点:1典型单位是根据调查目的和要求,通过对调查对象的全面分析后,有意识地选定的。2只对少数典型单位调查,其调查范围小,调查单位少。3调查的内容具有很大的灵活性。,重点调查、抽样调查和典型调查的区别和联系 联系:都属于非全面调查,都具有省时省力的特点 区别:(1)目的不同 重点调查只能了解总体的基本情况不能推断总体抽样调查目的是用部分推断总体典

11、型调查只有在一定的条件下才能推断总体(2)选取调查单位的方法不同重点调查是挑选总体中的重点单位进行调查抽样调查是按着随机原则抽取调查单位典型调查有意识的选取典型单位进行调查,第二节 统计数据的整理,一、数据的审核在对统计数据进行整理时,首先要进行审核,以保证数据质量,为进一步统计分析打下基础。对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。审核数据准确性的方法主要有逻辑检查和计算检查。,二、统计分组(一)统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。统计分组同时具有两个方面的含义:对总体而言是“分”,即将总体区分

12、为性质相异的若干部分;对总体单位而言,是“合”,即将性质相同的总体单位组合起来。,(二)统计分组的作用1区分不同事物的性质区分事物不同的性质是统计分组的根本作用。例如,研究人口时,可以从性别、年龄、民族、文化程度等方面来区分人口的不同性质。,分组前,分组后,25,33,42,2反映事物的内部构成及其变化规律性通过分组区分了事物的不同性质,可以研究现象的各部分构成,进而识别事物的主要部分与共性特征,以说明事物发展变化的规律。表21 2004年某地区产业结构,100.0,189 4.02,合 计,15.9 50.9 33.2,301.15 964.06 628.81,第一产业 第二产业 第三产业,

13、比重 %,增加值(亿元),产业,3揭示现象之间的数量依存关系通过分组将性质上有关联的分组资料联系起来分析,便可研究不同现象总体之间数量上的依存关系。例如表22中的数据便可展现出小麦亩产量与施肥量二者之间的相互依存关系。 表22 小麦施肥量与亩产量之间的关系,500,651,490,420,350,280,210,140,小麦亩产量(斤),70,60,50,40,30,20,10,0,施肥量 (斤),(三)统计分组的原则与分组标志 1、统计分组的原则一是要有周延性,即不遗漏,每一单位都有所归属。二是要有互斥性,即不重复,每一单位只能归属于某一组而不能归属于另一组。 2、统计分组的标志分组标志就是

14、将总体分为各个性质不同的标准或根据。,根据分组标志的特征不同,总体可按品质标志分组,也可按数量标志分组。(1)按品质标志分组按品质标志分组就是以品质标志作为分组标志,并在品质标志的变异范围内划分各组界限,将总体分为若干组。(2)按数量标志分组按数量标志分组就是以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体分为若干组。,(四)简单分组和复合分组1简单分组对总体只按一个标志分组称为简单分组。2复合分组对总体按两个或两个以上标志层叠起来进行分组称为复合分组。即先按一个标志分组,然后再按另一个标志将已经分好的各个组进一步划分为若干组。3交叉分组对总体按两个标志交叉进行分组称为交叉

15、分组,它也是一种复合分组。如表23所示。,表23 2004年三个地区按城乡分组的文盲率,合计,6.39 5.84 6.20,3.38 3.29 4.07,甲地区 乙地区 丙地区,乡村文盲率(%),城镇文盲率(%),地 区,三、 次数分布,(一)次数分布的概念在统计分组的基础上,将组中的所有单位按组归类整理,形成总体中各个单位在各组间的分布,就叫做次数分布。分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。将各组组别与次数依次编排而成的数列就叫做次数分布数列,简称分布数列。次数分布分为质量次数分布和变量次数分布。,质量次数分布就是按品质标志分组所形成的次数分布。它有两

16、个构成要素:一是组的名称,二是各组的次数。如表4-4。 表4-4 某 地 人 口 按 性 别 分 组 的 情 况,100.0,126 5,合 计,51.62 48.38,65 3 61 2,男 女,占总人口比重(%),人 数(万人),性 别,变量次数分布就是按数量标志分组所形成的次数分布。它也有两个构成要素:一是变量,二是各组的单位数。如表所示。表 2-5 某班组工人看管机器台数的情况,100.00,16,合 计,20.00 53.30 26.70,3 8 5,1 2 3,比 率(%),工人数(人),看管机器数(台),变量次数分布又分为单项次数分布和组距次数分布。变量次数分布中的每个组只用一个

17、变量值来表示就是单项次数分布。如表25。变量次数分布中的每个组用一定范围的变量值来表示就是组距次数分布。如果变量值的变动范围大,项数较多,就要采用组距次数分布反映总体的分布状态。如表26。,表26 某地区2 004年城镇居民可支配收入情况,100.00,合 计,2.55 14.82 24.45 22.00 17.369.644.912.361.91,200 以下 200 300 300 400 400 500 500 600 600 700 700 800 800 900 900 以上,百 分 比(%),每人每月可支配收入(元),(二)变量次数分布的编制方法 步骤:1、编制序列和计数 2、确定

18、组数和组距3、确定组限和组中值 例如,对某工厂某月50名工人装配零件(件)情况进行调查,得到下列初级资料:,这些数据杂乱无章,难以看出其数量特征及其分布的规律性,需编制次数分布。,1编制序列和计数按一定顺序排列的数值称为序列,即把数值从小到大(从大到小)的顺序排列。编制单项次数分布表27。 表27 某企业装配零件数分布表,50,合 计,2 2 2 1 1 1 1 1 1 2 1,110 111 112 113 114 115 119 122 124 125 128,2 1 1 1 2 2 3 4 2 2 2,97 98 101 102 103 104 105 106 107 108 109,1

19、 1 1 1 1 1 1 2 1 1 2,81 82 83 84 85 86 89 91 92 93 96,人数(人),零件数(件),人数(人),零件数(件),人数(人),零件数(件),2确定组数和组距组数是指对总体划分为几个组。组距就是一个组的范围,它是通过相邻两组的下限(或上限)之差来计算的。对于同一总体,组数的多少和组距的大小成反比。确定组数和组距应根据统计研究的目的,资料所反映的经济内容,变量值的分布程度和全距等因素来决定。,如果将表27重新分组,取组数为5,组距为10,就得到表28的次数分布。 表28 工 人 装 配 零 件 数 分 布 表,100,50,合 计,14 18 38 2

20、0 10,7 9 19 10 5,8090 90100 100110 110120 120130,比 率(%),人 数(人),零 件 数(件),在组距次数分布中,各组组距相同的次数分布称为等距次数分布(表28)。各组组距不同的次数分布称为异距次数分布。等距次数分布一般在现象性质差异变动比较均衡的条件下使用。优点: 易于掌握次数分布的特性。 各组次数可以直接比较。等距的情况下,确定组数、组距的公式:组数 全距/组距组距全距/组数,异距次数分布一般在现象性质差异的变动非均衡的条件下使用。优点: 能准确地描述偏态分布; 能将性质相同的总体单位归为一组。采用异距次数分布应当注意的是:由于各组组距不同,

21、各组次数直接比较没有意义。通常需计算次数密度(次数/组距)。,3确定组限和组中值组限就是各组间的数量界限。 对于连续变量来说,由于变量的数值是连续不断的,相邻两值之间可取无限数值,因此,相邻组的组限必须重合。如表28按装配零件分组,第一组的上限与第二组的下限相同,均为90件。按习惯规定,各组包括下限数值,但不包括上限数值,统计中叫做“上组限不在内”原则。,对于离散变量,相邻组的组限一般要间断。如表29中“100199”一组的上限199和“200299”一组的下限200并不需要重合,只需互相衔接。 表29 按工人人数划分的工业企业分布情况,285,合 计,80 120 60 20 5,100以下

22、 100199 200299 300399 400以上,工 业 企 业 数(个),工 人 数(人),常用组中值作为各组变量值的代表值,反映分布在各组中个体单位变量值的一般水平。组中值是上限与下限之间的中点数值。计算公式为:组中值上限+下限 2用组中值的假定的前提:各单位的变量值在本组内呈均匀分布或在组中值两侧呈对称分布。,根据表29计算各组组距和组中值,如表210。 表210 某企业装配零件数分布,85 95 105 115 125,10 10 10 10 10,80-90 90-100 100-110 110-120 120-130,组中值,组距,零件数(件),据表29计算各组组距和组中值,

23、如表211。表211 按工人人数分组,开口组,缺下限的开口组组中值本组上限邻组组距 / 2 缺上限的开口组组中值本组下限邻组组距 / 2,(三)次数分布的表示方法1、表示法表示法就是用表格来反映次数分布。表示法的形式有两种:一是次数分布表,二是累积次数分布表。次数可用绝对数或相对数。需要各组的累计次数时,可编制累计次数分布表,如表2-12。计算累计次数的方法:向上累计是从变量值最小一组的次数起逐项累计,每组累计次数表示小于该组上限值的次数共有多少。向下累计是从变量值最大一组累计的次数共有多少。,表212 工人装配零件数累计次数表,100,50,合计,100 86 68 30 10,50 43

24、34 15 5,14 32 70 90 100,7 16 35 45 50,14 18 38 20 10,7 9 19 10 5,80-90 90-100 100-110 110-120 120-130,比率(%),人数(人),比率(%),人数(人),比率(%),人数(人),向下累计,向上累计,次 数,零件数(件),四、统计表,(一)统计表的概念统计表是以横纵交叉的线条所绘制的表格来表现统计资料的一种形式。主要优点: 第一,能有条理、有系统的排列统计资料,一目了然。 第二,能合理地、科学地组织统计资料,便于对照比较。(二)统计表的构成统计表由总标题、横行标题、纵栏标题、指标数值四部分所构成(如

25、表2-17)。,表217 2004年某市各类工业企业的总产值,210,3 128,合 计,1 2361 85735,(2),(1),( 甲),总产值(亿元),工业企业数(个),按经济类型分组,国有企业集体企业中外合资,137676,纵 栏 标 题,指 标 数 值,横 行 标 题,总标题是表的名称,用以概括统计表中全部统计资料的内容,一般写在表的上端中部。 横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。 纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。 指标数值列在各横行标题与各纵栏标题的交叉处。统计表中任何一

26、个数字的内容有横行标题和纵栏标题所限定。,统计表的内容构成,组成部分:一是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组、或者是总体单位的全部,习惯称为主词或主体栏。二是说明总体的统计指标,包括指标名称和指标数值,习惯上称为宾词或叙述栏。,210,3 128,合 计,137 67 6,1 236 1 87535,国有企业 集体企业 中外合资,(2),(1),(甲),总产值 (亿元),工业企业数 (个),按经济类型分组,主词 宾 词,(三)统计表的设计,遵循科学、实用、简练、美观的原则。1统计表形式的设计 由纵横线条交叉组成长方形表格,长宽比例适当。 统计表上、下两端的端线应以粗

27、线或双线绘制,表中其他线条应以细线绘制。须用明显线条分隔的部分,也应以粗线或双线绘制。统计表左、右两端习惯上均不划线。 统计表各横行如需合计时,应在最后一行合计,并在合计之上划一细线。各纵行如需合计时,应将合计列在最前一栏。 将复合分组列在横行标题时,应在第一次分组的各组组别下后退一、二字填写第二次分组的组别。 统计表纵栏较多时,为便于阅读,可编栏号,2统计表内容的设计 (1)总标题应当简洁而又准确的表述统计资料的内容,及资料所属的空间和时间范围。 (2)各主词之间或宾词之间的次序,应根据诸如时间的先后等自然顺序合理编排。 (3)统计表中的指标数值,有一定的计量单位。,3统计表制表技术要点(1)文字应工整、字迹清晰;数字填写整齐、数位对准,计量单位按统计表的规定填写。(2)当数字为0时要写出来,如不应有数字时,要用符号表示出来,当缺某项数字或因数小可略而不计时,用符号“”表示;当某项资料应免填时,用符号“”表示,统计表数字部分不应留下空白。(3)对于需要特殊说明的统计资料,在统计表下方加注说明。(4)制表完毕经审核后,制表人和主管负责人应签名,并加盖单位公章。,本章主要思考题 统计调查的种类 统计调查方案的内容? 几种非全面调查方法的共同点和不同点? 典型调查的作用是什么? 调查对象、调查单位与填报单位有什么关系? 什么是次数分布?如何编制次数分布? 次数分布的特征。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报