收藏 分享(赏)

第二章统计数据的收集、整理与显示.ppt

上传人:hwpkd79526 文档编号:7884964 上传时间:2019-05-29 格式:PPT 页数:147 大小:1.58MB
下载 相关 举报
第二章统计数据的收集、整理与显示.ppt_第1页
第1页 / 共147页
第二章统计数据的收集、整理与显示.ppt_第2页
第2页 / 共147页
第二章统计数据的收集、整理与显示.ppt_第3页
第3页 / 共147页
第二章统计数据的收集、整理与显示.ppt_第4页
第4页 / 共147页
第二章统计数据的收集、整理与显示.ppt_第5页
第5页 / 共147页
点击查看更多>>
资源描述

1、2019/5/29,版权所有 BY 统计学课程组,1,第一节 统计数据的来源 第二节 调查设计 第三节 统计数据整理 第四节 统计表的设计,第二章 统计数据的收集、整理与显示,2019/5/29,版权所有 BY 统计学课程组,2,本章重点与难点,重点:是了解和掌握调查设计和数据整理的方法;正确使用统计图、表来展示数据的特征。 难点:调查问卷的设计。,2019/5/29,版权所有 BY 统计学课程组,3,学习目标,通过本章的学习,正确理解各种调查方法的概念、作用与特点,明确相互的区别;掌握统计数据整理的方法 ;能够正确使用统计图表展示数据。,版权所有 BY 统计学课程组,4,案例2.1 如何开展

2、大学生上网的问卷调查,某大学学生工作部门想了解本校大学生上网的情况,打算采用问卷的方式,匿名调查。会计学专业的李萍同学提供了如下的问卷内容: 1、你的性别( ) A、男 B、女 2、你所在的年级( ) A、大一 B、大二 C、大三 D、大四 3、你平均每天上网的时间大概是多长?( )A、1个小时以下(包括不上网)B、12个小时C、25个小时 D、5个小时以上 4、你主要是为了什么而上网?( )(此题可多选)A、浏览网页 B、收发电子邮件 C、玩游戏 D、交友聊天E、下载软件或资料 F、跟帖灌水 G、娱乐休闲 5、你最感兴趣的是以下哪些方面的内容?( )A、新闻时事 B、校友录 C、娱乐 D、体

3、育 6、你认为上网与学习的关系是怎样的?( )A、上网耽误学习 B、上网可促进学习 C、可以增强综合素质 D、其他,2019/5/29,版权所有 BY 统计学课程组,5,由这份问卷我们想知道如下的问题: 1上述问卷的设计原则是什么? 2问题的设计应该注意哪些方面? 3答案的设计应该遵循什么原则? 4得到了资料是不是马上就可以进行分析了?,2019/5/29,版权所有 BY 统计学课程组,6,第一节 统计数据的来源,一、次级统计数据的来源 二、初级统计数据的来源,2019/5/29,版权所有 BY 统计学课程组,7,一、次级统计数据的来源,次级统计数据主要是从公开渠道获得的数据,如公开出版的报纸

4、、书籍及相关网站中的数据,有些未公开的数据在获得数据所有者允许的情况下也可以使用。,2019/5/29,版权所有 BY 统计学课程组,8,刊登我国年度宏观数据的刊物主要是国家、地区和行业或部门的年鉴。例如,中国统计年鉴、中国统计摘要、中国经济年鉴、中国农村统计年鉴、中国城市统计年鉴、中国社会统计年鉴、中国人口统计年鉴、中国劳动统计年鉴、中国工业经济统计年鉴、中国财政年鉴、中国金融年鉴以及全国各省、市、自治区、直辖市、新疆生产建设兵团的统计年鉴等。,2019/5/29,版权所有 BY 统计学课程组,9,对于某些特定行业的数据,如证券业数据,我们可以从各证券报、中国证券监督管理委员会、上海证券交易

5、所、深圳证券交易所、各证券公司等单位的网站数据库和出版发行的刊物中取得有关数据。各上市公司的季报、半年报、年报中的各种数据属于公开数据,可以直接使用,但如果存在后续的补充报告,在使用时应该及时调整。对于未公开的微观经济数据,由于涉及企业的内部机密或个人的隐私权,我们在采用有关数据时一定要征得相关单位和个人的同意,在发表研究成果时还应尽量避免直接公布原始数据。,2019/5/29,版权所有 BY 统计学课程组,10,刊登世界各国宏观数据的刊物主要由联合国统计司(UNSD)、世界银行(WB)、国际货币基金组织(IMF)、世界贸易组织(WTO)、世界卫生组织(WHO)、国际能源机构(IEA)、国际清

6、算银行(BIS)、欧盟统计局(EUROSTAT)、亚洲开发银行(ADB)、国际电信联盟(ITU) 等国际性组织编制出版。有些使用面广的资料,在取得版权后,由我国有关机构翻译成中文出版。例如世界经济年鉴、世界发展报告、国外经济统计资料等。,2019/5/29,版权所有 BY 统计学课程组,11,选择次级数据时应该注意的问题:,(1)应根据研究目的选择次级数据; (2)注意次级数据变量名称的含义是否发生过变化。随着历史的变迁,有些次级数据变量名称的内涵或外延发生了变化,在采用数据时应该进行调整; (3)注意次级数据的计算口径和计算方法是否一致; (4)注意尊重次级数据所有者的权益。一是要合法采用次

7、级数据;二是要注明数据的来源出处,这样既尊重他人的劳动成果,又便于阅读者核实。,2019/5/29,版权所有 BY 统计学课程组,12,二、初级统计数据的来源,初级统计数据的来源渠道主要有两个:一是专门组织的调查;二是科学试验。前者是社会经济数据的主要来源,后者是自然科学数据的主要来源。本书着重讨论取得社会经济数据的方式和方法。,2019/5/29,版权所有 BY 统计学课程组,13,(一) 统计调查方式,常用的统计调查方式主要有普查、统计报表调查和抽样调查等。1普查(census) 普查是国家为了详细地了解某项重要的国情国力而专门组织的一次性全面调查,主要用来调查属于一定时点上现象的总体特征

8、,如全国人口普查、国有资产普查、全国工业普查、全国第三产业普查等。相对于全面统计报表,普查能取得内容更详尽、分类更细致的统计资料,但普查耗费的人力、物力、财力较多,不宜经常进行,而应根据实际需要间隔一定的时间进行,比如我国从1990年起每隔10年进行一次全国人口普查。,2019/5/29,版权所有 BY 统计学课程组,14,普查的基本形式有两种:一种是设立专门的普查机构,配备一定的普查人员,对调查单位直接进行登记,如历次全国人口普查就是采用这种形式;另一种是利用企事业单位的原始记录和核算资料,设计一系列调查表,这些基层报告单位根据普查的要求自行填报,如全国科技人才普查即是如此。,2019/5/

9、29,版权所有 BY 统计学课程组,15,普查应该注意的问题:,(1) 要规定统一的标准时点; (2) 严格设定必需的调查项目; (3) 尽可能地缩短普查登记期限; (4) 按一定的周期进行同类普查。,2019/5/29,版权所有 BY 统计学课程组,16,2统计报表调查(statistical report forms),统计报表调查是指按照国家统一规定的表格形式、统一的指标、统一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调查组织形式。我国现行的统计报表,包括国民经济基本统计报表和专业统计报表。,2019/5/29,版权所有 BY 统计学课程组,17,统计报表调查的优点:,(1

10、) 在报表实施范围内,各报告单位按期报送,可保证调查资料的全面性、连续性和及时性; (2) 统计报表调查事先已作为一种制度布置到基层报告单位,要求各单位根据原始记录和统计台账提供报表所需的资料,从而保证了资料来源的可靠性和准确性; (3) 由于统计报表调查是逐级整理上报,统计资料可以使各级地方政府和部门及时了解和掌握本地区、本部门的基本情况。,2019/5/29,版权所有 BY 统计学课程组,18,统计报表调查的局限性:,1、涉及的范围广、内容多,花费的人力、物力较多; 2、在统计法制不健全、执行不严的情况下,统计报表调查在逐级上报过程中容易受到有关人员主观因素的干扰,从而影响资料的准确性;

11、3、统计报表中的指标项目相对固定,当被研究现象变化较快时,统计报表缺乏应有的灵活性。,2019/5/29,版权所有 BY 统计学课程组,19,3抽样调查(sampling survey),抽样调查是一种非常重要的非全面调查组织形式。它是按照随机原则从被研究的总体中抽取一部分单位组成样本,根据样本的调查结果对总体的数量特征作出具有一定可靠程度的推断的一种统计调查方式。随机原则是抽样调查所必须遵循的基本原则,它是指在抽样过程中,样本单位的抽取不能受任何主观因素及其他系统因素的影响,保证总体中各个单位都有同等的机会被抽选出来的原则。只有遵循随机原则,才能保证抽选出来的样本单位的分布近似于总体的分布,

12、从而确保样本对总体的代表性。,2019/5/29,版权所有 BY 统计学课程组,20,抽样调查的特点:,第一,从总体中随机抽取样本单位。 第二,抽样调查的目的是根据样本的 数量特征推断总体的数量特征。 第三,抽样误差可以事先计算并且加以控制。,2019/5/29,版权所有 BY 统计学课程组,21,(二)数据的搜集方法,1访问调查法 访问调查法是调查者通过与被调查者的当面交谈而得到所需资料的调查方法。在访问调查中,调查人员可以直接了解被调查者对调查问题的态度、观点、举止和调查现场的环境等,为判断调查资料的准确程度提供一定的依据。与其他调查法相比,访问调查法的特点有:回答率较高、数据比较准确、可

13、使用较复杂的问卷等,但调查成本一般比较高。按照调查对象的不同,访问调查法可分为居民入户调查和个别采访两种。按照对调查过程控制程度的不同,访问调查法又可分为非标准式访问和标准式访问两种。,2019/5/29,版权所有 BY 统计学课程组,22,非标准式访问是调查人员根据某个主题,由调查人员与被调查者自由交谈而获得资料的方法。非标准式访问的优点是访问具有较大的弹性,有利于发挥访问者和被访问者的主动性、创造性,从而获得准确的资料。,2019/5/29,版权所有 BY 统计学课程组,23,2问卷调查法,问卷的形式是一份预先精心设计好的问题表格,主要用来测定人们的行为、态度和特征。问卷调查就是将事先设计

14、好的问卷,通过邮局、网络或调查员送到每一个被调查者的手中,由被调查者自己填答问题,然后仍通过邮局、网络寄回或由调查员收回的一种调查方法。 进行问卷调查要求被调查者有一定的文化水平及责任心和合作精神,否则难以保证问卷的回收率,从而影响调查资料的质量。由于问卷调查的应用非常广泛,后面将会详细介绍其内容。,2019/5/29,版权所有 BY 统计学课程组,24,3德尔菲法,德尔菲法是指按照规定的程序,采用邮寄或电子邮件的方式,反复多次地收集各地专家的看法,使不同意见趋于一致的调查方法。德尔菲法有匿名性、定量化和轮回反馈式等特点。专家们互不通气,匿名发表意见,便于获得真实有效的资料。反复地询问也能使调

15、查结果更加准确可靠。实施这种方法的一般步骤为:拟定意见征询表、选定适量的征询专家、分几轮征询专家的意见、进行资料的处理等,最后作出调查结论。,2019/5/29,版权所有 BY 统计学课程组,25,4电话调查法,电话调查法是调查人员按照事先准备好的问题,利用电话与被调查者进行交流而获得资料的数据搜集方法。电话调查中所提问题的含义要明确,数量不宜过多。随着计算机的飞跃发展,人们在电话调查法的基础上又发展出一个新的调查法电脑辅助调查法。电脑辅助调查法是在电话调查时,调查者将设计好的抽样方案、问题和答案输入电脑,整个调查过程,包括电话拨号、结果记录、数据处理和展示,都由计算机完成的数据搜集方法。在进

16、行电脑辅助调查时,需要依靠电脑辅助调查系统(CATIS)进行,调查员坐在计算机显示器前,依据荧屏上显示的问题逐一向被调查者提问,并将答案输入电脑,也可完全由计算机完成提问和记录的过程。这种方法的优点是时效性强、费用低,能较快地搜集有关数据。,2019/5/29,版权所有 BY 统计学课程组,26,5小组座谈法,小组座谈法是由一个经过训练的主持人,以座谈会的形式,通过同一个小组的被调查者进行交谈而获得资料的方法。由于参与者比较多,要想取得预期效果,不仅要求调查者在事前作好充分的准备,包括设计调查提纲、确定参与会议的人数以及选择会议的时间、地点和环境等,还要求其具有驾驭会场的能力。小组座谈法的优点

17、是效率高、深入细致,但发言容易受到其他人的影响,在涉及个人隐私、保密及其他敏感性话题时,也不宜采用这种方法。,2019/5/29,版权所有 BY 统计学课程组,27,6观察法,观察法是调查人员到现场对调查单位直接检验、计数或测量,登记所得到的结果的方法。例如,农作物收获量调查,调查人员到所抽中的地块参与收割和计量;某商品库存量调查,调查人员到商店及有关单位柜台或仓库清点该商品的库存。观察法有自然、客观、直接的特点。由于采用观察的方法,无须被调查者作任何反映,因而常常可获得比较真实的信息。但在单位数较多时,使用观察法需要的时间较长。,2019/5/29,版权所有 BY 统计学课程组,28,7实验

18、法,实验法是在某个特殊的实验环境下,对被调查者进行实验以取得资料的调查方法。例如,企业要比较两种新产品的优劣,可通过试销实验,来决定发展的重点。实验法一般包括提出研究假设、进行实验设计、选择实验对象、控制实验环境和收集实验数据等步骤。实验法具有方法科学、反映客观、过程容易控制等优点,但也有时间长、费用高、实验对象选择的难度大等不足。,2019/5/29,版权所有 BY 统计学课程组,29,实验法案例 案例一 现场实验帮助A公司胜诉 案例二 科普节目效果实验内容见WORD文档1,2019/5/29,版权所有 BY 统计学课程组,30,8网络调查法,网络调查(又称网上调查)是指利用国际互联网作为技

19、术载体和信息交换平台进行调查的数据搜集方法。其业务流程大体包括方案设计、问卷上网、问卷检查、数据处理与分析、调查报告等。网络调查具有匿名性、成本低、速度快、调查对象广泛等特点,调查结果相对可靠。现在电子邮件调查、网页调查、免费下载工具调查、民意调查、超前性问题调查等已被广泛使用。当然,网上调查也存在结果的可信度不高、代表性差、难以消除重复填报等问题。,2019/5/29,版权所有 BY 统计学课程组,31,第二节 调查设计,一、调查方案的结构 一份完整的调查方案,应该包括以下基本内容: 1调查目的; 2调查对象、调查单位和报告单位; 3调查项目与调查表; 4调查时间、调查方式与方法; 5调查的

20、组织工作。,2019/5/29,版权所有 BY 统计学课程组,32,调查对象就是根据调查目的确定的、在某种性质上相同的许多个体单位所组成的集合。 调查单位就是调查对象范围内的各个个体单位。调查单位与报告单位是两个不同的概念。调查单位是调查项目的承担者,而报告单位则是负责向调查研究机构提供所需统计资料的基层单位。调查单位与报告单位有时是同一个单位,有时则是不同的单位。,2019/5/29,版权所有 BY 统计学课程组,33,调查项目就是反映调查单位特征的变量。 在确定调查项目时必须注意如下几个问题: (1) 调查项目的含义必须明确,不能模棱两可; (2) 考虑取得资料的可行性,有些调查项目虽然需

21、要,但在现有条件下难以取得资料的则不应列入; (3) 调查项目的答案应满足完备性和互斥性。如果要求选择回答,则必须列出所有可能的答案,以免出现重复或遗漏; (4) 确定不同时期同类调查的调查项目时,前后时期的调查项目应互相衔接,以便进行动态比较分析。,2019/5/29,版权所有 BY 统计学课程组,34,调查表是指把所要调查的项目按照一定的结构和顺序排列后形成的表格。它是调查项目的表现形式,也是向调查单位取得原始统计资料的重要工具。利用调查表进行调查,能够条理清晰地填写需要搜集的资料,也便于调查结束后对资料进行整理。根据一份表格上容纳调查单位的多少,调查表可以分为一览表和单一表。一览表是指一

22、份表格上可以登记两个及两个以上调查单位有关调查项目的调查表;单一表是指一份表格上只登记一个调查单位有关调查项目的调查表。 调查时间是指调查资料所属的时间。,2019/5/29,版权所有 BY 统计学课程组,35,二、问卷设计,(一) 问卷的结构问卷(Questionnaires)又称问卷表,是以书面的形式,按照设计好的顺序,由一系列问题和相应的备选答案组成的表格。,2019/5/29,版权所有 BY 统计学课程组,36,问卷的结构:,(1)问卷标题; (2)问卷说明; (3)填写要求; (4)甄别部分; (5)主体内容; (6)编码; (7)背景。,2019/5/29,版权所有 BY 统计学课

23、程组,37,(二) 提问项目的设计,问卷的主体内容是由根据调查目的和要求而设计的问题和备选答案构成的,问题设计的质量将直接影响到调查目的能否达到。在设计问题时要注意:提问的内容应该尽可能地短;用词要通俗、准确;避免诱导性提问、否定式提问、对敏感性问题的直接提问;一项提问一般只能围绕一个问题进行,不能涉及多个问题等。,2019/5/29,版权所有 BY 统计学课程组,38,问题顺序安排的规则:,(1)问题的顺序安排应注意逻辑性; (2)问题的顺序安排应注意兴趣性; (3)问题的顺序安排应注意先易后难; (4)开放性问题一般放在最后。,2019/5/29,版权所有 BY 统计学课程组,39,例题,

24、例2.1 请问您认为哪个电视台办的娱乐节目最好看? 这个问题的时间定义不明,可以改为: 请问您认为最近一个月哪个电视台办的娱乐节目最好看? 例2.2 您认为白猫牌洗衣粉的洗涤效果和漂白效果怎么样? 由于它涉及多个问题,可以改为两个问题提问: 您认为白猫牌洗衣粉的洗涤效果怎么样? 您认为白猫牌洗衣粉的漂白效果怎么样?,2019/5/29,版权所有 BY 统计学课程组,40,例题,例2.3 您认为冰川牌羽绒服的保暖效果好吗? 这个问题有暗示冰川牌羽绒服的保暖效果好的含义,可以改为: 您认为冰川牌羽绒服的保暖效果怎么样? 例2.4 您觉得我校计算机基础的课堂教学质量差吗? 这个问题既有暗示计算机基础

25、的课堂教学质量差的含义,又不是人们习惯的肯定陈述的提问,可以改为: 您觉得我校计算机基础的课堂教学质量怎么样?,2019/5/29,版权所有 BY 统计学课程组,41,例题,例2.5 您觉得我国居民消费价格指数的设计科学吗? 由于人们对某一方面专业知识的掌握程度有差异,居民消费价格指数的概念及其设计原理并非所有人都了解,属于比较专业的知识。在问卷调查中的用词应该通俗化,以便能为调查对象中的绝大多数人所理解,避免采用过于专业的术语。,2019/5/29,版权所有 BY 统计学课程组,42,例题,例2.6 您的年收入有多少? 对于这类被调查者不愿意外人知道的敏感性问题,一是除非非常有必要,否则应避

26、免提问。因为人们可能采用虚报的方式应付回答,以至于调查数据失真。二是在研究目的要求涉及个人收入、私人交往对象、家庭生活状况、政治观点等敏感性问题时,一般要采用婉转的间接提问法,尽可能降低被调查者的反感程度。,2019/5/29,版权所有 BY 统计学课程组,43,(三) 回答项目的设计,按照答案之间的关系,可把提问分为开放性问题和封闭性问题两大类。开放性问题属于自由回答型;封闭性问题属于选择回答型,其回答的方法又可分为两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法等。,2019/5/29,版权所有 BY 统计学课程组,44,1开放性问题,开放性问题是指问卷没有提供任何参考答案,由被

27、调查者根据题目的基本要求,按照自己的理解自由地选择回答形式的一类问题。开放性问题可以采用填空和自由回答两种方式。填空方式的开放性问题可举例如下: 例2.7 请问您今年平均每月的通信费用是多少? 例2.8 请问您最喜欢使用的笔记本电脑是什么品牌的?,2019/5/29,版权所有 BY 统计学课程组,45,自由回答方式的开放性问题可举例如下: 例2.9 请问您认为中国的高考形式应该作哪些方面的改革? 例2.10 请问您喜欢产品的理由是什么?开放性问题的优点是便于被调查者详细地表达自己的观点,适合于潜在答案较多的问题。缺点是可能占用被调查者较多的时间,致使部分被调查者放弃回答;答案不统一,给资料整理

28、和分析带来困难。,2019/5/29,版权所有 BY 统计学课程组,46,2封闭性问题,封闭性问题是指调查者已经设计好若干个答案,被调查者只需从中选择一个或一个以上答案的问题。对封闭性问题的设计,答案要遵循穷尽性和互斥性的原则,即既不能遗漏,又不能有相互重叠的内容。如果有很多可供选择的答案,在列出主要的答案后,用“其他”二字代表未列出的答案。,2019/5/29,版权所有 BY 统计学课程组,47,(1) 两项选择法。这是指提出的问题只有两种备选答案的提问方法。 例2.11 你喜欢使用方正笔记本电脑吗?(在同意的方框中划“”。) 喜欢 不喜欢 ,2019/5/29,版权所有 BY 统计学课程组

29、,48,(2) 多项选择法。这是指提出的问题有两种以上的备选答案,被调查者可以从备选答案中选择一个或多个回答的提问方法。 例2.12 你现在使用手机的品牌是什么?(在同意的方框中划“”。) 诺基亚 摩托罗拉 三星 波导 LG 其它 对绝大多数人而言,当前经常使用的手机一般只有一个,因而是单项选择。,2019/5/29,版权所有 BY 统计学课程组,49,例2.13 你曾经使用过的手机的品牌有哪些?(在选择的方框中划“”。) 诺基亚 摩托罗拉 三星 波导 LG 其它 对于曾经使用过的手机,答案既可以是一个,又可以是多个。,2019/5/29,版权所有 BY 统计学课程组,50,(3) 顺序选择法

30、。这是在有多个答案选择时,被调查者根据自己的偏好程度判断各答案的重要性,并按顺序列出答案的方法。这类答案的设计要求设计者充分考虑被调查者理解能力的差异,让他们能够顺利地写出答案的顺序。 例2.14 传递内容较多、有电子文档的书面材料时,你所选择的传递方式的顺序是: (在您认为最有效的方式后面的方框中写“1”,其次写“2”,以此类推。) 手机发送 传真打印稿 邮寄打印稿 用E-mail传递 ,2019/5/29,版权所有 BY 统计学课程组,51,例2.15 请您按照喜欢的程度对以下品牌洗发水的前三个进行编号: 飘柔 海飞丝 舒蕾 风影 潘婷 沙宣 润持 顺爽 (4) 评定尺度法。运用评定尺度法

31、时,问题的答案由表示不同等级的形容词按照一定的顺序排列而成。 例2.16 您对中国电信的服务是否满意?(在选择的方框中划“”。) 非常不满意 不满意 一般 满意 非常满意 ,2019/5/29,版权所有 BY 统计学课程组,52,(5) 双向列联法。这是运用表格的形式,综合反映两方面问题的方法。表的横向和纵向分别反映两类问题,具有节省问卷篇幅、便于比较和内容综合的特点。 例2.17 为了解教师的教学质量,请在你赞成项目的空格内划“”。,2019/5/29,版权所有 BY 统计学课程组,53,2019/5/29,版权所有 BY 统计学课程组,54,案例2.2 CCTV-10当代教育高考大咨询调查

32、问卷,具体内容见WORD文档2问题: 1、问卷在格式方面是否有需要完善的地方? 2、问卷在内容方面的优点和不足是什么?对于不足,你认为应该怎样修改?,2019/5/29,版权所有 BY 统计学课程组,55,第三节 统计数据整理,一、统计数据整理的基本程序 (一)审核; (二)分类或分组; (三)编表作图。,2019/5/29,版权所有 BY 统计学课程组,56,对原始统计数据进行认真审核,主要审核资料的及时性、准确性和完整性。 (1)及时性检查,就是检查需要的统计数据是否在规定的时间内已经上报到调查机构,缺一、两个单位的资料都会影响整个汇总工作。 (2)完整性检查,一是看所有的调查表格或问卷是

33、否收齐,二是看所有的调查项目的答案是否完整。发现有问题应立即同被调查者或报告单位联系,采取补救措施。资料不完整,得出的结论就难以说明现象总体的本质特征。,2019/5/29,版权所有 BY 统计学课程组,57,(3)准确性检查,就是检查原始资料是否准确可靠,这是原始资料审核的中心。其审核方法有两个:一是逻辑检查,即根据调查项目之间的内在联系,检查各项目的答案是否合理,是否符合逻辑,答案之间有无矛盾之处。二是计算检查,即检查调查表中各项数字的计算方法、计算口径、计算结果有无差错,数字之间该平衡的是否平衡等。,2019/5/29,版权所有 BY 统计学课程组,58,二、品质数据的整理与展示,(一)

34、 分类数据的整理与展示 1频数和频数分布频数是指落在某类中的数据个数,又称为次数。在分类的基础上,将总体的所有单位按类进行整理,形成总体单位在各组间的分布,称为频数分布或次数分布。频数分布的构成要素有两个:一是品质变量的各种具体表现或数量变量值所形成的组。二是与各个组相对应的总体单位数,即频数;或各组单位数占总体单位总数的比重,即频率,它可以用百分数表示,也可以用小数表示。,2019/5/29,版权所有 BY 统计学课程组,59,频数分布可以用表格的形式反映,也可以用图形来表现。用表格来反映的称为频数分布表,而用图表现的称为频数分布图。例2.18 某酱油企业为了解本公司产品在当地的市场占有率,

35、组织了专门的市场调查小组,调查员在随机抽取一家超市后,对某天上午的60名顾客购买的酱油品牌进行了登记,原始数据如下:,2019/5/29,版权所有 BY 统计学课程组,60,2019/5/29,版权所有 BY 统计学课程组,61,要利用Excel编制分类数据的频数分布表,需要把各类用一个数字代码来表示。在本例中,各类指定的代码是: 1李锦记; 2美味鲜; 3海天; 4珠江桥; 5金狮; 6加加。在Excel中,将各品牌代码输入到Excel工作表的B2:B61,并将所有品牌的代码单作一列,为“接收区域”,即工作表的C2:C6。,2019/5/29,版权所有 BY 统计学课程组,62,创建频数分布

36、表和柱形图的步骤如下:,第一步:在“工具”下拉菜单中选择“数据分析”。 第二步:在“数据分析”的选择栏中选择“直方图”,单 击“确定”项。 第三步:用鼠标圈定或键盘输入对话框“输入区域”框中的数据区域(本例为B1:B60)。用鼠标圈定或键盘输入对话框“接收区域”框中的代码区 域(本例为C2:C6);在“输出选项”中选择“输出区域”并键入结果输出的区域(本例为D2);选择“图表输出”;在这里暂不选择“Pareto图”和“累积百分率”。点击“确定”选项。Excel输出的结果如表2-2所示:,2019/5/29,版权所有 BY 统计学课程组,63,表2-2 Excel输出的频数结果,2019/5/2

37、9,版权所有 BY 统计学课程组,64,为了便于阅读,可用品牌名称代替表2-2中的“接收”,用频数代替表中的“频率”,用各品牌的名称代替其品牌代码,用“合计”代替表中的“其他”,将频数总和60输入到I9中,并计算出各自的比例和百分比,结果如表2-3所示:,2019/5/29,版权所有 BY 统计学课程组,65,2分类数据的图示,分类数据的图示方法主要包括条形图、Pareto图、对比条形图和饼图。 (1) 条形图若将各类别放在纵轴,用宽度相同、长度不等的横条表示各类的频数多少这样形成的图形称为条形图。有了频数分布表后可直接应用Excel中的“图表向导”,选择“条形图”,点击“下一步”,在“数据区

38、域”内键入数据类别和相应的次数的位置(在例2.18为D3:E8),点击“完成”,即可得到条形图(图2-1)。,2019/5/29,版权所有 BY 统计学课程组,66,条形图,2019/5/29,版权所有 BY 统计学课程组,67,柱形图,2019/5/29,版权所有 BY 统计学课程组,68,(2)Pareto图,柏拉图(Pareto图)可以说是按次数多少排序后的柱形图。在制作频数分布表时选择Pareto图,会出现两个并排的频数分布表,对右边的频数分布表中各品牌的代码用其名称代替,删除最下面的“其他”,使用Delete键删除图中的“接收”、“直方图”、“频率” 和最右边的数字“0”;连击任一柱

39、子,在“数据系列格式”中选择“数据标志”的“显示值”;连击图上面或右边的边框,在“绘图区格式”中选择边框“无”,点击“确定”后即可完成Pareto图(图2-3)。,2019/5/29,版权所有 BY 统计学课程组,69,图2-3 不同品牌酱油的Pareto图,2019/5/29,版权所有 BY 统计学课程组,70,(3) 对比条形图,当分类变量在不同时间或空间上有多个值时,为表明它们各自在不同时间或空间上的变化情况,可绘制对比条形图。在Excel“图表向导”的“条形图”中,选择子图表类型的一个即可。 例2.19 某饮料批发部经营的4种饮料第二、三季度销售情况如表2-4所示:,2019/5/29

40、,版权所有 BY 统计学课程组,71,2019/5/29,版权所有 BY 统计学课程组,72,2019/5/29,版权所有 BY 统计学课程组,73,(4) 饼图(pie chart),有了频数分布表后,在Excel“图表向导”的“饼图”中,点击“下一步”,键入数据区域;点击“下一步”,在数据标志中选择“显示百分比及数据标志”,即可完成饼图的绘制。根据例218酱油品牌数据制作的饼图如图2-5所示:,2019/5/29,版权所有 BY 统计学课程组,74,2019/5/29,版权所有 BY 统计学课程组,75,(二) 顺序数据的整理与展示,1累计频数和累计频率累计频数是指将顺序数据中各组的次数按

41、一定的方向逐级累计所得的结果。累计频率也有向上累计和向下累计之分。从顺序数据的最低一组逐级向最高一组累计频数,称为向上累计。从顺序数据的最高一组逐级向最低一组累计频数,称为向下累计。,2019/5/29,版权所有 BY 统计学课程组,76,【例220】 为了解小区物业管理的质量,研究人员随机抽取了甲乙两个大型居民小区,就“您对该小区的物业管理质量是否满意”的问题,各调查了150户居民,结果如表2.5和表2.6所示:,2019/5/29,版权所有 BY 统计学课程组,77,2019/5/29,版权所有 BY 统计学课程组,78,2019/5/29,版权所有 BY 统计学课程组,79,2顺序数据的

42、图示,(1) 累计频数分布图,2019/5/29,版权所有 BY 统计学课程组,80,(2) 环形图(doughnut chart),环形图的中间是一个“空洞”,环上的每一段表示顺序数据的一个类别。在表示多个总体或样本数据不同类别的差异时,环形图用不同的环以示区别,这是饼图不能做到的。,2019/5/29,版权所有 BY 统计学课程组,81,对于例220,2019/5/29,版权所有 BY 统计学课程组,82,三、数值型数据的整理,关于分类数据、顺序数据整理与展示的所有方法都适用于数值型数据,还有一些适合于数值型数据的方法并不适合于分类数据和顺序数据。,2019/5/29,版权所有 BY 统计

43、学课程组,83,(一) 数据分组,1数据分组的概念数据分组是根据被研究现象的特征和研究目的,按照一个或几个重要变量,将原始数据划分为性质不同的若干个组成部分的一种统计方法。对原始数据进行分组,主要是为了划分现象的类型,研究事物内部结构的变化规律,以及现象之间的依存关系。,2019/5/29,版权所有 BY 统计学课程组,84,2数据分组应注意的问题,(1) 保持组内总体单位的同质性和组间总体单位的差异性。数据分组兼有“分”与“合”两层含义,对总体而言是“分”,即把总体内不同性质的单位分别归入不同的组,体现组间单位的差异性;对总体单位而言则是“合”,即把性质相同的单位合在一起,使组内各单位具有同

44、质性。 (2) 统计分组要符合穷举性原则。穷举性又称完备性,是指总体的任一单位都有所归属,各单位都找到适合自己的组,这样分组的结果就能包括全部单位,不会出现遗漏。 (3) 统计分组要符合互斥性原则。,2019/5/29,版权所有 BY 统计学课程组,85,3数据分组的方法,数据分组的关键在于分组变量的选择和各组界限的划分。在划分各组界限时,要了解变量值的最大可能变异范围,再根据客观事物本身从量变到质变的内在规律性,来规定各组间的数量界限。数据分组根据分组变量的多少可以分为简单分组和复合分组。简单分组又称单一分组,是对被研究现象总体只按一个变量进行分组。如人口按年龄分组,企业按利润额分组,考生按

45、成绩分组等。,2019/5/29,版权所有 BY 统计学课程组,86,复合分组就是对原始数据按两个或两个以上变量进行层叠式分组。其分组方法是在确定分组变量中的主要变量和辅助变量后,先按主要变量进行分组,然后在第一次分组的基础上再按辅助变量进行第二次分组,按所选变量的顺序,在前一次分组的基础上进行分组,直到最后一层为止。,2019/5/29,版权所有 BY 统计学课程组,87,复合分组选择两个或两个以上变量进行层叠分组,可以从不同角度了解总体内部的构成,能更全面、更深入地说明总体的本质特征。但是,如果分组变量过多,会出现组数庞大、层次复杂、结构松散等情况,反而不能清楚地说明总体的特征。实际工作中

46、,选择23个重要变量进行复合分组比较适宜。但对于总体单位较少的情况,采用复合分组有时难以反映总体的内部结构特征,因此一般不采用这种方法。,2019/5/29,版权所有 BY 统计学课程组,88,数据分组,还需要明确是采用单个变量值分组,还是采用由两个变量值形成的区间(即组距)分组,这取决于各数量变量值(即变量值)的变动范围。当变量值的变动范围很小,即使用每个变量值作为一组,所得到的组数也只有少数几个组时,则可采用单个变量值分组,如表2.3所示。,2019/5/29,版权所有 BY 统计学课程组,89,如果变量值的变动范围很大,采用单个变量值分组所得到的组数很多,难以反映总体的分布规律,则应该采

47、用组距分组。采用组距分组时,由于决定事物性质的数量界限会因人的主观认识不同而异,不同的人对同一资料会得到不同的频率分布,但是使频率分布尽可能准确地反映总体的分布规律是基本的要求。 【例221】 已知某城市甲居民区80户家庭2007年8月的人均通信支出额的资料,试编制这些家庭人均通信支出额的频数分布表。,2019/5/29,版权所有 BY 统计学课程组,90,表2-7 80户家庭2007年8月的人均通信支出额 单位:元,2019/5/29,版权所有 BY 统计学课程组,91,【解】 由于原始数据比较多,在对数据进行排序后,宜采用组距分组编制频数分布表。 (1) 确定组数组数取决于原始数据中数据的

48、多少和变量值极差的大小,极差等于数据中最大变量值与最小变量值之差,亦称全距。一般而言,数据越多,极差越大,分组数目就应该越多一些。但根据惯例,人们很少使用少于6个或大于16个的分组数目。,2019/5/29,版权所有 BY 统计学课程组,92,根据Sturges经验公式,经粗略观察,80户家庭人均通信支出额的资料接近于正态分布,表28可确定组数为7。,2019/5/29,版权所有 BY 统计学课程组,93,(2) 确定组距,一般情况下,用两个变量值组成的一个区间作为一个组时,该组的较小变量值叫下限,较大变量值叫上限,下限与上限之间的距离叫组距。如果相邻两个组的组限不相等,则有某组组距=本组上限前组下限 (2.2)如果相邻两个组的组限相等,即本组下限等于前组上限时,可按式(2.3)计算组距,即某组组距=本组上限-本组下限 (2.3),2019/5/29,版权所有 BY 统计学课程组,94,如果每个组的组距相等,叫等距分组。若各个组的组距不完全相等,叫不等距分组。采用等距分组,便于分析总体的内部结构,但也可以根据研究目的和资料的特殊性而采用不等距分组。在等距分组情况下,组数确定以后,组距也就基本确定了。组距、组数与极差之间的关系用公式(2.4)表示即为: 组距=极差组数 (2.4),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报