1、第二章 统计数据的搜集,第一节 数据的计量与类型,一、数据的计量尺度 由低到高,分为四个层次: (一)定类尺度 (二)定序尺度 (三)定距尺度 (四)定比尺度注意:不同计量尺度的级别、结果及数学运算功能,上述四个层次的计量尺度可概括为下表,二、数据的类型定性数据(品质数据)定量数据(数量数据),定类尺度,定性数据 (品质数据),定距尺度 定比尺度,数值型数据 (定量数据) (数量数据),分类数据,顺序数据,定序尺度,三、数据的表现形式 1、绝对数:1)时期数 2)时点数 2、平均数 3、相对数:1)比例 :一个总体中各个部分的数量占总 体数量的比重。 2)百分比:将比例乘以100即百分比或百分
2、数。当分子的数值很小而分母的数值很大时,也可 用千分数或万分数表示。有时也称频率。 3)比率:各不同类别的数量的比值。一个总体中各不同部分的数量对比;同一现象在不同时间上的数量之比;同一现象在不同空间上的数量之比。,),第二节 统计数据的来源、统计调查要求及种类,一、统计数据的来源1.直接来源(专门调查、科学试验)2.间接来源 二、统计调查的基本要求1.准确性2.及时性3.全面性4.经济性,三、统计调查的种类 1.按调查范围分全面调查、非全面调查 2.按调查的时间是否连续分经常性调查(连续)、一次性调查(定期) 3.按调查组织方式分统计报表调查、专门调查,第三节 统计调查方式及方法,一、统计调
3、查方式 1.普查普查是为某一特定目的而专门组织的一次性全面调查。普查有以下几个特点: 普查通常是一次性的或周期性的 普查一般规定统一的标准调查时间 普查的规范化程度也较高 普查的适用的对象比较狭窄 案例:我国的第一次经济普查,2.抽样调查抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查与普查相比,其优点有四: 1)经济性好 2)时效性高 3)准确性高 4)适应面广,3.统计报表定义:统计报表是按照我国残废关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 特点:统计报表要以一定的原始数据为基础,按
4、照统一的表式、统一的指标、统一的报送时间和报送程度 进行填报。 分类: 统计报表按报送单位的多少不同可分为全面报表和非全面报表。 按报送时间长短不同可分为日报、月报、季报、年报等; 按报送范围不同可分为国家的、部门的、地方的统计报表。 优、缺点,4.重点调查是从调查对象的全部单位中选择少数重点单位进行调查。其中重点单位是指在所要调查的数量特征上占有较大比重的单位。如,要了解全国钢铁企业的生产情况,可以选择产量较大的少数几个企业,如鞍钢、宝钢等,作为重点单位进行调查 。 5.典型调查是从调查对象的全部单位中选择一个或几个有代表性的单位进行全面深入的调查。典型调查的关键是选好典型单位。典型单位的选
5、择有三种:1.择中选典法。2.择优(劣)选典法。3.划类选典法。重点调查和典型调查的单位不是随机抽取的,具有一定的主观性,因此调查结果不能推断总体。,二、统计调查方法根据调查目的和调查对象的不同特点,统计搜集数据资料可以用不同的方法,具体方法主要有:直接观察法、报告法、采访法、问卷法、网上调查法、邮寄调查法、电话调查法等。,1.直接观察法由调查人员亲临现场,对调查对象直接进行观察、点数、检验、测量,以取得所需要的资料的一种调查方法。 2.报告法指由被调查单位利用各种记录和核算资料,按照统一的要求和表格形式,向有关部门提供统计资料的方法。,3.采访法又称访谈法、访问法或派员调查法。由调查人员向被
6、调查者提出所要了解的问题,然后根据被调查斱答复来取得所需信息的一种调查方法。根据访问的方式不同,有标准式访问和非标准式两种方法 根据被采访的人数的不同,分为个别访问和开调查会两种方法,4.问卷法指调查者运用事先统一设计的问卷向被调查者了解情况,利用当面回答的方式搜集资料。 5.网上调查法网上调查是利用现代信息网络来收集有关信息的方法。它通过网络向被调查单位和个人的网站发出调查提纲、表格或问卷,被调查者将在他们方便时亦通过网络向调查者发送信息,回答问题 6.邮寄调查法与电话调查法(略),练习: 1. 统计数据的直接来源是 ( ) 。A. 第二手资料 B. 年鉴资料 C. 第一手资料 D. 报刊资
7、料 2. 普查规定统一的标准调查时间是为了 ( )A. 确定普查从这一时间开始 C. 确定调查的起止时间 B. 避免调查数据的重复和遗漏 D. 使普查制度化、标准化 3. 在实际中应用最为广泛的调查方式方法是 ( )A. 抽样调查 B. 典型调查 D. 重点调查 C. 普查 4. 普查是 ( ) 。 A.专门组织的经常性全面调查 B.专门组织的一次性全面调查C.专门组织的一次性非全面调查 D.专门组织的经常性非全面调查 5. 调查首钢、宝钢等数十个大型钢铁公司 , 就可了解我国钢铁生产的基本情况。这种调查属于( )。A. 典型调查 B. 抽样调查 C. 重点调查,6. 重点调查的重点单位是指
8、( ) 。A. 企业规模较大的单位B. 这些单位是工作重点 C. 效益最好的单位D. 在所要调查的数量特征上占有较大比重的单位 7. 要研究某种饮料的平均合格率 , 一般采用 ( )A. 全面调查 C. 抽样调查 B. 重点调查 D. 普查 8、 对城市居民家庭收入状况进行调查,宜采用的调查方式是( )A 重点调查 B抽样调查 C典型调查 D普查 9、为总结农村税费改革成功的经验而选择若干税费改革先进县乡进行调查,是( )。A 重点调查 B抽样调查 C典型调查 D普查 10、( )属于定性调查。A 重点调查 B抽样调查 C典型调查 D普查,第四节 调查方案设计,1.确定调查目的 2.确定调查对
9、象和调查单位 (注意:调查对象、调查单位、填报单位三者是不同的概念) 3.确定项目和拟定调查表 (注意四个问题) 4.确定调查时间和调查期限(注意:调查时间、调查期限、调查登记时间三者的不同) 5.制订调查工作的组织实施计划,第五节 调查问卷设计,一、调查问卷的结构 1.开头部分包括题目、问候语(包括调查目的说明、调查对象甄别)、填写说明、问卷编号等。 题目:要精确、简练;问候语:说明调查斱身份、调查目的、调查对象甄别、调查结果的使用与保密措施等。填写说明:明确填写问卷的要求和方法。编号:主要用于识别问卷、调查者、被调查者信息等,以便于校对检查、更正错误。,例1:问候语及说明女士:您好!我是
10、市场研究公司的访问员,我们目前正在进行一项有关家庭日用品方面的研究,我想和您或您的家人谈谈有关这方面的情况和意见,耽搁您一些时间,可以吗?多谢您的支持和配合!,例2:宝洁公司的日用品研究问卷的甄别部分(访问员解释):由于我们需要从您家里选出其中一位女性家庭成员接受访问,请您告诉我您家里有多少年龄在岁之间的女性家庭成员?我指的家庭成员是指一个星期至少五天住在这里的。请不要忘了您自己。现在请您告诉我这些家人的年龄好吗?请从年龄最大的开始。 (下面是一份关于年龄的随机抽样表,表下写明:访问员在下面对不成功的被访问者在下表作记录,保留此份问卷再作甄别,直到找到合格的被访者)现在我希望与(读出上题选出的
11、家庭成员)谈谈,她在家吗?,2.主体部分该部分是调查所要收集的主要信息,由一系列问题和相应的选择答案组成。问卷设计是否合理,能否满足调查目的的要求,关键就在于这部分的质量。,3.背景部分这部分主要用来说明被调查者的一些主要特征,包括被调查者的性别、年龄、民族、职业、收入、文化程度、婚姻状况、家庭人口等。如果被调查者是单位,还需写出单位名称、地址、主管部门、负责人、职工人数、固定资产及生产情况等。哪些应该列入,应根据调查目的和要求而定。这部分通常放在问卷的最后,可使研究者对被调查者进行分类比较分析。,4.作业记录是问卷执行和完成情况的记录,由调查者最后填写。,二、调查问卷中问题的设计 (一)问题
12、的类型 一般以下两种:1.开放式问题是提出问题,由被调查者不受限制地自由回答的问题。就是通俗地说,就是问答题。,例3:1.下面请您对您所听过见过的不同牌子的个人清洁用品作评价,不管您是否用过,都想请您根据自己听过见过这个牌子的印象给出评价。 2.请您考虑牌子香皂的价格,如果将这个牌子的价格和它的各个方面比较,您认为它在物有所值方面是怎样的呢?,2.封闭式问题封闭式问题是一种需要被访问者从一系列应答项中做出选择的问题.通俗地说,就是选择题。封闭式问题一般有以下几种形式:,(1)单选式问句(是否式)这类问句要求被调查者在两个可能的答案中选择一个。如:你听说过力士沐浴液没有? 听说过1 没有听说过2
13、优点:简单明了,易于作答缺点:只有两个极端选择,信息量太小, 中间大量可能的选择补充忽略。,(2)多项选择题列出几个可能的答案,由被调查者选出最符合自己情况和意见的若干个答案(选一、多选或限选均可)。虽然给出的答案不可能详尽所有可能的答案,用“其他”代替其余无法详尽表述的答案优点:答案有一定的范围,便于被调查者取舍。缺点:备选答案不可能穷尽所有可能的情况,也容易使被调查者做出随意应付的选择(解决办法:增加“其他”选项),例4: 请告诉我你正在使用的香皂品牌是:舒肤佳 1力士 2夏士莲3纳爱丝4其他 5 请告诉我在最近半年中你看到过哪些牌子的香皂的广告舒肤佳1力士 2夏士莲3纳爱丝4其他 5,3
14、)顺位式问句列出对某一问题不同层次的答案,由被调查者排出次序,表示自己的态度和倾向。,例5: 你选择你最常使用那个品牌香皂主要是出于什么原因? (请按重要程度将最主要的三个原因依提及顺序把相应答案的编号填写在下面空格处) 香味1 颜色2 泡沫3 杀菌4 润肤5 光滑6 去污7 止痒8 消炎9 其他0 第一提及 第二提及 第三提及,(4)态度测量这是一种直接测定被调查者主观感觉和意见强弱程度的问句。它有以下几种常用的形式: 单向分级标示它是问句下用一个横轴标示一个方向的强弱程度,由被调查者根据自己的感觉和意见在上面圈注。其形式为:0 1 2 3 4 5 6 7 8 9 这种形式适用于对一事物只有
15、一种看法的情况,两极间分级标示 它是在问句下,用一个横轴标示具有两个对立 方向的不同强弱程度,由被调查者圈注。其形 式为:-4 -3 -2 -1 0 1 2 3 4很反对 较反对 反对 无意见 赞同 相当赞同 很赞同这种形式适用于对一事物有两种极 端态度的情况,单选式 例6: Q1您对目前上网速度是否满意?不满意1有些满意2比较满意3非常满意4 Q2既然您已经看过“浪潮”电脑的广告,您会考虑购买“浪潮”电脑吗?肯定会期1不知道或说不清楚2不太会 3肯定不会 4,(5)填空式即在问题后面画一短横线,让回答者填写。 此类问题一般只用于那些对回答者来说既容易 回答也易于填写的问题,通常只填数字。例7
16、:A:您的牛龄是_岁。B:您家有几口人?_人。,(6)矩阵式或表格式将同一类型的若干问题集中在一起,用一个矩阵或 表格来表示的表达方式。例8:您对力士香皂的看法如何?很满意 满意 基本满意 不满意 很不满意A.香味 B.去污 C.杀菌 D.颜色 E.润肤 ,(二)问卷设计中需要注意的问题 1.避免使用多意字眼。 2.用词简单、定义清楚 3.避免一般性问题 4.避免含糊不清的用词 5.避免引导性的问题 6.一项提问只包含一项内容7.避免直接提出敏感型问题8.答案要穷尽且互斥9.避免否定式提问,(三)问卷的编排设计和要求,1.问题顺序的设计1)问题的安排应具有逻辑性2)先易后难3)先问事实性资料,
17、后问态度和意向方面的资料,最后问理由方面的资料4)开放性问题放在后面,个人背景问题应该放在问卷的最后 2.问卷的版面格式设计1.问卷的主体部分要突出、醒目2.外表及内容的印刷要美观、给被 调查者产生好感3.各问题之间要留出一定的空间,以便提问、回答、编码及数据处理4.最美的页面是宋体小四,行距为固定值21,第六节 统计数据的质量,一、统计调查误差统计数据的误差通常是指统 计数据与客观现实之间的差距, 它有两种表现形式,即统计误差 的绝对数和相对数,二、统计调查误差的种类 (一)统计误差从其产生的原因来看,可以分为两类:登记性误差和代表性误差两类 1、登记性误差又称人为误差,是调查过程中由于调查
18、者或被调 查者的主观原因所造成的误差。形成登记性误差的原 因主要有:1)调查者方面的主观原因主要有:调查方案中有 关的规定或解释不明确导致的填报错误、抄录错误、 汇总错误等;2)被调查者造成的登记性误差主要有:人为因素 干扰形成的有意虚报或瞒报调查数据。3)调查方案不科学,如调查方案中有关调查对象范 围、时间界限、项目的含义等不明确。登记性误差是任何统计调查方式下都会产生的误 差,但理论上讲是可以消除的。,2、代表性误差主要是指在用样本数据进行推断时所产 生的随机误差。原因有:1)由于抽取样本时没有遵循随机原则而产生的;2)由于样本结构与总体结构的差异而产生的;3)由于样本容量不足而产生的;这
19、类误差通常无法消除,但可以事先控制或计算。,(二)统计误差根据是否带有倾向性,又可分为系统性误差(系统性登记误差、系统性代表误差)和非系统性误差(非系统性登记误差、非系统性代表误差) 1.系统性误差主要是登记时有意识地虚报、瞒报以及在选择代表性单位时有意识地选大或小造成的,带有明显的系统偏高或偏低倾向; 2.非系统性误差是由于技术的原因或客观的偶然性造成的,不带有倾向性。相比而言,系统性误差危害更大。,三、统计调查误差的防止 1.对于登记性误差1)首先要设计科学的统计调查方案,调查方案 中所包含的各项内容都必须详细具体地加以规定和说 明,以便人调查人员或填报单位能够正确理解和执行。2)其次要狠抓统计调查方案的落实。 3)最后,坚持和发扬实事求是的工作作风是保证统 计真实准确的根本途径。 2.对于代表性误差应在进行非全面调查中切实对调查对象的性质和特 点进行认真分析,并广泛征求有关方面意见,使选出的 单位具有较高的代表性,特别是在采用抽样调查方式 时,应严格遵守随机原则来控制误差。,练习: 1.在居民收入水平的抽样调查中,某工作人员为达到将自已家乡的居民收入水平低报,以获取国家减免税的目的,而故意选取困难户进行调查,由此产生的误差( ).A.可消除 B.是代表性误差 C.是登记性误差 D.是随机误差,但可消除,