1、上几章介绍了收集资料的方法与技术,通过这些方法和技术收集到的原始资料通常是粗糙、杂乱的,它们本身不能揭示事物或现象的本质,只有对其进行去伪存真,由此及彼、由表及里的制作,才能把握其内部的规律性,反映出事物的本质。,对资料的加工制作包括两部分:第一,资料的整理 即对收集到的资料的真实性、准确性、完整性等进行审查,并通过分类、分组和编辑汇总等,使其条理化、系统化。,第二,资料的分析 它是资料处理的核心部分,它通过对资料所包含的被研究事物的各个部分、各个阶段和属性的考察,对本质与非本质、偶然与必然因素的区分,把握事物的本质特征、属性、功能、结构与规律性,进而对所研究的事物作出正确的解释与结论。,第九
2、章 调查资料的整理方法第一节 资料整理的意义和一般步骤一、什么是资料整理? 就是运用科学的方法,将调查所得到的原始资料按照调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。,资料整理目的: 简化资料,把复杂的原始资料变成易于理解和解释的形式,便于以后的分析和研究。 资料整理资料收集阶段 资料分析研究阶段,二、资料整理的意义1、是调查资料的全面检查。 运用各种方法得到的资料,分散凌乱且难免会出现虚假、差错、短缺、冗余等现象,降低调查资料的质量和使用价值。要解决:(1)调查阶段:组织调查人员就地自检、互检和派专门人员进行抽查(2)研究阶段的开始:
3、进行全面检查和整理,2、它是进一步分析资料的基础。 对资料的分析研究必须借助于完备、系统的资料。在开展资料分析前,要鉴别资料,并对搜集来的分散的、零碎的资料进行加工整理,使之系统化、条理化,这样才可以保证研究工作的顺利进行。,3、是保存资料的客观要求。 社会调查的原始资料,既是作出调查结论的客观依据,又是今后进行研究同类现象的参考。一份真实、完整的研究资料,往往具有长久的研究价值,并且随着时间的推移,其价值会越来越大。,三、资料整理的原则 1、真实性 整理所得的资料,必须是确实发生过的客观事实,而不是弄虚作假、主观杜撰的情况。如果整理出来的资料不真实,那比没有调查资料还要危险。因为没有调查资料
4、,顶多作不出结论,而资料不真实,就会做出错误的结论,这比做不出结论更严重。,2、准确性 整理后的资料,事实要准确,特别是数据要准确。如果整理出来的事实资料含混不清,摸棱两可,数据资料很笼统,甚至互相矛盾,就不可能据此得出科学的结论。,3、完整性。 整理后的资料要完整全面,否则就可能犯以偏概全的错误。4、统一性。 对调查指标要有统一的理解和解释,对调查指标的计算方法和计算单位也要统一,否则无法统计无法比较。5、简明性。 整理所得到的资料要尽可能简单、明确,并使它系统化、条理化。,四、资料整理的一般步骤1、资料审核2、资料的编码和登录3、资料的分组4、资料的汇总5、制作统计图和统计表 上述步骤的顺
5、序并非是绝对的,如资料的汇总可以是对未分组的全部数据资料进行汇总,也可以是在分组基础上的汇总,第二节 资料的审核与汇总一、资料审核的一般要求 资料的审核是在资料分组汇总之前,对原始数据的真实性、准确性、完整性进行检查。1、审核资料的完整性2、审核资料的真实性3、审核资料的准确性,1、审核资料的完整性。(1)调查资料总体的完整性 调查的项目是否都调查了? 抽样调查中样本数目是否达到要求? 问卷的回收率和有效率是否达到要求?(2)每份调查资料的完整性 资料中的每一页是否都填答? 资料中的每个问题是否都填答?是否有漏填或少填的情况?,2、审核资料的真实性:(1)资料来源的客观性:是通过调查得到的资料
6、,而不是调查者主观杜撰的东西。 观察访问记录等文字资料的真实性的审查可以从记录的内容、记录的时间、记录的语言、记录的字迹和所使用的墨水等方面来判断真伪,一般说,内容贫乏、时间重叠或不填时间、语言雷同、字迹和墨水相似的记录,就有可能是观察员或访问员伪造的记录,(2)资料本身的真实性 是否是由不符合要求的被调查者填答的? 调查日期是否在调查规定的截止日期以后? 、,3、审核资料的准确性 检查答案是否合乎逻辑? 记录的答案是否有错误,如没按照规定跳答,单选题做了多个选项? 资料的统计口径、计算方法和统计范围、计算单位是否合乎要求。,二、资料审核的方法1、逻辑审核 即核查资料的内容是否合乎逻辑和常识,
7、项目之间有无矛盾之处。,如: 年龄 = 286 男性出现怀孕次数的答案数字 独生子女出现哥哥、姐姐个数与年龄的答案 未婚出现配偶文化程度、年龄、职业的答案 、,2、计算审核针对数字资料 通过计算,检查各项数字在计算方法、计算结果、小计、合计与总计的关系方面,数字的计量单位有没有差错。如部分数字之和是否与总体数字相符,各部分与总体的百分比相加是否等于1,各个资料上填写的数字的单位是否一致。,资料审核后发现问题,如何处理? 1、调查者代为更正 2、补充调查 3、坚决剔除,三、资料的编码和登录 (一)编码:就是将文字资料转化为数字形式的过程。也就是将问卷或调查表中的信息转化为计算机能够识别的数字符号
8、。 例如性别,可用数字“1”表示男性 数字“2”表示女性。 但这种数字仅起到一种代表的作用,并不说明任何数量上的意义。,如果是封闭式问题,对于问题的各个答案设定一个数字编号。 例:您的文化程度 (1)小学及以下 (2)初中 (3)高中(含中专、职高等) (4)大专 (5)本科及以上 见书180页,如果是开放式问题,事先不能预料到答案的情况,无法在设计问卷的时候编码,这时候需要从回收的问卷中抽选出一些,将这些问卷中对该问题的所有回答抄录下来,对其进行分类(分类的多少要考虑到统计分析方面的问题,同时也要遵循完备性、互斥性等原则),给每一类回答定一个代号,制成编码表,然后再将每一份问卷的开放式问题的
9、回答所对应的代号填入到编码表内。,(二)登录 在将数字资料输入到计算机前,将所有调查对象的数据资料登录到资料卡片上(见书中199)。待所有的号码或数字都登录好以后,就可以将这些数字资料按照登录卡上的顺序输入计算机了。,数据登录表,四、资料的汇总 所谓汇总,就是根据研究目的,对分类后的各种数据进行计算和加总,汇集到有关的表格中,以集中系统地反映调查资料总体内部的数量情况。,资料汇总的目的:(1)初步了解数据的分布情况(2)为编制次数分布表做准备(3)为深入的统计分析做准备(4)便于保存调查资料,资料汇总的方法有手工汇总和机械汇总,(一)手工汇总的方法 见书182页1、点线法(划记法) 2、过录法
10、3、卡片法 4、折叠法,1、点线法(划记法)即以点或线等记号代表个案次数进行划记汇总的方法。类似选举中常用的唱票方法。如:学生考试成绩分布情况汇总,2、过录法:把原始调查资料过录到预先设计好的过录表或汇总表上,然后加总的一种方法。运用过录法汇总资料能看出总体各单位的情况,便于比较,也便于保存。,3、卡片法:将每个个案的资料分别登录到特制的资料卡片上,然后进行汇总的方法。如:资料卡片,4、折叠法 将若干调查表沿所要汇总的某一项目折叠起来直接进行汇总的方法。,(二)机械汇总:利用SPSS执行统计变量频次和频率分布的命令打开SPSS,进入数据表格;在菜单栏中打开 statistics summari
11、ze frequencies 点入希望统计的变量,第三节 资料的分组 就是根据社会调查研究的目的和要求,按照一定的标志,将所研究的事物或现象区分为不同的类型或组的一种整理资料的方法。,一、资料分组的意义 资料的分组具有两重意义,对于全部资料而言是“分”,即将相异的资料区别开来,对于各份资料而言是“合”,即将相同的或相近的资料合为一类。因此分组就是将资料分门别类,使繁杂的资料条理化系统化,为找出规律性的联系提供依据。,1、可认识总体内部结构及其差异 “妇女生育意愿调查”中“年龄与生育意愿交互分类”,2、可分析现象间的依存关系。 如年龄与死亡率之间的关系;收入和职业之间的关系等。如:中国1999、
12、11、12000、10、31 40岁以上人口死亡率分组表,二、分组标志的选择这是资料分组的关键问题1、分组标志的分类(1)品质标志:是反映事物属性的标志,如调查对象的性别、文化程度、职业。(2)数量标志:反映事物数量特征的标志,如调查对象的年龄、收入等。,2、选择分组标志的原则(1)要根据调查目的和任务选择分组标志 调查对象具有若干特征,都可作为分组的依据,如何从这些特征中选择作为分组依据的标志,就应该根据调查的目的和任务来选择。,(2)要选择能够反映研究对象本质的标志 在研究对象所具有的特征中,有的是事物的本质特征,有的是一般特征,我们应从中选择本质特征作为分组标志。同时要注意将事物的本质特
13、征作为分组标志时,应注意社会发展变迁的影响。,(3)应多角度选择分组标志 事物或现象的分组标志不是唯一的,从多角度选择分组标志,会使我们对社会现象的认识更加深入。,三、分组的类型(一)按照分组标志的数量1、简单分组:按照一个标志分组2、复合分组:用两个或两个以上标志对调查对象进行分组,(二)按照分组标志的性质1、按照品质标志分组 就是按照事物的性质进行分组,分组数容易确定,性质有几类,就有几个组别。如调查对象的性别、民族、职业等。2、按照数量标志分组 按照事物的数量特征进行分组,如按照调查对象的年龄、收入等特征进行分组。,按照数量标志分组,分组数不容易确定,因为事物的数量特征变动范围的大小不同
14、。为此,按照数量特征变动范围的大小,按照数量标志分组又可以分为两种类型:(1)单项式分组 适用于数量标志值变动范围很小,标志值的项数不多时。例,统计家庭人口数分布时,用家庭人口数划分。(2)组距式分组 使用于数量标志值变动范围很大,标志值的项数很多时,可以将临近的标志值合并为一组,作为分组的依据。,如何制作组距式分组的的统计表?见书中190页例。 首先,求全距,资料的最大值为99,最小值为56,全距是99-56=43 其次,确定组数与组距:如果以10为组距(通常采用5、10等整数作为组距),则组数为43/10=4.3,故可分为5组 再次,确定组限与组限的表示法:此例中最小组的上限为60,最大组
15、的上限为100,各组的组限分别表示为60分以下,6070,7080,8090,90100。 最后,计算次数。 在这里要明确一些概念:组数、全距、组距、等距分组和不等距分组、组上限与组下限、封闭式分组与开放式分组、标明组界与真实组界、组中值等。,第四节 统计表与统计图的制作一、统计表的结构、种类及制作方法1、统计表的结构 (1)标题:统计表的名称(2)横标目:统计表的主项(一般放在表的左边),即统计表所要说明的对象。(3)纵标目:统计表的宾项(一般放在表的最上面一格),是指调查指标或统计指标。(4)数字:对资料进行统计整理的结果。,2、统计表的种类(1)简单表(2)简单分组表(3)复合分组表3、统计表的制作:见上例成绩统计表。注意一点: 一般统计表的左右两侧是不划竖线的,二、统计图的种类(1)条形图(2)圆形图:以圆形面积大小表示事物大小和事物内部各部分所占比重(3)曲线图:以连续的起伏升降的线条反映事物的动态或分布特征,