1、第十二章 调查实施与数据整理,调查实施,含义,是指研究人员自己组织调查人员或雇用现场调查公司,进行实际收集数据的工作。也被称为调查现场工作,现场工作过程,选择现场工作人员,培训现场工作人员,管理现场工作人员,核实现场工作,评估现场工作人员,数据的预处理,含义,数据预处理,是指运用科学方法,对调查所得的各种原始资科进行审核、检验和初步加工综合,使之系统化和条理化从而以集中、简明的方式反映调查对象总体情况的工作过程。,为什么要进行数据预处理?,各个样本所反映的是事物的表面现象,如果不通过归类、整理就说明不了事物的内在联系和规律性的东西。 所收集的资料可能有一些虚假、差错、短缺、冗余等现象,所以要对
2、这些原始资料进行加工,才能保证资料的真实、准确和完整。,数据预处理过程,复查审核,目的,确保每份要送去进行数据录入分析的调查问卷都是有效的。,标准,完整性 清楚性 内容的一致性 明确性 单位的统一性,复查审核,内容,查实此人是否真正接受了调查 查实受访者是否符合过滤条件 查实调查是否按规定的方式进行的 查实问卷内容是否完整 核查其他方面的问题,编辑整理,目的,对访员和受访者的疏忽、遗漏、错误进行检查。,内容,访员是否没有问某些问题,或者没有记录某些问题的答案 访员是否遵循了规定的跳问路线 开放式问题的答案是否真实合理,对不合格问卷的处理,退回现场,填补缺失值,丢弃不合格问卷,适用于: 有缺失的
3、问卷数较少 每份有缺失的问卷中的缺失值所占的比例较小 有缺失的变量不是关键变量,适用于: 不合格问卷比例小(不超过10%) 抽样数量很大时 不合格问卷与合格问卷没有表现出明显差别时 不合格答案占较大比例时 关键变量缺失,编码,是指对一问题的不同答案确定相应数字代码的过程,以便于数据的分组与后期分析,方法,列出答案 用不同方法对所列答案进行排序、归类 确定每组正式的描述词汇 设置编码 录入编码,编码,例:问题:你为什么选择某某品牌的彩电? 答案:1、质量好 8、体积小2、外形美观 9、是名牌3、价格便宜 10、大家都买这个牌子4、清晰 11、经常在广告中见到5、色彩丰富 12、我没想过6、耐用
4、13、我不知道7、高科技 14、没有什么特别的原因,编码,答案分组1,4,6 2,5 3 6 9,10,11 12,13,14,回答分组描述质量好 外形美观 价格便宜 体积小 名牌 不知道,分类的数字编码1 2 3 4 5 6,数据录入,是数据分析的前提,代助这一过程,信息从书面形式转到计算机足以识别的电子或数字形式。,方法,直接录入 程序录入 光电录入,数据清理,数据选择,剔除不合格数据筛选符合条件的数据,变量转换,变量类型的转换 数学意义上的变量代换,数据清理,处理缺失值,就是某个变量的取值不明,固原可能是调查对象不清楚或记录不完整。 处理方法 中性值代替 用估计值代替 整例删除 结对删除
5、,一致性检查,找出超出正常范围、逻辑上不合理或者极端的取值。,再编码,原则,合理性经济性,目的,是为了方便处理或对原编码的补充或对原编码的调整修改。,SPSS软件介绍,20世纪60年代末:美国斯坦福大学的三位研究生研制出世界上最早的统计分析软件SPSS 1975年:在芝加哥组建了SPSS总部 1984年:SPSS总部首先推出了世界上第一个 微机版本SPSS/PC+ 1994至1998:SPSS公司陆续购并了SYSTAT公司、BMDP软件公司、Quantime公司、ISL公司等 SPSS从1.0(基于DOS)至14.0(基于Windows),简 介,SPSS与SAS对比:,SPSS特点: 界面友
6、好 操作简便 输出美观 方便与其它软件对接 满足一般用户需要 也可编程进行二次开发,SAS特点: 功能强大 图形工具强 满足需要订制算法的用户 需要编程才能完成,SPSS数据文件的建立与管理,建立数据结构 数据的录入与编辑 文件保存 读入其他格式的数据文件 数据文件合并(DateMerge files),SPSS数据的预处理,数据的排序(DateSort cases) 数据选取DateSelect cases 用已有变量建立新变量(Transformcompute) 产生计数变量(TransformCount) 变量的重新赋值(TransformRecode) 分类汇总(DataAggregate),