1、Statistical Program for Social Sciences,SPSS for Windows,第一讲 SPSS简介及数据编码录入,1 简介 SPSS是Statistical Program for Social Sciences 的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有近30年的历史。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)。我们现在使用的是SPSS for Windows 8.0版。,2 进入SPSS之前的准备工作,2-1-1数据资料的形式: 矩阵式数据数据要求每一横行为一个个案(Case),纵列按变量排列,形
2、成矩阵格式。,2-1数据资料的形式及编码,2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答案,2-1-3编码的步骤: 1)确定变量;,变量: 用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。,问题009:您有几个儿子?几个女儿?1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1
3、的值,变量2的值,2)制作编码表,变量名: 一个数据文件中, 一个变量只能有一个唯一名称。,码位:某一变量在 数据文件中占据的栏位,码数: 某一变量由几位数组成。,该变量是数值型(Numeric)如定距、定比, 还是字串型(String),如定类、定序。 前者在统计中可以做高级运算,后者则不可以。,不适于被访人回答的问题的编码。 一般采用7,97,997等。,被访人回答不知道时的编码。 一般采用8,98,998等。,被访人拒绝回答某变量时的编码。 一般采用9,99,999等。,问卷中出现漏答时的处理编码。 一般采用9,99,999等。,2,3,100011,3)编码: 根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。,2-2 数据录入,采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。,采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。,