1、研究数据的录入和整理 毕重增 西南大学心理学院,outline,认识软件 数据录入与定义 编码录入数据定义数据数据整理 变换排序 其他内容数据转置DATA-TRANSPOSE数据文件拆分与合并DATA-MERGE FILES选择统计分析用的记录和变量,1认识软件,基于Windows,易于使用 各个主窗口 数据窗口 变量窗口 结果窗口导出为可编辑文本。 语法窗口,2数据的录入 2.1编码,编码的涵义: 根据一定规则将研究资料转换为可进行统计分析的数码资料之过程。,问题25:您认为,此次金融危机爆发后重庆人从地打工地回渝是否会促进本地经济的发展?(单选) 1有很大影响 2有较大影响 3没有影响 4
2、不好说,4,编码,答案,编码步骤: 1)确定变量,变量:用来反映文意概念的量化形式。在统计中往往指最小的分析单位。 变量由两个部分构成:变量名和变量值 进行编码,问题09:您有几个儿子?几个女儿?1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,要注意区分问题和变量,2)制作编码表,问题001:您的性别:男 女 问题002:您目前的婚姻状况(单选): 未婚 已婚 离婚后未再婚 离婚后再婚 丧偶后未再婚 丧偶后再婚 未婚同居,2,3,问题011:您家中是否有下列物品:(多选) 电话 传真机 有线电视 卫星电视计算机移动电话,101011,3)编码根据编码表对问卷进行编
3、码,而后将编码结果记录在问卷上或编码纸上。 *录入数据时,可“即编即录”, 一边形成编码,一边录入数据 方便但不容易检误,2.2数据录入,采用记事本、word等录入成文本文件(*.dat;*.txt) 录入速度较快但容易错。,在SPSS数据窗口、Excel录入。优点是简单,但录入速度慢,错误不易修改。,练习题,自创一个文本文件,然后导入到spss。包括 id 编号 3位; age 年龄 2位;weight 体重 2位产生5个case 文件名称为mfd.txt文件名称为myfirstdata.sav,2.3数据定义,定义数据的 变量名 变量名标签 变量值标签 缺失值,a变量名定义要求,变量名不能
4、超过8个字符 变量名不能以数字开头 变量名中不能包含,/、?、等运算和逻辑符号,b变量名标签定义,Variable labels 给变量名一个说明标注 命令格式: Variable labels 变量1名 标签 /变量2名 标签 /变量3名 标签 /变量n名 标签 .,Variable Labels no 编号 sex 性别 T1 我的头发太长了,Variable Labelsno 编号 / sex 性别 / t1 我的头发太长了,b定义变量名标签的要求,变量名要和已定义过的名称相一致; 标签用中、西文均可,但不要太长。,c变量值标签定义,Value labels 给变量的每一取值加一个说明标
5、注变量名要和已定义过的名称相一致; 标签用中、西文均可,但不要太长。,c示例,Value labels sex 1男 2女/HYin 1未婚 2已婚 3离婚后未再婚 4离婚后再婚 5丧偶后未再婚 6丧偶后再婚 7未婚同居 /WHua 1不识字或识字很少 2初小 3高小 4初中 5高中中专或中技 6大专 7大学本科 8研究生以上 0不适用 .,d缺失值定义 一般不需要特意定义,示例: Missing Value t1 t2 t3(9)/t4 (0,9) /t1a t8.1 t8.2 t8.3(99) .,Missing Value 变量名 变量名 变量名(缺失值1,缺失值2,) /变量名 变量名
6、 变量名(缺失值1,缺失值2,) .,练习 1,创制年龄包含30个case含有1个变量age的数据文件。 将年龄按10岁为一段重新划分,并存为新变量cage10-19,20-29,30-39,40-49,50-60 假如登录数据为“虚岁”,即多报1岁,请将“age”转化为“实岁”的“tage”。,练习2,从其他程序中导入数据,3.数据整理,3.1变换与产生新变量 RECODE:分段,反向记分转换可以单变量也可多变量 COMPUTE:变量(常量)间的各类运算,不等于 & 逻辑AND | 逻辑OR * 乘方 逻辑NOT,3.2 记录的排序,DATA-SORT CASES 菜单方式 右键方式 练习:将刚才数据文件按照“年龄”分别做升序和降序处理。,4其他内容,4.1 数据转置DATATRANSPOSE 4.2 数据文件拆分与合并 DATA-MERGE FILES 可以直接用copy的方式 Add case Add variable,4.3 定义变量集,选择统计分析用的记录和变量Select case 选择20岁以上的case,其他的过滤掉/删掉*保存*,数据加权主要用于计数数据随机选择一定比例的数据样本,