1、第二章 SPSS数据文件的 建立和管理,一份简单的调查问卷,单项选择题 提供几个备选择答案,从其中选择一个答案 变量类型:分类数据、定序数据 数据类型:字符型 填空题 变量类型:定距数值型 数据类型:数值型,如何利用SPSS组织数据,SPSS数据文件是一种有结构的数据文件。,年级 性别 问题1 问题n,1 1 . 4 2 2 2. 3 1 1,文件结构,数据,个案case,变量名,变量,用字符或数字表示字符型数据 SPSS数据文件一般只能通过SPSS软件打开,一份简单的调查问卷,多项选择题 提供几个备选择答案,从其中选择多个答案 如:在下列品牌中您信任哪些品牌?被诊断为高血要后你采取了以下哪些
2、辅助治疗手段? 如:高考时报考学校 (1)北京大学 (2)清华大学 (3)人民大学 (4)北京理工大学 (5)北京师范大学 (6)北京外国语大学多项选择题不能在SPSS中直接存储,因为SPSS的一个变量只能有一个取值,如何利用SPSS组织数据,多项选择题的处理方法 思路: 将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。编码方式: 多选项二分法(multiple dichotomize method) 多选项分类法(multiple category method),多选项二分法将每个答案作为一个变量,每个变量只有两个取值(0或1)。例如:,如何利用SPSS组织数据,
3、多选项分类法:预先估计多选项问题可能被选择的最多答案数.为每个答案建立一个变量,取值为多选项问题的可选答案. 例如:,如何利用SPSS组织数据,频数数据:,如何利用SPSS组织数据,设置三个变量: 专业方向、性别、人数,SPSS数据文件的结构,(一)变量名(Variable name):变量名是变量存取的唯一标志。起名规则: 不多于8个字符组成 不区分大小写 允许汉字作为变量名 默认变量名为VARn,如:var00001,SPSS数据文件的结构,(二)变量的类型(type)和显示宽度(width) 1、数值型: 标准数值型(Numeric):默认类型 8.2如: 12345678、12345.
4、67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号8.2如:1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据 8.2如:1.2E+05 带美元符号(Dollar):表示货币格式很多,如:$12.30,SPSS数据文件的结构,2 、字符型(String): 存储字符数据 8位如:beijing 处理时用双引号扩起来 3、日期型(Date):存储日期数据 格式很多,如:20-AUG-1999 4、其他:如:圆点数值型(dot)、用户自定义型(customer)注意:显示宽度不影响数据的存储,SPSS数据文件的结构,(三)变量名
5、标签(Variable label) :对变量名的一些解释说明,增强分析结果的可视性。可以省略。(四)变量值标签(Value label)对变量所取值的一些解释说明,增强分析结果的可视性。可以省略。一般用于品质数据 如:1-男 2-女、1-高 2-中 3-低,SPSS数据文件的结构,(五)变量列格式(Column Format)对齐方式(Text Alignment)左对齐(Left):字符型默认。右对齐(Right):数值型默认。居中对齐(Center)列宽度(Column Width)默认值为变量的总长度。,SPSS数据文件的结构,(六)缺失值(Missing Values) 1、什么是缺
6、失值?漏填数据明显错误的数据 2、对缺失值的一般处理事先指定:指定某个特定值为缺失值(用户缺失值)其他处理方法,如:以均值、众数替代等 3、SPSS缺失值用户缺失值系统缺失值:点 (),SPSS数据文件的结构,(七)变量计量尺度(Measurement)scale: 定距数据,一般为数值型数据。如:收入、人数。 ordinal: 有固有顺序的顺序水准的数值型或字符型数据。如:职称、年龄段 nominal: 无固有顺序的名义水准的数值型或字符型数据。如:性别、民族,SPSS数据文件结构(虚线中的内容可以省略),变量名,变量类型,变量缺失值,变量计量尺度,标签,变量名标签,变量值标签,变量列格式,
7、定义SPSS数据文件结构,操作方法:利用变量视图 如何查看变量定义的情况菜单选项:Utilities - Variables,SPSS数据的录入与保存,录入时应注意: 黑框确定当前数据单元。 录入带有变量值标签的数据:手工输入代码,屏幕显示变量值标签。 数据保存: 操作 保存格式:(1)*.sav :SPSS数据文件(默认)。 (2)*.dbf : dbase数据文件。 (3)*.xls : Excel工作表文件。 注意:有些信息会丢失,SPSS数据的编辑,(一)打开数据文件菜单选项:File - Open - .sav(二)数据定位 按个案号码定位 菜单: Data - Go to case
8、 - 输入样本号 按值定位 光标定位到某列变量上 - Edit - Find.,SPSS数据的编辑,(三)插入和删除一个个案 插入:edit-insert case 删除:选定待删行,鼠标右键找到Cut(四)插入和删除一个变量 插入:光标定位到某列变量上 - edit - Insert Variable (插到某列前) 或鼠标右键 删除:选定列,鼠标右键Cut项,SPSS数据的编辑,(五)数据移动、复制和删除定义源数据块 鼠标右键:cut copy clear 确定目标单元 鼠标右键:paste,数据文件的合并,目的:将两个SPSS数据文件合并到一个数据文件中。文件合并的方式: 纵向合并 横向
9、合并,(一)纵向数据合并 (1)含义:将磁盘上的一个SPSS数据文件追加到当前data editor窗口中的数据文件中。 (2)前提:两个SPSS数据文件应可以合并的内容,且最好有相同的变量名和变量类型。 (3)菜单选项:data - merge file - add cases,数据文件的合并,数据文件的合并,(二)横向数据合并 (1)含义:将磁盘上的一个SPSS数据文件中的若干个变量增加到当前data editor窗口的数据文件中。 (2)前提:a.两个数据文件必须有一个共同的变量名为关键字段-合并的依据;b. 两个数据文件应事先按关键字段升序排序。,数据文件的合并,(二)横向数据合并 (
10、3)菜单选项:data - merge file - add variable (4)选项说明: math cases on key variables in sorted files:以关键字作为合并标志。Both files provide cases:合并后的文件的数据由两个文件共同提供。 External file is keyed table:以data editor的数据为基础。 Working data file is keyed table:以磁盘文件的数据为基础。,与其他软件数据共享,共享dbf和xls格式文件菜单选项: Data - Open(1)*.dbf : dbase数据文件。字段名、字段类型自动转成SPSS数据文件中的变量名和类型。一条记录为一个个案。(2)*.xls : Excel文件(Read variable name选项),