1、1,第二章 建立与整理数据文件建立数据文件的根本目的,是为了对研究对象的数量属性进行处理分析,进而揭示研究对象的数量特征以及数量变化规律。,2,第二章 建立与整理数据文件建立数据文件,就是把教育研究中对研究对象属性所做的观察、调查、实验研究结果转变成SPSS可以处理分析的变量与数据;整理数据文件,就是把初步建立的SPSS数据文件进行加工转化,使之真正符合统计分析工作的要求。因此,建立与整理数据文件是开始统计分析之前的基础性工作。,3,第一节 如何建立一个SPSS数据文件?一个SPSS数据文件实际上就是由描述研究对象数量属性的各种变量及其观测结果(观测量或观测值)所构成的“变量-数据”库; 因此
2、,建立数据文件包括两项基本工作:一是在SPSS窗口中定义研究变量,二是录入相应变量的观测值(数据)。 操作:打开SPSS窗口,在变量窗口与数据窗口之间进行切换。,4,一、SPSS变量及观测量的涵义 变量用来代表与描述构成总体的单位或个体的各种特征。 例如,某学校初中一年级300名学生分成六个班,其中每个学生都有自己的姓名、性别、班级、年龄、身高、兴趣、学习成绩等,它们描述了学生不同侧面的特征。我们可以分别用不同的变量来代表与描述这些特征。 观测量用来代表与记录对事物特征(变量)进行观测的观测结果、观测值、观测数据或变量值。 在上例中,当我们对每个学生的姓名、性别、班级、年龄、身高、兴趣、成绩等
3、进行观测记录时,这些具体的观测结果或观测值、变量值就称为观测量。 当然,无论自变量还是因变量,都有自己的观测量或观测值。,5,二、SPSS变量的具体属性 打开SPSS变量视窗,我们看到变量具有如下属性: 变量名称 变量类型 变量名宽度 变量小数位数 变量标签 变量值标签 单元格列宽度 缺失值 对齐格式 测度水平 只有在建立数据文件之前就了解变量的属性,才能正确地定义变量,而且才能选择合宜的统计分析方法展开分析。,6,1、变量名称(Name) 为变量命名需要遵循如下规则: “变量名的首字符”一般是字母,其后可以是字母、数字或其他符号。例如:“Nscore”。 有几个“特殊字符”不允许出现在变量名
4、中,如“?”、“!”、“”以及“”、“”、“”、“”算术运算符号。另外,圆点“”不能作为变量名的最后一个字符。 系统不区分变量名中的大小写字母。如“SCORE”、“Score”、“ScorE”,系统皆视为同一个变量名。,7,2、变量名宽度(Width) “变量名宽度”不能超过8个字符,否则系统自动截取多余部分。,8,3、变量类型(Type) 根据变量取值的性质特点,SPSS变量具有三种基本类型,即:数值型、字符型、日期型。,9,3、变量类型(Type) 首先来看数值型变量。数值型变量值是数值型数据。 数值型变量需要规定小数位数(Decimals,系统默认2位)。 根据数据输入与显示格式特点,数
5、值变量又分为如下六种类型:,10,3、变量类型(Type) 其次,来看字符型、日期型变量: 字符型变量的观测值是一串字符,输入字符串时应区分大小写。 日期型变量的观测值是具体日期,按照指定格式输入与显示,输入时需要用“”或“”作为分隔符。 特别指出的是,字符型、日期型变量不允许参与统计运算。 这提醒我们,要对某一变量进行统计分析,尽量把它定义成数值型变量,而且其观测值必须是具体数值(或者转换成数值)。,11,4、变量标签(Variable Labels) 变量标签即对变量名含义的附加说明,特别是对英文名称附加中文解释标签。 给变量名附加变量标签之后,在数据窗口中,当鼠标指向变量名时,变量名下方
6、将立即显示出其变量标签。,12,5、值标签(Value Labels) 值标签即对变量取值含义的附加说明。 在通常情况下,仅需要对“类别变量” (如班级、性别等)、“等级变量”(如优、良、中、差) 的取值定义值标签。 提醒:给变量值定义值标签后,只要值标签开关处于开启状态,在数据窗口中输入变量值后,相应的单元格里就会显示该变量值对应的值标签。,13,6、单元格列宽度(Columns) 即数据窗口中单元格的列宽度。 在通常情况下,“单元格列宽”“变量名宽度”,14,7、变量值对齐格式(Alignment) 在数据窗口中,变量值在单元格中的对齐方式有左中右之分。 在通常情况下,数值型变量的默认对齐
7、方式为“右对齐”;字符型变量的默认对齐方式为“左对齐”。 可以对对齐方式进行调整。,15,8、变量值的缺失值(Missing Value) 缺失值是指那些没有观测到、记录到、有明显错误的变量值; SPSS具有处理缺失值的功能,会在统计分析中自动排除它们。 数值型变量的默认缺失值为“0”; 字符型变量的默认缺失值为“空格”; 可以自定义缺失值。,16,9、测度水平(Measurement) 测度是测量学的重要概念。 测度即对事物测量(即给事物赋予数字)时实现量化的程度。 测度水平的高低是由测量规则决定的。,17,9、测度水平(Measurement) 常用测量规则有四种,即: “类别规则” “等
8、级或顺序规则” “等距规则” “等比或比率规则”,18,9、测度水平(Measurement) 这些测量规则规定了四种测度水平,即四种测度(依次增大): 类别测度 等级或顺序测度 等距测度 等比或比率测度,19,9、测度水平(Measurement) SPSS依据这些测量规则,规定了如下三种测度水平: 等比或比率测度,符号为“Scale”,测量水平最高; 等级或顺序测度,符号为“Ordinal” ,测量水平次之; 类别或名义测度,符号为“Nominal” ,测量水平最低。,20,9、测度水平(Measurement) 提醒:符号“Scale”涵盖了“等距”、“比率”两种测度 “Scale” 的
9、含义即标尺、有统一单位的刻度; 有统一单位是“等距测度”、“比率测度”的共同特征; 因此,符号 “Scale”实际上涵盖了“等距”、“比率”两种测度。,21,9、测度水平(Measurement) SPSS需要确定变量测度水平,因为与统计运算过程密切相关: 处于“等距”、“比率”测度水平的数值型变量,可以参与所有统计运算过程; 处于顺序测度、类别测度水平的数值型变量,只能作为分类变量,参与分类运算过程; 取值不是数值的字符型变量,不能参与统计运算过程。 系统默认测度水平如下: 数值型变量的默认测度水平为“等比或比率测度” (Scale); 字符型变量的默认测度水平为“类别或名义测度”(Nomi
10、nal)。,22,9、测度水平(Measurement) 确定测度水平的基本技巧如下: (1)可把数值型变量一律设定为默认测度水平(Scale),这样就可以参与所有统计运算; (2)可把字符型变量一律设定为默认测度水平(Nominal)。因为字符型变量值一般是“字符”而非“数字”,通常代表事物名称,如人物的“姓名”,不能参与统计运算过程,事实上谈不上什么“测度水平”。因而可一律设定为默认测度水平(Nominal)。,23,9、测度水平(Measurement) 确定测度水平的基本技巧如下: (3)当数值型变量的变量值可以连续变化时(连续性变量),可设为“Scale”水平; (4)当数值型变量的
11、变量值只能取间断数值时(间断性变量),如表示等级顺序的间断数值“5、4、3、2”,再如用于分类的数值型变量,如“性别”、“班级”变量(取值为“1,2”等间断数值),一般设为“Ordinal”水平。,24,三、如何定义SPSS变量? 在建立数据文件之前首先需要定义变量,即定义变量名、变量类型、变量宽度、变量标签等等。 为了提高工作效率,在定义变量之前就要对获得的数据资料进行一些分析,以便把握需要定义的变量数量及其各方面的属性。 现以16名硕士研究生毕业论文答辩情况资料为例说明定义变量的基本步骤。,25,三、如何定义SPSS变量? 16名硕士研究生毕业论文答辩情况资料如下:分析:上述资料包括五个变
12、量,其中: “姓名”可以定义为字符型变量,测度水平为“类别测度,Nominal”; “序号”、“成绩”可以定义成测度水平为“比率测度, Scale”的数值型变量; “性别”、“方向”可以定义成测度水平为“顺序测度,Ordinal”的数值型变量。,26,三、如何定义SPSS变量? 定义变量的基本步骤示例:在SPSS变量窗口完成如下十项工作: 1、定义变量名 2、定义变量类型 3、定义变量宽度 4、定义变量小数位数 5、定义变量标签 6、定义变量值标签 7、定义缺失值 8、定义单元格列宽度 9、定义对齐方式 10、定义变量测度水平,27,三、如何定义SPSS变量? 定义变量的基本步骤示例: 1、定
13、义变量名 在“Name”下的单元格中输入表示“序号”的变量名“Order”。,28,三、如何定义SPSS变量? 定义变量的基本步骤示例: 2、定义变量类型 单击“Type”单元格,出现图标 然后单击图标中的按钮,出现“变量类型”对话框,从中选择变量类型即可。 上例中“Order”(序号)变量的类型为“数值型”。,29,三、如何定义SPSS变量? 定义变量的基本步骤示例: 3、定义变量名宽度、变量小数位数 分别单击“Width”、 “Decimals”下的单元格,将出现带上下箭头的图标。 然后根据需要单击图标中的上下箭头,即可调整变量名宽度、变量小数位数的大小。 上例中“Order”(序号)变量
14、名宽度、变量小数位数可分别定义为“6”、“0”(序号为整数,没有小数)。,30,三、如何定义SPSS变量? 定义变量的基本步骤示例: 4、定义变量标签 在“Label”下的单元格中输入解释变量含义的标签名词。 如“Order”变量的标签名词为“序号”。 定义变量标签之后,在数据窗口中,当光标指向变量时,将会显示变量标签(变量含义)。,31,三、如何定义SPSS变量? 定义变量的基本步骤示例: 5、定义变量的“值标签” 单击“Values”下单元格,出现图标 若需定义值标签,则单击图标右边按钮,出现“值标签”对话框: 在 “Value”右边的第一个空白栏处输入“变量值”, 在 “Value”右边
15、的第二个空白处栏输入“值标签” , 然后单击“Add”按钮,即将“变量值值标签”添加到右边的值标签清单之中。 “Remove”按钮用于从清单中移出不满意的值标签。 “Change”按钮用于直接改变不满意的值标签。 如前所述,类别变量、等级变量需要定义值标签,以解释不同数值的含义。,None,32,三、如何定义SPSS变量? 定义变量的基本步骤示例: 6、定义变量的“缺失值” 单击“Missing”下的单元格,出现图标 若需定义缺失值,则单击图标右边按钮,出现“缺失值”对话框,并且有3个单选项供自行选择、编辑: No missing values(无缺失值。系统默认选项。) Discrete m
16、issing values(离散型缺失值。在矩形中填入可能的缺失值,可以少于三个。) Range plus one optional discrete missing value(确定一个连续性的缺失值范围,并外加一个离散型缺失值。在矩形中填入可能的缺失值上、下限,与一个离散型缺失值即可。提醒:开区间,不包括上、下限值。),None,33,三、如何定义SPSS变量? 定义变量的基本步骤示例: 7、定义单元格列宽度、对齐格式、变量测度水平 分别单击“Column”、 “Align”、 “Measure”下的单元格,将分别出现带上、下箭头的图标。 然后根据需要单击图标中的上、下箭头,即可调整单元格
17、列宽度、对齐格式、变量测度水平。,34,四、如何录入SPSS数据? 录入数据的方法有多种: 方法1、依变量按列录入数据 单击一个变量,在数据输入栏或相应的单元格中输入变量值,按回车键或向下移动光标键即可。,35,四、如何录入SPSS数据? 方法2、依观测量按行录入数据 单击一个观测量,在数据输入栏或相应的单元格中输入变量值,按向右方向键或Tab键即可。,36,四、如何录入SPSS数据? 方法3、带有值标签的数据输入方法 (1)最便捷的输入方法是: 打开View(外观视窗)下拉菜单,选择“Value labels”(值标签显示开关)(“”表示开启,否则关闭)。 单击相应的单元格,将出现值标签图标
18、 单击箭头按钮,将出现所有值标签,从中选择即可。 这时单元格中将显示值标签。 如果关闭值标签开关,则显示变量值。,37,四、如何录入SPSS数据? 方法3、带有值标签的数据输入方法 (2)另外的方法是: 打开View下拉菜单,关闭“Value labels”(值标签显示开关)。 在相应的单元格中或数据输入栏直接输入变量的有效值,即具体数值。 这时值标签开关处于关闭状态,将显示变量值。 若打开值标签开关,将会显示值标签。,38,四、如何录入SPSS数据? 数据输入的基本原则是: 输入变量值数据必须与事先定义的变量类型相一致; 如果变量类型是数值型,输入字符型数据,系统不会接受; 如果变量类型是字符型,输入数值型数据,系统将会把数值视为字符接受。,39,五、如何保存SPSS数据文件? 对于新建数据文件,打开File下拉菜单,执行“Save as”(另存为)命令。 在“Save Data as”对话框中,指定保存路径与文件名,保存。,40,本节作业16名硕士研究生毕业论文答辩情况资料如下:独立建立一个SPSS数据文件,并以自己的姓名保存之。,