1、第 一 章 SPSS 概 览 数 据 分 析 实 例 详 解(医学统计之星:张文彤)最后一次更新 时间:1.1 数 据 的 输 入 和 保 存1.1.1 SPSS 的 界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入 SPSS 使用者的行列,首先祝贺你选择了权威统计软件中界面最为 友好,使用最为方便的 SPSS 来完成自己的工作。由于该软件极为易学易用(当 然还至少要有不太高的英语水平) , 我们准备在课
2、程安排上做一个新的尝试, 即 不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完, SPSS 的基本使用方法也就已经被你掌握了。 从下一章开始, 我们再详细介绍 SPSS 各个模块的精确用法。我们教学时是以 SPSS 10.0 版 为 蓝 本 讲 述 的 什 么 ? 你 还 在 用 7.0 版 ! 那好,由于 10.0 版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按 9.0 及以前版本的情况讲述,但具体的统计分析功能则按 10.0 版本讲述。没关系,基本操作是完全一样的。 好,说了这么多废话,等急了吧,就让我们开始吧!希望
3、了解 SPSS 10.0 版具体情况的朋友请参见本网站的SPSS 10.0 版抢鲜报 道。例 1.1 某克山病区测得 11 例克山病患者与 13 名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例 4.8)?患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健 康 人 : 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺: 首先要做的肯定是打开计算机 (废话) , 然后 进入瘟
4、98 或瘟 2000(还是废话,以下省去废话 2 万字),在进入 SPSS 后,具 体工作流程如下:1. 将数据输入SPSS,并存盘以防断电。2. 进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。3. 按题目要求进行统计分析。4. 保存和导出分析结果。下面就按这几步依次讲解。1.1 数 据 的 输 入 和 保 存1.1.1 SPSS 的 界 面当打开 SPSS 后,展现在我们面前的界面如下:请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。请 注 意 窗 口 顶 部 显 示 为 “SPSS for Windows Data Editor”, 表 明 现 在 所
5、看 到的是 SPSS 的数据管理窗口。这是一个典 型的 Windows 软件界面,有菜单栏、 工具栏。 特别的, 工具栏下方的是数据栏, 数据栏下方则是数据管理窗口的主界 面。 该界面和 EXCEL 极为相似, 由若干行和列组成, 每行对应了一条记录, 每列 则对应了一个变量。 由于现在我们没有输入任何数据, 所以行、 列的标号都是灰 色的。 请注意第一行第一列的单元格边框为深色, 表明该数据单元格为当前单元 格。对 Windows 操作界面不 熟悉的朋友可参见 SAS 入门第一课中的相关内容。 对 数据表界面操作不熟悉的朋友可先学习一下 EXCEL 的操作 (因为它的帮助是中文 的)。有的
6、SPSS 系统打开时会出现一个导航对话框, 请单击右下方的 Cancer 按钮,即可进入上面的主界面。1.1.2 定 义 变 量该资料是定量资料, 设计为成组设计, 因此我们需要建立两个变量, 一个变 量代表血磷值, 习惯上取名 为 X, 另一个变量代表观察对象是健康人还是克山病 人,习惯上取名为 GROUP。对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。选择菜单 Data=Define Variable。系统弹出定义变量对话框如下:该变量定义对话框在 SPSS 10.0 版中已被取消, 这里的操作只适合 9.07.0 版的用户。对话框最上方为变量名, 现在显示为“VAR00001
7、”, 这是系统的默认变量名; 往下是变量情况描述, 可以看到系统默认该变量为数值型, 长度为 8, 有两位小 数位, 尚无缺失值, 显示对齐方式为右对齐; 第三部分为四个设置更改按钮, 分 别可以设定变量类型、 标签 、 缺失值和列显示格式 ; 第四部分实际上是用来定义变量属于数值变量、 有序分类变量还是无序分类变量, 现在系统默认新变量为数 值变量;最下方则依次是确定、取消和帮助按钮。好,先来建立分组变量 GROUP。请将变量名改为 GROUP,然后单击 OK 按钮。有没有搞错?! 折腾了半天就改个名字! 难道连变量格式、 标签等都不改? 是这样的,在 SPSS 中所有的数据均以最大位数保存
8、(好象是双精度),也就是说, 上面虽然默认只有两位小数, 但那指的是计算精度, 实际保存的数据位数是 非常长的 (可以输入 Pi 值试一下) 。 在绝大多数情况下, SPSS 给出的默认数据 类型和数据精度完全可以满足需要, 只是不太好看而已。 至于标签等比较花哨的 选项, 反正我也很少用。 现在我们才刚刚入门, 一切从简。 以后我会详细介绍各种设置的用法。在第一列灰色的“var”上双击,同样会弹出定义变量对话框。现在 SPSS 的数据管理窗口如下所示:第一列的名称已经改为了“group”,这就是我们所定义的新变量 “group”。现在我们来建立变量 X。单击第一行第二列的单元格,然后选择菜单
9、 Data=Define Variable,同样,将变量名改为 X,然后确认。此时 SPSS 的数 据管理窗口如下所示:现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量, 其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为 灰色,表明现在还未输入过数据,即该数据集内没有记录。1.1.3 输 入 数 据我们先来输入变量 X 的值, 请确认一行二列单元格为当前单元格, 弃鼠标而 用键盘,输入第一个数据 0.84,此时界面显示如图 A 所示:图 A 图 B请注意: 在回车之前, 你输入的数据在数据栏内 显 示, 而 不 是 在 单 元格内显 示,现在回车,界面如
10、图 B 所示:首先, 当前单元格下移, 变成了二行二列单元格, 而一行二列单元格的内容 则被替换成了 0.84; 其次, 第一行的标号变黑, 表明该行已输入了数据; 第三, 一行一列单元格因为没有输入过数据,显示为“.”,这代表该数据为缺失值。用类似的输入方式, 我们将患者的血磷值输入完毕, 并将相应的变量 GROUP 均取 值为 1,此时数据管理窗口如下所示:从第 12 行开始输入健康人的数据,并将相应的 GROUP 变量取值为 2。最终 该数据集应该有 24 条记录。1.1.4 保 存 数 据选择菜单 File=Save,由于该数据从来没有被保存过,所以弹出 Save as 对话框如下:单
11、击保存类型列表框,可以看到 SPSS 所支持的各种数据类型,有 DBF、 FoxPro、 EXCEL、 ACCESS 等 , 这里我们仍然将其存为 SPSS 自己的数据格式 (*.sav文件)。在文件名框内键入 Li1_1 并回车,可以看到数据管理窗口左上角由 Untitled 变为了现在的变量名 Li1_1。为什么这里的对话框会出现汉字?是这样的,需要从编程的角度来解释: SPSS 在弹出该对话框时会调用 Windows 系统的公用函数,由于我们用的是中文Windows 系统,所以调用出来的就是中文。1.2 数 据 的 预 分 析1.2.1 数 据 的 简 单 描 述首先我们需要知道数据的基
12、本情况,如均数、标准差等。选择 Analyze=Descriptive Statistics=Descriptives 菜单,系统弹出描述对话 框如下:如果按 SPSS 标准的叫法, 这里应该是调用了 Descriptives 过程, 为了避免太生硬,我们称为调用对话框,等大家熟悉 SPSS 了以后,在统计分析各章中可 能两种称呼会混用。该对话框可分为左右两大部分, 左侧为所有可用的侯选变量列表, 右侧为选 入变量列表。我们只需要描述 X,用鼠标选中 X,单击中间的 ,变量 X 的标签就会移入右侧,注意这时 OK 按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:该 窗
13、 口 上 方 的 名 称 为 SPSS for Windows Viewer, 即 ( 结 果 ) 浏 览 窗 口 , 整 个的结构和资源管理器类似, 左侧为导航栏, 右侧为具体的输出结果。 结果表格 给出了样本数、 最小值、 最大值、 均数和标准差这几个常用的统计量。 从中可以 看到,24 个数据总的均数为 1.2846,标准差为 0.4687。我们以上的做法对吗?当 然 有 问 题 ! 光看总的描述是不够的, 还应当看看分 组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择 Data=Split File 菜单,系统弹出文件分割对话框如下:选 择 单 选 按 钮 Organi
14、ze output by groups, 将 变 量 GROUP 选 入 右 侧 的 选 入 变量框,单击 OK 钮,此时界面不会有任何改变,但请再做一次数据描述,你就 可以看到现在数据是分 Group=1 和 Group=2 两种情况在描述了! 从描述可知两组 的均数和标准差分别为 1.5209、1.0846 和 0.4218、0.4221。如果定义了文件分割, 则它会在以后的所有统计分析中起作用, 直到你重新 定义文件分割方式为止。1.2.2 绘 制 直 方 图统计指标只能给出数据的大致情况, 没有直方图那样直观, 我们就来画个直 方图瞧瞧!选择 Graphs=Histogram,系统会弹
15、出绘制直方图对话框如下:将变量 X 选入 Variable 选择框内, 单击 OK 按钮。 此时结果浏览窗口内会绘 制出如下两个直方图:两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换, 可以直接采用参数分析方法来分析。 综合设计类型, 最终确定采用成组设计两样 本均数比较的 t 检验来分析。最后, 我们还要取消变量分割, 免得它影响以后的统计分析, 再次调出变量 分割对话框,选择单选按钮中的“Analyze all cases, do not creat group”, 单击 OK 按钮就可以了。1.3 按 题 目 要 求 进 行 统 计 分 析下面我们要用 SPSS 来做成
16、组设计两样本均数比较的 t 检验,选择 Analyze=Compare Means=Independent-Samples T test, 系 统 弹 出 两 样 本 t 检验对话框如下:将变量 X 选入 test 框内,变量 group 选入 grouping 框内,注意这时 下面的 Define Groups 按钮变黑,表 示该按钮可用,单击它,系统弹出比 较组定义对话框如右图所示:该对话框用于定义是哪两组相比,在 两个 group 框内分别输入 1 和 2, 表明 是变量 group 取值为 1 和2 的两组相 比。 然后单击 Continue 按钮, 再单击 OK 按钮,系统经过计算后
17、会弹出结果 浏览窗口,首先给出的是两组的基本 情况描述, 如样本量、 均数等 (糟糕, 刚才的半天工夫白费了),然后是 t 检验的结果如下:Independent Samples TestLevenes Test for Equality ofVariancest-test for Equality of Means95% Confidence Interval of theDifferenceF Sig. t dfSig. (2-tailed)Mean DifferenceStd. Error DifferenceLower UpperXEqual variancesassumed.032
18、.860 2.524 22 .019 .4363 .1729 7.777E-02 .7948Equal variances notassumed2.524 21.353 .020 .4363 .1729 7.716E-02 .7954可见该结果分为两大部分: 第一部分为Levenes 方差齐性检验, 用于判断两 总体方差是 否齐,这里的戒严结果为 F = 0.032,p = 0.860,可见在本例中方差 是齐的;第二部分则 分别给出两组所在总体方差齐和方差不齐时的t 检验结果, 由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t 检验结 果, 即上面一行列出的 t= 2.524,
19、 =22, p=0.019。 从而最终的统计结论为按 =0.05 水准, 拒绝 H0, 认为克山病患者与健康人的血磷值不同, 从样本均数来看, 可认为克山病患者的血磷值较高。1.4 保 存 和 导 出 分 析 结 果1.4.1 保存结果文件前面我们已经做出了分析结果, 但是, 可是, 可但是, 但可是呢?再好的结 果只要一断电就会全部消失 (废话) , 对于这一问 题人们早已想出了三种解决办 法,他们分别是: 需要结果的 时候再运行 一次分析程 序。 用笔将结果 抄在纸上。 直接保存结 果文件。显然, 最方便快捷、 最符合信息时代特征的就是第三种方法, 在结果浏览窗 口中 (注意: 一定要在结
20、果浏览窗口中) 选择菜单 File=Save, 由于该结果也 从来没有被保存过, 所以弹出和前面保存数据时极为相似的一个 Save as 对话框, 和前面相比,他唯一的区别就是文件的保存类型只有 View Files(*.spo)一种。 好,闲言少叙,在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名 Li1_1.spo 被存储。不是文件保存类型还有一种“ALL Files(*.*)”吗?别费劲了, 这种类型是 SPSS 公司放在那里哄人的,在该对话框里无论怎么折腾,都只能按 SPO 文件的 格式来保存。1.4.2 导出分析结果文件倒是保存了, 但问题还没有完全解决: 我们从来写文章
21、什么的都用的是 文字处理软件, 尤其是 WORD, 可 WORD 不能直接读取 SPO 格式的文件, 怎么 办呢?没关系,SPSS 提供了将结果导出为纯文本格式或网页格式的功能,在结 果浏览窗口中选择菜单 File=Export, 系统会弹出 Exprot Output 对话框如下:最上方的 Export 下拉式列表可以选择输出的内容,可以为含图表的输出文 档、 无图表的输出文档和只 有统计图表三种; 中部的 Exprot File 对话框则填入 输出的目标文件名; 左下方的 Export What 单选框可以 选择输出结果的哪些部分, 可以是所有结果、 所有可见结果或只输出选择的结果, 一般
22、选输出所有可见结果; 右下方的输出文件类型下拉式列表已被我打开, 可见里面有网页格式和纯文本格 式两种,在一切按所需选择完毕后按 OK 钮,则结果文件就会输出为你想要的类 型。好,到这里,就象我们刚开始所说的一样,你实际上已经完全掌握了 SPSS 的基本使用方法。 我们以后将要做的工作就是“百尺竿头, 更进一步”, 将从下 一章开始详细介绍 SPSS 各个模块的精确用法,使大家能尽快的从 SPSS 新手向 SPSS 高手过度。回教程首页 到第二章第 二 章 数 据 文 件 的 管 理 ( 上 )(医学统计之星:张文彤)最后一次更新 时间:2.1 建立与保存数据文件-File 菜单2.1.1 新
23、建数据文件2.1.2.1 直接打开2.1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File 菜单中的其他条目2.2 编 辑 数 据 文 件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform 菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进 一 步 整 理 数 据 文 件 -Data 菜 单不言而喻, 一切统计分析都是以数据为基础的, 因此统计软件的数据管理能 力非常重要。 SPSS 以其豪华的界面为
24、依托, 为用户提供的便捷的数据管理功能, 下面我们就来具体看一下。2.1 建 立 与 保 存 数 据 文 件和大多数应用软件相同,SPSS 中数据文件的管理功能基本上都集中在了 File 菜单上, 该菜单的组 织结构和 WORD 等也极为相似, 因此这里我们只介绍比 较有特色的几个菜单项。SPSS 10.0 有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览 窗口; 另有两个不常用的窗口: 结果草稿浏览窗口和 VBs 脚本语言编辑窗口。 他 们共享许多菜单项,如 File 菜单就大部分相同,这里介绍的许多内容在五个窗 口中都是通用的。2.1.1 新建数据文件如果你正从头开始进行一个新的课
25、题, 刚刚把数据收集上来, 要做统计分析, 自然需要新建一个数据库, 然后将所有的数据从纸上请到计算机里。 在 SPSS 中, 新建一个数据库容易的不得了已经到了什么都不用做的地步! 是这样, 当你 进入 SPSS 系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据 管理界面。 你只要按自己的需要定义变量, 输入数据然 后存盘就是了 (这些操作 马上会讲到)。2.1.2 打开其他格式的数据文件凡是做过数据输入工作的人都知道: 这活又费眼睛又累人, 出错太多了还要 挨批评, 非常影响个人的光辉形象。 算了, 还是在有限的经费里划几百美元出来 雇个打字小姐吧 (怎么用美元?因为我请了个老
26、外! ) 。 可是非常不幸, 该同志 只会用 EXCEL 2000(又是一个被微软成功洗脑的家伙),数据现已输好,怎么 转成 SPSS 数据文件呢?没关系, SPSS 提供了以下 几种方法来打开其他格式的数 据文件。2.1.2.1 直 接 打 开SPSS 现在可以直接读入许多格式的数据文件,其中就包括 EXCEL 各个版本 的数据文件。 选择菜单 File=Open=Data 或直接单击快捷工具栏上的“”按钮, 系统就会弹出 Open File 对话框, 单击“文件类型”列表框, 在里面能看到直接打开的数据文件格式,分别是:SPSS(*.sav) SPSS 数据文件(6.010.0 版)SPS
27、S/PC+(*.sys) SPSS 4.0 版数据文件Systat(*.syd) *.syd 格式的 Systat 数据文件Systat(*.sys) *.sys 格式的 Systat 数据文件SPSS portable(*.por) SPSS 便携格式的数据文件EXCEL(*.xls) EXCEL 数据文件(从 5.0 版2000 版)Lotus(*.w*) Lotus 数据文件SYLK(*.slk) SYLK 数据文件dBase(*.dbf) dBase 系列数据文件,(从 dBase IIIV)Text(*.txt) 纯文本格式的数据文件data(*.dat) 纯文本格式的数据文件选择所
28、需的文件类型,然后选中需要打开的文件,SPSS 就会按你的要求打 开你要使用的数据文件,并自动转换为数据 SPSS 格式。也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外,中间还有一个“Paste”按钮, 该按钮在 SPSS 的大多数对话框中都存在, 是用于 自动生成 SPSS 程序的,我们以后会专门讲解该问题。2.1.2.2 使 用 数 据 库 查 询 打 开SPSS 可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类 型的数据文件(废话),比如 FoxPro 3.0 以上版本的*.dbf 文件就不能直接打 开(有兴趣的话你可以试试)。为此,SPSS 还提供了另一个
29、适用范围更广、但 使用上较为专业的数据接口数据库查询。实际上,SPSS 在这里使用的是一种叫 ODBC(Open Database Capture)的数据 接口,该接口被大多数数据库软件和办公软件(如 MS Office)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管 理系统。由于 SPSS 10.0 可以直接打开 EXCEL 所有系列的数据文件, 因此数据库查询 接口的用处不是很大。 但是, 在 9.0 及以前的版本中, 该查询仍是直接打开 EXCEL 95、97 及 2000 数据文件的唯一办法。ODBC 数据引擎是独立与各种应用软件, 直接安装到
30、Windows 系统中的, 因此 你所用的系统中 ODBC 所支持的数 据类型取决于所安装的 ODBC 引擎的情况。 还好,大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如 MS Office)。不过有一点要提醒大家,许多机器的 OBDC 数据引擎安装有问题(尤其是 D 版),在 SPSS 中使用它往往要死机。选择菜单 File=Open Database=New Query,系统会弹出数据库向导的 第一个窗口, 其中会列出 你使用的机器上已安装的所有数据库驱动程序, 选中所 需的数据源, 然后单击下 一步, 向导会一步一步的提示你如何做, 直至将数据读 入 SPSS。我原来准备
31、举一个具体例子,但后来发现不同版本的 ODBC 引擎所弹出的对 话框并不相同!不仅如此,不同的数据驱动程序其对话框也各不相同!比如说,有的需要你的 LoginID 和 Password,有的又不需要,因此我这里就不再讲了。 由于它使用上太专业(尤其在 10.0 版中,9.0 版还好些),如果确实要用,请找一个对数据库接口比较熟的人来帮你。2.1.2.3 使 用 文 本 导 入 向 导 读 入 文 本 文 件选择菜单 File=Read Text Data,系统就会弹出 Open File 对话框,对! 和前面的情况完全一样,只是文件类型自动跳到了 Text (*.txt)。实际上,该功能在 S
32、PSS 中已被整合到了 Open File 对话框中之所以在菜单上保留该条目有 两个原因: 1. 读入纯文本的情况非常普遍, 放在这里更加醒目; 2. 为了和 SPSS 老版本的使用上保持兼容。例 2.1 现有一数据文件以纯文本的形式存为“c:Li2_1.txt”,且第一行 为变量名,请将其读入 SPSS。解: 在 Open File 对话框选中相应的文件名并单击“确定”, 系统会自动启 动文本导入向导对话框如下:在 SPSS 10.0 中, 该向导并没有重新设计, 因此仍然有问题被截断无法显示 完的情况出现。可以看到该向导共分 6 步, 这是第一步。 中部为一对单选按钮, 问题为“你 的文本
33、文件和预定义格式相一致吗?”, 下方为按预 定义格式读入的数据文件的 预览。显然,SPSS 的预定义格式并没有正确识别该文件。因此选择“No”并单 击“下一步”,系统弹出向导的下一个对话框如下:最上方的问题是“你的变量是如何排列的?”, 下面的选项分别为 Delimite(用某种字符区分) 和 Fixed Width(固定宽度) , 一 般都是 Delimite, 第二个 问题是“变量名包括在文件最前面了吗?”,我们当然选“Yes”,单击“下一步”,系统弹出第三个对话框:最上方的句子意为“第一条记录从第几行开始?”, 右侧可以输入行数。 由 于我们所用的数据 第一行为变量名,因此这里输入 2。
34、下面的问题是“你的记 录是怎样存储在文件中的?”。可以是“每一行代表一条记录”,或者“每* 个变量代表一条记录”, 数据一般都是第一种情况。 下一个问题是“你想导入多 少条记录?”,可以是“所有记录”、“前*条”或“随机导入*%的记录”。 一般也选前者。单击“下一步”,第四个对话框如下:我这里写的非常详细,但实际使用中你可以不管大多数问题,因为 SPSS 一 般都能自动正确设置。最上方的问题为“变量间用的是哪种分隔符?”,可选的有 Tab 键、空格、 逗号、 分号或自行定义的其他符号。 本数据采用的是空格, 可见系统已经自动识 别并选择了空格,而下方的数据预览窗口显示出了正确的数据读入情况。单
35、击 “下一步”,第五个对话框如下:上方的提示为“定义在数据预览窗口中所选择的变量。 ”。 顾名思义, 在这 个对话框中你可以在数据预览窗口中选择某一列变量,然后更改其变量名和类 型。 当然, 在这里我们不用这样做, 直接单击“下一步”, 系统弹出文本导入向 导的最后一个对话框如下:最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用 吗?”,第二个问题为“你是否愿意将以上操作粘贴为 SPSS 语句?”,一般这 两个问题我们都可以不管。单击“完成”,系统最终成功的读入了 Li2_1.txt。2.1.3 保 存 数 据 文 件在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜
36、单 File=Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据; 否则,就会弹出和选择 Save as 菜单时相同的 Save as 对话框。里面可以保存 的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。Save 命令的快捷键为S,如果你曾经领教过 Windows 死机的巨大潜力, 那么你一定会同意习惯性的随手按S 至少不能算是一个坏习惯。如果你准备将数据存为 SPSS 以外的其他类型, 要注意有些设置可能会丢失, 如标签和缺失值等。 尤其是缺失 值, 如果想存的数据格式不 支持缺失值, 那你的数据可能会变的面目全非。2.1.4 File 菜 单 中 的 其 他
37、条 目【Disp Data Info】该菜单项用于显示数据的基本信息, 选择它后会弹出非常类似于打开文件的 一个对话框用于选择数据文件,选择好后按 OK,系统就会在结果窗口中列出所 选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。【Apply Data Dictionary】 即使用数据字典, 该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,但不包括数据类型),举个例子吧:请打开 Li1_1.sav 文件, 将变量 x 的长度从 8 改为 4, 标签删掉, 然后选择菜单 File=Apply Data Dictionary,在文件对话框中选择 Li1_1.sa
38、v 并按 OK(即将 Li1_1.sav 的变量设置按相同变量名一一套用在现在的数据集上),怎么样?一切都变回去了吧。【Cache Data】建立数据缓冲区。以前 SPSS 每执行一条命令都会重新读取所需的数据,如 果是从远程用 SQL 调用数据库,这会非常的费时。现在使用 Cache Data,可以 将数据全部读入暂存盘, 建立活动数据的缓冲区。 大大加快处理速度。 不过我特 意试了一下,如果是处理本机数据的话,该命令对速度的提升不是非常明显:(。【Print 和 Print Preview】 这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中Print Preview 是新增
39、加的,使用上和 WPS2000 的打印预览非常相似(其实用的 是同样的程序) , 不过和 SPSS 结果的打印程序一样, 用 SPSS 直接打印数据非常的浪费纸张,用不用你自己决定吧。【Stop Processor】用于停止执行当前的 SPSS 命令。 由于 SPSS 处理速度非常的慢, 如果你正在 对一个大型的数据执行统计命令, 等了半天都没有结束, 此时你的另一半约你逛 街的时间又要到了, 可是你的结果还没有存, 执行命令时又存不了, 怎么办呢? 试试这个命令吧。并非所有的命令都可以喊停的, 许多数据库操作命令 (计算变量, 合并等) 好象就停不了。2.2 编 辑 数 据 文 件在 SPS
40、S 中, 数据文件的编辑、 整理等功能被集中在了 Data 和 Transform 两 个菜单项中,这两个菜单的内容如下所示:Data 菜单项 Transform 菜单项下面我们将根据其功能来分别讲述。2.2.1 定 义 新 变 量2.2.1.1 直 接 定 义 新 变 量大多数情况下我们需要从头定义变量, 在 SPSS 10.0 中, 定义变量的操作界 面和 FoxPro 等数据库非常相似,只需单击左 下方的 Variable View 标签就可以 切换到变量定义界面开始定义新变量。如 Li1_1.sav 的变量定义如下所示:以变量 x 为例: 变量名为 x, 类型为 Numeric, 宽度
41、为 4, 小数位数 2 位 (因 小数点还要占一位, 故整数位只有一位) , 变 量 标 签 位 为“血磷值”。 右侧在图 中未能看到的依次为 Values, 用于定义具体变量值的标签; Missing, 用于定义变量缺失值;Colomns,定义显示列宽;Align,定义显示对齐方式;Measure, 定义变量类型是连续、有序分类还是无序分类。使用该窗口, 我们可以一次定义许多新变量, 不会象老版本那样一个一个的 定义了。由于 SPSS 是英文软件,变量名采用中文会有潜在的冲突(100%的兼容性是 不存在的,典型的例子就是微软公司的产品)。对于喜欢搞点花样的用户,这里有必要介绍一下 SPSS
42、中标签和缺失值的定 义方法:标签 和老版本不同, 现在变量标签和变量值标签被分开设置, 变量标签就 在 Label 框中直接输入, 变量值标签则在它右侧的 Value 框定义。 以 group 为例, 单击 Value 框右半部的省略号,会弹出变量值标签对话框如下:上部的两个文本框分别为变量值输入框和变量值标签输入框, 分别在其中输 入“1”和“克山病患者”,此时下方的 Add 钮变黑,单击它,该变量值标签就 会被加入下方的标签框内。 与此类似定义变量值“2”为“健康人”, 最后按 OK, 变量值标签就设置完成。 此时你做任何分析, 在结果中都有相应的标签出现。 如 果你现在就想看效果,切换回
43、 Data View 界面,然后选择菜单 View=Value Labels,怎么样,看到了吗?缺失值 单击 missing 框右侧的省略号,会弹出缺失值对话框如下:界面上有一列三个单选钮, 默认值为最上方的“无缺失值”; 第二项为“不 连续缺失值”, 最多可以定 义 3 个值; 最后一项为“缺失值范围加可选的一个缺 失值”,文如其意,不用我多解释了吧。回第一章 回教程首页 到第二章(下)第 二 章 数 据 文 件 的 管 理 ( 下 )(医学统计之星:张文彤)最后一次更新 时间:2.1 建 立 与 保 存 数 据 文 件 -File 菜 单2.1.1 新建数据文件2.1.2.1 直接打开2.
44、1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File 菜单中的其他条目2.2 编 辑 数 据 文 件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2从原有变量计算新变量-Transform 菜单2.2.2 数据的录入2.2.2.1直接录入2.2.2.2数据录入技 巧2.3 进一步整理数据文件-Data 菜单2.3.1 用于数据管理的菜单项2.3.2 正交设计菜单项 2.2.1.2 从 原 有 变 量 计 算 新 变 量从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经
45、建立, 需要整理、 转换变量时, 碰到的更多情况是需要根据某种条件从原有变量计算新 变量。 下面我们将按菜单条目的顺序依次讲解他们的功能。 但是, 首先我们需要 了解一下所用的对话框界面的情况。【SPSS 对话框元素介绍】 下面是我们在第一章曾经见过的两样本 t 检验对话框:这是一个非常典型的 SPSS 对话框。 它包含了许多具有 SPSS 特色的对话框元 素:o 对话框左侧为候选变量列表框,里面列出了可被该对话框使用的变 量;o 右上方为 Test Variables 框,可将变量选入其中;注意在两个框的中间用“ ”相连, 这是变量移动按钮, 其方向表明是将变量从那个框 移动到哪个框, 上图
46、中我们选中了变量 group, 两个移动按钮均变黑并向右指, 表明变量 group 可以移动到他们右侧的两个框里去, 改变当前框(在其他两个框里单击) , 移动按钮就会转向、 变灰等以表明不同的意思 (墙 头草一个,可别小看这个功能,我想用 VB 实现这个功能,也是费了些工 夫才把它搞定了);o 右侧为一排五个按钮,分别是确定、粘贴、重置、取消和帮助。这 五个兄弟也是几乎永远一起出现的,另外四个大家都比较熟悉了,重置(Reset)按钮用于取消对话框内已做的选择,恢复到默认的状态;o 最下方有个 Options 按钮,用于设置专门用于该对 话框的选项;o OK、 Paste 两个按钮为灰色, 表
47、明所需条件尚未满足, 该按钮暂不可 用。 同理, Grouping Variable 框下方的 Define Groups 按钮为灰色显示,也表明暂不可用。【Compute Variable 对话框】例 3.2 在 li1_1.sav 中建立新变量 temp,令其值当血磷值大于 1 时为 2, 否则为 1。解:这里需要用到 Compute Variable 对话框,外加一点技巧。首先给变量 temp 均赋值为 1,然后将血磷值大于 1 的记录其 temp 变量值改为 2 即可。选择 菜单 Transform=Compute,弹出 Compute Variable 对话框如下:左上角为需要计算的
48、变量名, 在其中键入“temp”, 此时“Type&Lable”按 钮就会变黑,喜欢精确的朋友可以在这里对 temp 进行详细的定义,但如果你和 我一样非常懒, 就可以对它视而不见 (不要生气, 聪明人大多都非常懒:)) ; 左 下方为候选变量列表, 现在还用不着; 中部为类似 计算器的软键盘, 可以用鼠标 按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的 数值表达式窗口中出现; 软键盘右侧为函数窗口, 可以在这里找到并使用所需的 SPSS 函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会 自动生成一个新变量 temp,并且取值均为 1。软键盘上几个奇奇
49、怪怪的符号的含义如下:= & | * 不等号,等价于Compute, 系 统 也 再 次弹出这个对话框等等! 注意到了吗?该对话框自动记住了你上次输入的内 容,几乎所有 SPSS 的对话框都有这个特性,这会大大方便我们的使用。好,将数值表达式窗口中的 1 改为 2, 然后单击中下部的“If”按钮, 系统弹出记录选 择对话框如下:不需要太多解释, 大部分内容都是前面见过的。 由于我们这里不是对所有记 录做变换, 因此选中第二个单选钮“Include if case statisfies confition:”, 此时下方的所有窗口变亮, 表明现在可用; 而“Conti nue”按钮变灰, 表明当前 还没有提供所需的信息,好,我们就来提供,在左侧选中血磷值(x),然后单击“ ”, x 就被引入了右侧的变量框, 任你用键盘或者用鼠标, 总之将下面这 个算式补充完:x1。现在可见“Continue”按钮再度变黑。在它又变灰之前赶快单击它 (开个玩笑) , 系统回到 Compute Variable 对话框, 请注意 If 按钮右侧的变化:x2。如果你做的结果不一样,请重来一遍。现在单击“OK”按钮, 由于我们要替换变量值, 系统会弹出一个确认对话框, 确认替换,马