SPSS教程医学统计之星：张文彤.docx-道客多多

资源描述

1、第一章 SPSS 概览数据分析实例详解（医学统计之星：张文彤）最后一次更新时间：1.1 数据的输入和保存1.1.1 SPSS 的界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入 SPSS 使用者的行列，首先祝贺你选择了权威统计软件中界面最为友好，使用最为方便的 SPSS 来完成自己的工作。由于该软件极为易学易用（当然还至少要有不太高的英语水平），我们准备在课

2、程安排上做一个新的尝试，即不急于介绍它的界面，而是先从一个数据分析实例入手：当你将这个例题做完， SPSS 的基本使用方法也就已经被你掌握了。从下一章开始，我们再详细介绍 SPSS 各个模块的精确用法。我们教学时是以 SPSS 10.0 版为蓝本讲述的什么？你还在用 7.0 版！那好，由于 10.0 版在数据管理的界面操作上和以前版本有较大区别，本章我们将特别照顾一下老版本，在数据管理界面操作上将按 9.0 及以前版本的情况讲述，但具体的统计分析功能则按 10.0 版本讲述。没关系，基本操作是完全一样的。好，说了这么多废话，等急了吧，就让我们开始吧！希望

3、了解 SPSS 10.0 版具体情况的朋友请参见本网站的SPSS 10.0 版抢鲜报道。例 1.1 某克山病区测得 11 例克山病患者与 13 名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同（卫统第三版例 4.8）？患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人 : 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺：首先要做的肯定是打开计算机（废话），然后进入瘟

4、98 或瘟 2000（还是废话，以下省去废话 2 万字），在进入 SPSS 后，具体工作流程如下：1. 将数据输入SPSS，并存盘以防断电。2. 进行必要的预分析（分布图、均数标准差的描述等），以确定应采用的检验方法。3. 按题目要求进行统计分析。4. 保存和导出分析结果。下面就按这几步依次讲解。1.1 数据的输入和保存1.1.1 SPSS 的界面当打开 SPSS 后，展现在我们面前的界面如下：请将鼠标在上图中的各处停留，很快就会弹出相应部位的名称。请注意窗口顶部显示为 “SPSS for Windows Data Editor”，表明现在所

5、看到的是 SPSS 的数据管理窗口。这是一个典型的 Windows 软件界面，有菜单栏、工具栏。特别的，工具栏下方的是数据栏，数据栏下方则是数据管理窗口的主界面。该界面和 EXCEL 极为相似，由若干行和列组成，每行对应了一条记录，每列则对应了一个变量。由于现在我们没有输入任何数据，所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色，表明该数据单元格为当前单元格。对 Windows 操作界面不熟悉的朋友可参见 SAS 入门第一课中的相关内容。对数据表界面操作不熟悉的朋友可先学习一下 EXCEL 的操作（因为它的帮助是中文的）。有的

6、SPSS 系统打开时会出现一个导航对话框，请单击右下方的 Cancer 按钮，即可进入上面的主界面。1.1.2 定义变量该资料是定量资料，设计为成组设计，因此我们需要建立两个变量，一个变量代表血磷值，习惯上取名为 X，另一个变量代表观察对象是健康人还是克山病人，习惯上取名为 GROUP。对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。选择菜单 Data=Define Variable。系统弹出定义变量对话框如下：该变量定义对话框在 SPSS 10.0 版中已被取消，这里的操作只适合 9.07.0 版的用户。对话框最上方为变量名，现在显示为“VAR00001

7、”，这是系统的默认变量名；往下是变量情况描述，可以看到系统默认该变量为数值型，长度为 8，有两位小数位，尚无缺失值，显示对齐方式为右对齐；第三部分为四个设置更改按钮，分别可以设定变量类型、标签、缺失值和列显示格式；第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量，现在系统默认新变量为数值变量；最下方则依次是确定、取消和帮助按钮。好，先来建立分组变量 GROUP。请将变量名改为 GROUP，然后单击 OK 按钮。有没有搞错？！折腾了半天就改个名字！难道连变量格式、标签等都不改？是这样的，在 SPSS 中所有的数据均以最大位数保存

8、（好象是双精度），也就是说，上面虽然默认只有两位小数，但那指的是计算精度，实际保存的数据位数是非常长的（可以输入 Pi 值试一下）。在绝大多数情况下， SPSS 给出的默认数据类型和数据精度完全可以满足需要，只是不太好看而已。至于标签等比较花哨的选项，反正我也很少用。现在我们才刚刚入门，一切从简。以后我会详细介绍各种设置的用法。在第一列灰色的“var”上双击，同样会弹出定义变量对话框。现在 SPSS 的数据管理窗口如下所示：第一列的名称已经改为了“group”，这就是我们所定义的新变量 “group”。现在我们来建立变量 X。单击第一行第二列的单元格，然后选择菜单

9、 Data=Define Variable，同样，将变量名改为 X，然后确认。此时 SPSS 的数据管理窗口如下所示：现在，第一、第二列的名称均为深色显示，表明这两列已经被定义为变量，其余各列的名称仍为灰色的“var”，表示尚未使用。同样地，各行的标号也为灰色，表明现在还未输入过数据，即该数据集内没有记录。1.1.3 输入数据我们先来输入变量 X 的值，请确认一行二列单元格为当前单元格，弃鼠标而用键盘，输入第一个数据 0.84，此时界面显示如图 A 所示：图 A 图 B请注意：在回车之前，你输入的数据在数据栏内显示，而不是在单元格内显示，现在回车，界面如

10、图 B 所示：首先，当前单元格下移，变成了二行二列单元格，而一行二列单元格的内容则被替换成了 0.84；其次，第一行的标号变黑，表明该行已输入了数据；第三，一行一列单元格因为没有输入过数据，显示为“.”，这代表该数据为缺失值。用类似的输入方式，我们将患者的血磷值输入完毕，并将相应的变量 GROUP 均取值为 1，此时数据管理窗口如下所示：从第 12 行开始输入健康人的数据，并将相应的 GROUP 变量取值为 2。最终该数据集应该有 24 条记录。1.1.4 保存数据选择菜单 File=Save，由于该数据从来没有被保存过，所以弹出 Save as 对话框如下：单

11、击保存类型列表框，可以看到 SPSS 所支持的各种数据类型，有 DBF、 FoxPro、 EXCEL、 ACCESS 等，这里我们仍然将其存为 SPSS 自己的数据格式（*.sav文件）。在文件名框内键入 Li1_1 并回车，可以看到数据管理窗口左上角由 Untitled 变为了现在的变量名 Li1_1。为什么这里的对话框会出现汉字？是这样的，需要从编程的角度来解释： SPSS 在弹出该对话框时会调用 Windows 系统的公用函数，由于我们用的是中文Windows 系统，所以调用出来的就是中文。1.2 数据的预分析1.2.1 数据的简单描述首先我们需要知道数据的基

12、本情况，如均数、标准差等。选择 Analyze=Descriptive Statistics=Descriptives 菜单，系统弹出描述对话框如下：如果按 SPSS 标准的叫法，这里应该是调用了 Descriptives 过程，为了避免太生硬，我们称为调用对话框，等大家熟悉 SPSS 了以后，在统计分析各章中可能两种称呼会混用。该对话框可分为左右两大部分，左侧为所有可用的侯选变量列表，右侧为选入变量列表。我们只需要描述 X，用鼠标选中 X，单击中间的，变量 X 的标签就会移入右侧，注意这时 OK 按钮变黑，表明已经可以进行分析了，单击它，系统会弹出一个新的界面如下所示：该窗

13、口上方的名称为 SPSS for Windows Viewer，即（结果）浏览窗口，整个的结构和资源管理器类似，左侧为导航栏，右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到，24 个数据总的均数为 1.2846，标准差为 0.4687。我们以上的做法对吗？当然有问题！光看总的描述是不够的，还应当看看分组的描述情况。这里要用到文件分割功能，请切换回数据管理窗口，选择 Data=Split File 菜单，系统弹出文件分割对话框如下：选择单选按钮 Organi

14、ze output by groups，将变量 GROUP 选入右侧的选入变量框，单击 OK 钮，此时界面不会有任何改变，但请再做一次数据描述，你就可以看到现在数据是分 Group=1 和 Group=2 两种情况在描述了！从描述可知两组的均数和标准差分别为 1.5209、1.0846 和 0.4218、0.4221。如果定义了文件分割，则它会在以后的所有统计分析中起作用，直到你重新定义文件分割方式为止。1.2.2 绘制直方图统计指标只能给出数据的大致情况，没有直方图那样直观，我们就来画个直方图瞧瞧！选择 Graphs=Histogram，系统会弹

15、出绘制直方图对话框如下：将变量 X 选入 Variable 选择框内，单击 OK 按钮。此时结果浏览窗口内会绘制出如下两个直方图：两组的数据没有特别偏的分布，也没有十分突出的离群值，因此无须变换，可以直接采用参数分析方法来分析。综合设计类型，最终确定采用成组设计两样本均数比较的 t 检验来分析。最后，我们还要取消变量分割，免得它影响以后的统计分析，再次调出变量分割对话框，选择单选按钮中的“Analyze all cases, do not creat group”，单击 OK 按钮就可以了。1.3 按题目要求进行统计分析下面我们要用 SPSS 来做成

16、组设计两样本均数比较的 t 检验，选择 Analyze=Compare Means=Independent-Samples T test，系统弹出两样本 t 检验对话框如下：将变量 X 选入 test 框内，变量 group 选入 grouping 框内，注意这时下面的 Define Groups 按钮变黑，表示该按钮可用，单击它，系统弹出比较组定义对话框如右图所示：该对话框用于定义是哪两组相比，在两个 group 框内分别输入 1 和 2，表明是变量 group 取值为 1 和2 的两组相比。然后单击 Continue 按钮，再单击 OK 按钮，系统经过计算后

17、会弹出结果浏览窗口，首先给出的是两组的基本情况描述，如样本量、均数等（糟糕，刚才的半天工夫白费了），然后是 t 检验的结果如下：Independent Samples TestLevenes Test for Equality ofVariancest-test for Equality of Means95% Confidence Interval of theDifferenceF Sig. t dfSig. (2-tailed)Mean DifferenceStd. Error DifferenceLower UpperXEqual variancesassumed.032

18、.860 2.524 22 .019 .4363 .1729 7.777E-02 .7948Equal variances notassumed2.524 21.353 .020 .4363 .1729 7.716E-02 .7954可见该结果分为两大部分：第一部分为Levenes 方差齐性检验，用于判断两总体方差是否齐，这里的戒严结果为 F = 0.032，p = 0.860，可见在本例中方差是齐的；第二部分则分别给出两组所在总体方差齐和方差不齐时的t 检验结果，由于前面的方差齐性检验结果为方差齐，第二部分就应选用方差齐时的t 检验结果，即上面一行列出的 t= 2.524，

19、 =22， p=0.019。从而最终的统计结论为按 =0.05 水准，拒绝 H0，认为克山病患者与健康人的血磷值不同，从样本均数来看，可认为克山病患者的血磷值较高。1.4 保存和导出分析结果1.4.1 保存结果文件前面我们已经做出了分析结果，但是，可是，可但是，但可是呢？再好的结果只要一断电就会全部消失（废话），对于这一问题人们早已想出了三种解决办法，他们分别是：需要结果的时候再运行一次分析程序。用笔将结果抄在纸上。直接保存结果文件。显然，最方便快捷、最符合信息时代特征的就是第三种方法，在结果浏览窗口中（注意：一定要在结

20、果浏览窗口中）选择菜单 File=Save，由于该结果也从来没有被保存过，所以弹出和前面保存数据时极为相似的一个 Save as 对话框，和前面相比，他唯一的区别就是文件的保存类型只有 View Files(*.spo)一种。好，闲言少叙，在文件名框中键入“Li1_1”并回车，该结果文件就会按文件名 Li1_1.spo 被存储。不是文件保存类型还有一种“ALL Files(*.*)”吗？别费劲了，这种类型是 SPSS 公司放在那里哄人的，在该对话框里无论怎么折腾，都只能按 SPO 文件的格式来保存。1.4.2 导出分析结果文件倒是保存了，但问题还没有完全解决：我们从来写文章

21、什么的都用的是文字处理软件，尤其是 WORD，可 WORD 不能直接读取 SPO 格式的文件，怎么办呢？没关系，SPSS 提供了将结果导出为纯文本格式或网页格式的功能，在结果浏览窗口中选择菜单 File=Export，系统会弹出 Exprot Output 对话框如下：最上方的 Export 下拉式列表可以选择输出的内容，可以为含图表的输出文档、无图表的输出文档和只有统计图表三种；中部的 Exprot File 对话框则填入输出的目标文件名；左下方的 Export What 单选框可以选择输出结果的哪些部分，可以是所有结果、所有可见结果或只输出选择的结果，一般

22、选输出所有可见结果；右下方的输出文件类型下拉式列表已被我打开，可见里面有网页格式和纯文本格式两种，在一切按所需选择完毕后按 OK 钮，则结果文件就会输出为你想要的类型。好，到这里，就象我们刚开始所说的一样，你实际上已经完全掌握了 SPSS 的基本使用方法。我们以后将要做的工作就是“百尺竿头，更进一步”，将从下一章开始详细介绍 SPSS 各个模块的精确用法，使大家能尽快的从 SPSS 新手向 SPSS 高手过度。回教程首页到第二章第二章数据文件的管理（上）（医学统计之星：张文彤）最后一次更新时间：2.1 建立与保存数据文件-File 菜单2.1.1 新

23、建数据文件2.1.2.1 直接打开2.1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File 菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform 菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进一步整理数据文件 -Data 菜单不言而喻，一切统计分析都是以数据为基础的，因此统计软件的数据管理能力非常重要。 SPSS 以其豪华的界面为

24、依托，为用户提供的便捷的数据管理功能，下面我们就来具体看一下。2.1 建立与保存数据文件和大多数应用软件相同，SPSS 中数据文件的管理功能基本上都集中在了 File 菜单上，该菜单的组织结构和 WORD 等也极为相似，因此这里我们只介绍比较有特色的几个菜单项。SPSS 10.0 有三个主要窗口界面：数据管理窗口、程序编辑窗口和结果浏览窗口；另有两个不常用的窗口：结果草稿浏览窗口和 VBs 脚本语言编辑窗口。他们共享许多菜单项，如 File 菜单就大部分相同，这里介绍的许多内容在五个窗口中都是通用的。2.1.1 新建数据文件如果你正从头开始进行一个新的课

25、题，刚刚把数据收集上来，要做统计分析，自然需要新建一个数据库，然后将所有的数据从纸上请到计算机里。在 SPSS 中，新建一个数据库容易的不得了已经到了什么都不用做的地步！是这样，当你进入 SPSS 系统时，系统就已经生成了一个空数据文件，即你看到的空白的数据管理界面。你只要按自己的需要定义变量，输入数据然后存盘就是了（这些操作马上会讲到）。2.1.2 打开其他格式的数据文件凡是做过数据输入工作的人都知道：这活又费眼睛又累人，出错太多了还要挨批评，非常影响个人的光辉形象。算了，还是在有限的经费里划几百美元出来雇个打字小姐吧（怎么用美元？因为我请了个老

26、外！）。可是非常不幸，该同志只会用 EXCEL 2000（又是一个被微软成功洗脑的家伙），数据现已输好，怎么转成 SPSS 数据文件呢？没关系， SPSS 提供了以下几种方法来打开其他格式的数据文件。2.1.2.1 直接打开SPSS 现在可以直接读入许多格式的数据文件，其中就包括 EXCEL 各个版本的数据文件。选择菜单 File=Open=Data 或直接单击快捷工具栏上的“”按钮，系统就会弹出 Open File 对话框，单击“文件类型”列表框，在里面能看到直接打开的数据文件格式，分别是：SPSS(*.sav) SPSS 数据文件（6.010.0 版）SPS

27、S/PC+(*.sys) SPSS 4.0 版数据文件Systat(*.syd) *.syd 格式的 Systat 数据文件Systat(*.sys) *.sys 格式的 Systat 数据文件SPSS portable(*.por) SPSS 便携格式的数据文件EXCEL(*.xls) EXCEL 数据文件（从 5.0 版2000 版）Lotus(*.w*) Lotus 数据文件SYLK(*.slk) SYLK 数据文件dBase(*.dbf) dBase 系列数据文件，（从 dBase IIIV）Text(*.txt) 纯文本格式的数据文件data(*.dat) 纯文本格式的数据文件选择所

28、需的文件类型，然后选中需要打开的文件，SPSS 就会按你的要求打开你要使用的数据文件，并自动转换为数据 SPSS 格式。也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外，中间还有一个“Paste”按钮，该按钮在 SPSS 的大多数对话框中都存在，是用于自动生成 SPSS 程序的，我们以后会专门讲解该问题。2.1.2.2 使用数据库查询打开SPSS 可以直接打开许多类型的数据文件，但这并不是说它可以打开所有类型的数据文件（废话），比如 FoxPro 3.0 以上版本的*.dbf 文件就不能直接打开（有兴趣的话你可以试试）。为此，SPSS 还提供了另一个

29、适用范围更广、但使用上较为专业的数据接口数据库查询。实际上，SPSS 在这里使用的是一种叫 ODBC(Open Database Capture)的数据接口，该接口被大多数数据库软件和办公软件（如 MS Office）支持，通过它，应用程序可以直接访问以结构化查询语言（SQL）做为数据访问标准的数据库管理系统。由于 SPSS 10.0 可以直接打开 EXCEL 所有系列的数据文件，因此数据库查询接口的用处不是很大。但是，在 9.0 及以前的版本中，该查询仍是直接打开 EXCEL 95、97 及 2000 数据文件的唯一办法。ODBC 数据引擎是独立与各种应用软件，直接安装到

30、Windows 系统中的，因此你所用的系统中 ODBC 所支持的数据类型取决于所安装的 ODBC 引擎的情况。还好，大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件（如 MS Office）。不过有一点要提醒大家，许多机器的 OBDC 数据引擎安装有问题（尤其是 D 版），在 SPSS 中使用它往往要死机。选择菜单 File=Open Database=New Query，系统会弹出数据库向导的第一个窗口，其中会列出你使用的机器上已安装的所有数据库驱动程序，选中所需的数据源，然后单击下一步，向导会一步一步的提示你如何做，直至将数据读入 SPSS。我原来准备

31、举一个具体例子，但后来发现不同版本的 ODBC 引擎所弹出的对话框并不相同！不仅如此，不同的数据驱动程序其对话框也各不相同！比如说，有的需要你的 LoginID 和 Password，有的又不需要，因此我这里就不再讲了。由于它使用上太专业（尤其在 10.0 版中，9.0 版还好些），如果确实要用，请找一个对数据库接口比较熟的人来帮你。2.1.2.3 使用文本导入向导读入文本文件选择菜单 File=Read Text Data，系统就会弹出 Open File 对话框，对！和前面的情况完全一样，只是文件类型自动跳到了 Text (*.txt)。实际上，该功能在 S

32、PSS 中已被整合到了 Open File 对话框中之所以在菜单上保留该条目有两个原因： 1. 读入纯文本的情况非常普遍，放在这里更加醒目； 2. 为了和 SPSS 老版本的使用上保持兼容。例 2.1 现有一数据文件以纯文本的形式存为“c:Li2_1.txt”，且第一行为变量名，请将其读入 SPSS。解：在 Open File 对话框选中相应的文件名并单击“确定”，系统会自动启动文本导入向导对话框如下：在 SPSS 10.0 中，该向导并没有重新设计，因此仍然有问题被截断无法显示完的情况出现。可以看到该向导共分 6 步，这是第一步。中部为一对单选按钮，问题为“你的文本

33、文件和预定义格式相一致吗？”，下方为按预定义格式读入的数据文件的预览。显然，SPSS 的预定义格式并没有正确识别该文件。因此选择“No”并单击“下一步”，系统弹出向导的下一个对话框如下：最上方的问题是“你的变量是如何排列的？”，下面的选项分别为 Delimite（用某种字符区分）和 Fixed Width（固定宽度），一般都是 Delimite，第二个问题是“变量名包括在文件最前面了吗？”，我们当然选“Yes”,单击“下一步”，系统弹出第三个对话框：最上方的句子意为“第一条记录从第几行开始？”，右侧可以输入行数。由于我们所用的数据第一行为变量名，因此这里输入 2。

34、下面的问题是“你的记录是怎样存储在文件中的？”。可以是“每一行代表一条记录”，或者“每* 个变量代表一条记录”，数据一般都是第一种情况。下一个问题是“你想导入多少条记录？”，可以是“所有记录”、“前*条”或“随机导入*%的记录”。一般也选前者。单击“下一步”，第四个对话框如下：我这里写的非常详细，但实际使用中你可以不管大多数问题，因为 SPSS 一般都能自动正确设置。最上方的问题为“变量间用的是哪种分隔符？”，可选的有 Tab 键、空格、逗号、分号或自行定义的其他符号。本数据采用的是空格，可见系统已经自动识别并选择了空格，而下方的数据预览窗口显示出了正确的数据读入情况。单

35、击 “下一步”，第五个对话框如下：上方的提示为“定义在数据预览窗口中所选择的变量。 ”。顾名思义，在这个对话框中你可以在数据预览窗口中选择某一列变量，然后更改其变量名和类型。当然，在这里我们不用这样做，直接单击“下一步”，系统弹出文本导入向导的最后一个对话框如下：最上面的问题为“你愿意保存这次的文件（读入）格式设置以备下次使用吗？”，第二个问题为“你是否愿意将以上操作粘贴为 SPSS 语句？”，一般这两个问题我们都可以不管。单击“完成”，系统最终成功的读入了 Li2_1.txt。2.1.3 保存数据文件在对数据做了修改后，保存数据文件是必不可少的工作之一。选择菜

36、单 File=Save，如果数据文件曾经存储过，则系统会自动按原文件名保存数据；否则，就会弹出和选择 Save as 菜单时相同的 Save as 对话框。里面可以保存的数据类型和可以打开的几乎一样多，选择合适的类型，确定就是了。Save 命令的快捷键为S，如果你曾经领教过 Windows 死机的巨大潜力，那么你一定会同意习惯性的随手按S 至少不能算是一个坏习惯。如果你准备将数据存为 SPSS 以外的其他类型，要注意有些设置可能会丢失，如标签和缺失值等。尤其是缺失值，如果想存的数据格式不支持缺失值，那你的数据可能会变的面目全非。2.1.4 File 菜单中的其他

37、条目【Disp Data Info】该菜单项用于显示数据的基本信息，选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件，选择好后按 OK，系统就会在结果窗口中列出所选数据的基本情况，如建立时间、标签设置、记录数、变量设置等。【Apply Data Dictionary】即使用数据字典，该功能使你可以直接在新数据集中套用以前定义好的变量设置（格式、标签等，但不包括数据类型），举个例子吧：请打开 Li1_1.sav 文件，将变量 x 的长度从 8 改为 4，标签删掉，然后选择菜单 File=Apply Data Dictionary，在文件对话框中选择 Li1_1.sa

38、v 并按 OK（即将 Li1_1.sav 的变量设置按相同变量名一一套用在现在的数据集上），怎么样？一切都变回去了吧。【Cache Data】建立数据缓冲区。以前 SPSS 每执行一条命令都会重新读取所需的数据，如果是从远程用 SQL 调用数据库，这会非常的费时。现在使用 Cache Data，可以将数据全部读入暂存盘，建立活动数据的缓冲区。大大加快处理速度。不过我特意试了一下，如果是处理本机数据的话，该命令对速度的提升不是非常明显:(。【Print 和 Print Preview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来，其中Print Preview 是新增

39、加的，使用上和 WPS2000 的打印预览非常相似（其实用的是同样的程序），不过和 SPSS 结果的打印程序一样，用 SPSS 直接打印数据非常的浪费纸张，用不用你自己决定吧。【Stop Processor】用于停止执行当前的 SPSS 命令。由于 SPSS 处理速度非常的慢，如果你正在对一个大型的数据执行统计命令，等了半天都没有结束，此时你的另一半约你逛街的时间又要到了，可是你的结果还没有存，执行命令时又存不了，怎么办呢？试试这个命令吧。并非所有的命令都可以喊停的，许多数据库操作命令（计算变量，合并等）好象就停不了。2.2 编辑数据文件在 SPS

40、S 中，数据文件的编辑、整理等功能被集中在了 Data 和 Transform 两个菜单项中，这两个菜单的内容如下所示：Data 菜单项 Transform 菜单项下面我们将根据其功能来分别讲述。2.2.1 定义新变量2.2.1.1 直接定义新变量大多数情况下我们需要从头定义变量，在 SPSS 10.0 中，定义变量的操作界面和 FoxPro 等数据库非常相似，只需单击左下方的 Variable View 标签就可以切换到变量定义界面开始定义新变量。如 Li1_1.sav 的变量定义如下所示：以变量 x 为例：变量名为 x，类型为 Numeric，宽度

41、为 4，小数位数 2 位（因小数点还要占一位，故整数位只有一位），变量标签位为“血磷值”。右侧在图中未能看到的依次为 Values，用于定义具体变量值的标签； Missing，用于定义变量缺失值；Colomns，定义显示列宽；Align，定义显示对齐方式；Measure，定义变量类型是连续、有序分类还是无序分类。使用该窗口，我们可以一次定义许多新变量，不会象老版本那样一个一个的定义了。由于 SPSS 是英文软件，变量名采用中文会有潜在的冲突（100%的兼容性是不存在的，典型的例子就是微软公司的产品）。对于喜欢搞点花样的用户，这里有必要介绍一下 SPSS

42、中标签和缺失值的定义方法：标签和老版本不同，现在变量标签和变量值标签被分开设置，变量标签就在 Label 框中直接输入，变量值标签则在它右侧的 Value 框定义。以 group 为例，单击 Value 框右半部的省略号，会弹出变量值标签对话框如下：上部的两个文本框分别为变量值输入框和变量值标签输入框，分别在其中输入“1”和“克山病患者”，此时下方的 Add 钮变黑，单击它，该变量值标签就会被加入下方的标签框内。与此类似定义变量值“2”为“健康人”，最后按 OK，变量值标签就设置完成。此时你做任何分析，在结果中都有相应的标签出现。如果你现在就想看效果，切换回

43、 Data View 界面，然后选择菜单 View=Value Labels，怎么样，看到了吗？缺失值单击 missing 框右侧的省略号，会弹出缺失值对话框如下：界面上有一列三个单选钮，默认值为最上方的“无缺失值”；第二项为“不连续缺失值”，最多可以定义 3 个值；最后一项为“缺失值范围加可选的一个缺失值”，文如其意，不用我多解释了吧。回第一章回教程首页到第二章（下）第二章数据文件的管理（下）（医学统计之星：张文彤）最后一次更新时间：2.1 建立与保存数据文件 -File 菜单2.1.1 新建数据文件2.1.2.1 直接打开2.

44、1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File 菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2从原有变量计算新变量-Transform 菜单2.2.2 数据的录入2.2.2.1直接录入2.2.2.2数据录入技巧2.3 进一步整理数据文件-Data 菜单2.3.1 用于数据管理的菜单项2.3.2 正交设计菜单项 2.2.1.2 从原有变量计算新变量从头定义变量的情况多数在建立数据集时出现。但是，当数据集已经

45、建立，需要整理、转换变量时，碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是，首先我们需要了解一下所用的对话框界面的情况。【SPSS 对话框元素介绍】下面是我们在第一章曾经见过的两样本 t 检验对话框：这是一个非常典型的 SPSS 对话框。它包含了许多具有 SPSS 特色的对话框元素：o 对话框左侧为候选变量列表框，里面列出了可被该对话框使用的变量；o 右上方为 Test Variables 框，可将变量选入其中；注意在两个框的中间用“ ”相连，这是变量移动按钮，其方向表明是将变量从那个框移动到哪个框，上图

46、中我们选中了变量 group，两个移动按钮均变黑并向右指，表明变量 group 可以移动到他们右侧的两个框里去，改变当前框（在其他两个框里单击），移动按钮就会转向、变灰等以表明不同的意思（墙头草一个，可别小看这个功能，我想用 VB 实现这个功能，也是费了些工夫才把它搞定了）；o 右侧为一排五个按钮，分别是确定、粘贴、重置、取消和帮助。这五个兄弟也是几乎永远一起出现的，另外四个大家都比较熟悉了，重置（Reset）按钮用于取消对话框内已做的选择，恢复到默认的状态；o 最下方有个 Options 按钮，用于设置专门用于该对话框的选项；o OK、 Paste 两个按钮为灰色，表

47、明所需条件尚未满足，该按钮暂不可用。同理， Grouping Variable 框下方的 Define Groups 按钮为灰色显示，也表明暂不可用。【Compute Variable 对话框】例 3.2 在 li1_1.sav 中建立新变量 temp，令其值当血磷值大于 1 时为 2，否则为 1。解：这里需要用到 Compute Variable 对话框，外加一点技巧。首先给变量 temp 均赋值为 1，然后将血磷值大于 1 的记录其 temp 变量值改为 2 即可。选择菜单 Transform=Compute，弹出 Compute Variable 对话框如下：左上角为需要计算的

48、变量名，在其中键入“temp”，此时“Type&Lable”按钮就会变黑，喜欢精确的朋友可以在这里对 temp 进行详细的定义，但如果你和我一样非常懒，就可以对它视而不见（不要生气，聪明人大多都非常懒:)）；左下方为候选变量列表，现在还用不着；中部为类似计算器的软键盘，可以用鼠标按键输入数字和符号，这里我们直接输入“1”，输入的内容回立刻在右上方的数值表达式窗口中出现；软键盘右侧为函数窗口，可以在这里找到并使用所需的 SPSS 函数；这次也用不到。好，现在“OK”按钮已经变黑，单击他，系统就会自动生成一个新变量 temp，并且取值均为 1。软键盘上几个奇奇

49、怪怪的符号的含义如下：= & | * 不等号，等价于Compute，系统也再次弹出这个对话框等等！注意到了吗？该对话框自动记住了你上次输入的内容，几乎所有 SPSS 的对话框都有这个特性，这会大大方便我们的使用。好，将数值表达式窗口中的 1 改为 2，然后单击中下部的“If”按钮，系统弹出记录选择对话框如下：不需要太多解释，大部分内容都是前面见过的。由于我们这里不是对所有记录做变换，因此选中第二个单选钮“Include if case statisfies confition:”，此时下方的所有窗口变亮，表明现在可用；而“Conti nue”按钮变灰，表明当前还没有提供所需的信息，好，我们就来提供，在左侧选中血磷值(x)，然后单击“ ”， x 就被引入了右侧的变量框，任你用键盘或者用鼠标，总之将下面这个算式补充完：x1。现在可见“Continue”按钮再度变黑。在它又变灰之前赶快单击它（开个玩笑），系统回到 Compute Variable 对话框，请注意 If 按钮右侧的变化：x2。如果你做的结果不一样，请重来一遍。现在单击“OK”按钮，由于我们要替换变量值，系统会弹出一个确认对话框，确认替换，马

展开阅读全文