中南大学医学科研统计学课件 ppt.ppt-资源下载-道客多多-道者的世界，分享的人生！

中南大学医学科研统计学课件 ppt.ppt

1、,SPSS 13.0 for Windows 在医学科研统计中的应用中南大学公共卫生学院卫生统计教研室虞仁和13874891137,数据处理的一般原则,医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等各个方面，是一门很高超的艺术。在数据处理过程中，原始数据的采集和录入，数据的管理，恰当选用统计方法，熟练使用统计软件等，都是必须重视的关键环节。,原始数据的记录形式,原始数据的记录形式,原始数据中，变量分为标识变量和分析变量两种。标识变量主要用于数据管理，包括数据的核对与增删等，是研究记录中不可缺少的内容，如表25-1中的“病人编号”和“病案号”即为标识变量。分析变量则是

2、数据分析的主要内容，表25-1中除上述2个标识变量外，其它9个变量均为分析变量。分析变量又被分为反应变量(response variable)和解释变量(explanatory variable)。反应变量是表示试验效应或观察结果大小的变量或指标。解释变量又称指示变量(indicator)、分组变量(grouping variable) 、分类变量(categorical variable) 、协变量等。根据研究目的以及变量间的相互关系，各变量的作用并非一成不变。,原始数据的录入,在进行统计分析前，原始数据需录入计算机。录入的文件类型大致有：数据库文件，如dBASE、FoxBASE、Lotus

3、、EPI info等；Excel文件；文本文件，如word文件、WPS文件等；统计应用软件的相应文件，如SPSS数据文件、SAS数据文件、STATA数据文件等。目前，上述文件类型绝大多数都可以相互转换。录入数据时，应遵循便于录入，便于核查，便于转换，便于分析的原则。便于录入是指尽可能地减少录入工作量，例如，下图是表25-1原始数据录入为SPSS数据文件（CH25-1.sav）的形式，录入时，用数值变量取代了字符变量（如图中的“性别”，“肾毒性”，“黄疸”，“昏迷”），可以大大节约录入的时间和费用。(如将性别标记为1=“男”，0=“女”)。,原始数据的录入,数据处理中的几个基本问题,1数据核查

4、数据录入后，首先须对录入的数据进行核查，以确保录入数据的准确性和真实性。核查准确性可分两步进行。第一步逻辑检查，通过运行统计软件中的基本统计量过程，列出每个变量的最大和最小值，如果某变量的最大或最小值不符合逻辑，则数据有误。例如，在SPSS数据文件中，当变量“年龄”的最大值为“300”时，一定有误。利用软件的查找功能可立即找到该数据，然后根据该数据对应的标识值找出原始记录，更正该数据。如本例可查到该数据对应的 “病人编号”为“27”，查原始记录的年龄为“30”。第二步数据核对，将原始数据与录入的数据一一核对，错者更正。有时，为慎重起见，采用双份录入的方式，然后用程序作一一比较，不一致者一定是录

5、错的数据。数据核查的另一项任务是对数据的真实性做出初步判断。,数据处理中的几个基本问题,2离群数据的处理当个别数据与群体数据严重偏离时，被称为离群数据(outlier)或极端数据（extreme value）。统计软件一般都有判断离群数据的方法。判断离群数据有多种方法，例如，SPSS软件对其的定义为：观察值距箱式图(box plot)的箱体底线（第25百分位数）或顶线（第75百分位数）的距离为箱体高度（四分位数间距）的1.5倍至3倍时被视为离群点；观察值距箱体底线或顶线的距离超过3倍的箱体高度时被视为极端值。若有离群数据出现，可分为两种情况处理：一种是，如果确认数据有逻辑错误，又无法纠正，

6、可直接删除该数据。例如，若某一数据中某病例的身高变量为“1755”cm，且原始记录亦如此，又无法再找到该病例时，显然这是一个错误的记录，只能删除。另一种是，若数据并无明显的逻辑错误，可将该数据剔除前后各做一次分析，若结果不矛盾，则不剔除；若结果矛盾，并需要剔除，必须给以充分合理的解释，例如用何种方法确定偏离数据，该数据在实验中何种干扰下产生等。,数据处理中的几个基本问题,3统计方法前提条件的检验：应用参数方法进行假设检验往往要求数据满足某些前提条件，如两个独立样本比较t检验或多个独立样本比较的方差分析，均要求方差齐性，因此需要做方差齐性检验。如果要用正态分布法估计参考值范围，首先要检验资料是

7、否服从正态分布。在建立各种多重回归方程时，常需检验变量间的多重共线性和残差分布的正态性。,统计方法选择的基本思路,数据处理中，正确选择统计方法至关重要。选择统计方法可以沿着以下思路进行。第一个层面，看反应变量是单变量、双变量还是多变量。对于前者，第二个层面看属于三种资料类型中的哪一种；第三个层面看单因素还是多因素；第四个层面看单样本、两样本或多样本；第五个层面看是否是配对或配伍设计；第六个层面看是否满足检验方法所需的前提条件。,单变量计量资料的分析,1样本均数与总体均数比较分析思路为：反应变量为单变量计量资料单因素样本均数与总体均数比较如果服从正态分布，选用样本均数与总体均数比较的t检验(o

8、ne-sample t-test)；如果不服从正态分布，则考虑用非参数检验方法。2两个相关样本均数的比较分析思路为：反应变量为单变量计量资料单因素两个相关样本均数比较（因为是配对设计）。如果差值服从正态分布，选用配对t检验(paired t-test)；如果差值不服从正态分布，选用单样本秩和检验(Wilcoxon one-sample test)。3两个独立样本均数比较分析思路为：反应变量为单变量计量资料单因素两个独立样本均数比较。如果方差齐性，且两样本均服从正态分布，选用两样本t检验(two-sample t-test)；如果方差不齐，但两样本均服从正态分布，选用t检验，或两样本秩和检验

9、(Wilcoxon two-sample test / Mann-Whitney test)；如果方差不齐，且两样本不服从正态分布，选用两样本秩和检验。本例选两样本t检验。,单变量计量资料的分析,4多个样本均数比较应变量为单变量，又属计量资料时，多个样本均数比较分为单因素和多因素两种情形。而重复测量资料则被视为多个反应变量的类型。(1) 单因素方差分析：若方差齐性，且各样本均服从正态分布，选单因素方差分析（one-way ANOVA）；若方差不齐，或某样本不服从正态分布，选Kruskal-Wallis 秩和检验(Kruskal-Wallis test)。若方差分析或秩和检验结果显著，需进一步

10、做多重比较，如SNK法，LSD法，扩展t检验等。(2) 两因素方差分析但不分析交互作用：主要是随机区组设计资料，涉及2个因素，即1个处理因素和1个区组因素。如果满足方差齐性和正态分布两个条件，选用两因素方差分析(two-way ANOVA)，如果不满足上述两个条件，选用随机区组设计资料的Friedman秩和检验(Friedman test)。,单变量计量资料的分析,(3) 三因素方差分析但不分析交互作用：主要有拉丁方设计和二阶段交叉设计两种资料类型。对于拉丁方设计资料，涉及3个因素，即1个处理因素和2个区组因素；对于二阶段交叉设计资料，3个因素分别为处理因素、受试者和试验阶段。如果满足方差齐

11、性和正态分布两个条件，拉丁方设计可选用三因素方差分析(three-way ANOVA)，如例4-5；二阶段交叉设计可选用广义线性模型的方差分析，如例4-6。如果不满足上述两个条件，选用非参数方法（参见有关文献）。若对处理因素的方差分析或秩和检验结果显著，均需进一步做多重比较。,单变量计量资料的分析,(4) 多因素方差分析且分析交互作用：此类资料包括析因设计资料（例11-2），正交设计资料（例11-4），嵌套设计资料（例11-6），裂区设计资料（例11-7）等。 (5) 重复测量资料：单因素重复测量只有1个重复测量因素，如表12-3的数据。多因素重复测量除有1个重复测量因素外，至少还有1个

12、其它处理因素，可分析交互作用，如例12-3。,单变量计数资料的分析,单变量等级资料的分析,若为两组配对等级资料的比较，选Wilcoxon单样本秩和检验；若为两组独立样本等级资料的比较，选Wilcoxon两样本样本秩和检验；若为多组独立样本等级资料的比较，选Kruskal-Wallis秩和检验。,双变量资料的分析,1简单相关分析分析两变量的相关关系时，若两变量满足二元正态分布，可选Pearson积矩相关分析(Pearson correlation)；若两变量不满足二元正态分布，可选Spearman秩相关分析(Spearman correlation)。2线性回归分析分析两变量的回归关系时，若

13、两变量关系呈线性趋势，可选简单线性回归分析（linear regression）。3曲线回归分析分析两变量的回归关系时，若两变量关系呈曲线趋势，可按曲线类型选指数曲线，多项式曲线，生长曲线，Logistic曲线等。也可选用非线性回归分析方法。,多变量资料的分析,1有应变量的多元分析若应变量Y为数值型随机变量，且服从正态分布，自变量满足多元正态分布，可选多元回归分析或多元逐步回归分析因变量Y为分类变量（二分类或多分类），且以判别分类为主要目的，自变量满足多元正态分布，可选判别分析或逐步判别分析。若因变量Y为生存时间，并含有截尾数据，可选Cox模型做生存分析，若因变量Y为二分类变量或多分类变

14、量，且以分析危险因素为主要目的，如果为配比设计，选条件Logistic回归；如果无配比设计，选非条件Logistic回归。,多变量资料的分析,2. 无因变量的多元分析欲将变量或观察单位划分为性质相近的k类，可选用聚类分析。 3. 相关分析若分析1个变量与1组变量的相关关系，可选多重线性相关分析；若分析1组变量与另1组变量的相关关系，可选典型相关分析。,SPSS for Windows 概述,SPSS(Statistics Package for Social Science)社会科学用统计软件包，是目前世界上最优秀统计分析软件之一。随着产品服务领域的扩大和服务深度的增加，其英文全称已于20

15、00年更改为“Statistics Product and Service Solutions” 统计产品与服务解决方案。事实上，它不仅适用于社会科学，同样可应用于自然科学，如生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。,SPSS for Windows的特点,(1) 操作简便 (2) 数据管理功能强大且操作直观(3) 功能模块组合灵活(4) 统计分析方法比较全面,软件的启动与退出,(一) SPSS for Windows的启动1、双击（或单击）程序的桌面快捷方式图标启动SPSS。2、通过“开始”菜单的“程序”运行方式启动SPSS。(二) SPSS for Window

16、s的退出1、单击主菜单中的“File”，在下拉菜单中单击“Exit”，可退出SPSS。2、单击主菜单右上角控制框中的关闭按扭，可退出SPSS。,主界面(数据编辑窗)简介,数据编辑窗,数据编辑窗由数据视区(Data View)和变量视区(Variable View)组成，两个视区切换单独显示。数据视区用于显示和编辑变量值；变量视区用于定义、显示和编辑变量特征。在SPSS过程中，一次只能打开和显示一个数据文件。,菜单条,标题栏下面是一行由10个菜单项组成的主菜单，其内容为： File 文件操作 Edit 文件编辑 View 设置操作界面的外观 Data 数据文件的建立与编辑 Transform 数

17、据转换 Analyze 统计分析 Graphs 统计图表的建立与编辑 Utilities 实用程序 Windows 窗口信息与控制 Help 帮助,用SPSS实现其统计分析过程,1启动SPSS2. 数据文件的建立或读入 (1)制定数据文件结构 (2)录入数据(3)编辑数据文件 3数据的统计处理 4结果输出 5保存文件,数据文件的建立,数据编码定义变量数据录入数据文件的存储,数据编码（一）,1.定义数据项的变量名(Variable) 定义变量名应遵循如下原则：l首字符必须是英文字母或汉字，不能以下划线“”或圆点“.”结尾。l 变量名不能使用SPSS的保留字。SPSS的保留字有：ALL、AN

18、D、BY、 OR、NOT、EQ、GE、GT、LE、LT、NE、TO、WIIH等。l变量名中不能有空格或某些特殊符号，如“!”、“？”和“”等。l系统中不区分变量名中的大小写字符。例如WANG与wang被认为是同一变量。,数据编码（二）,2.定义数据项变量的标签(Variable Label) 定义标签是对该变量名所表示的数据项内涵的进一步说明。有时变量名不足以表示该变量的内涵，这时需要定义变量的标签。而变量标签最多可由256个字符组成。在统计分析过程的输出中会在变量名对应的位置显示该变量的标签，有助于理解输出结果。变量标签为可选项(option)，可以定义，也可以不定义。,数据编码（三

19、）,3.定义变量名取值的变量值标签(Value label)每个变量名对应一个数据项，每个变量取不同的值，表示数据项中的不同信息。有时为了更好理解统计分析过程中的输出结果，要给变量的取值（简称变量值）赋以标签。那么在输出结果的相应位置上就会出现该标签，使读者一目了然。并不是所有变量值都要取标签，一般来说离散变量才给变量值定义标签。例如：变量名变量标签变量值变量值标签 sex 性别 1 男 2 女,定义变量（一）,定义变量名定义变量类型定义变量长度（小数点）定义变量标签定义变量值标签定义变量显示格式（宽度、对齐方式）,定义变量（二）,定义变量步骤如下：(一) 首先启动SPSS for Wi

20、ndows，进入 SPSS 的主画面数据编辑窗口。 (二) 激活定义变量对话框激活定义变量（Define Variable）对话框有两种方法：1.从数据编辑窗口中选择“ Variable View”按纽。2.将光标置于数据窗的变量名var处，双击。,定义变量名和变量类型,(三) 定义变量名在定义变量对话框中的“Name”下面输入要定义的变量名（如sex）。 (四) 定义变量类型单击定义变量对话框中的“Type”按钮，弹出定义变量类型(Define Variable Type)对话框。对话框中出现八种可供选择的变量类型，分别是：,定义变量类型,“Numeric” 标准数值型变量，系统默认“

21、Comma” 带逗点的数值型变量：千进位用逗号分隔，小数与整数间用圆点分隔“Dot” 圆点数值型变量：千进位用圆点分隔，小数与整数间用逗号分隔“Scientific notation” 科学计数法“Date” 日期型变量“Dollar” 带美元符号的数值型变量“Custom currency” 自定义变量“String” 字符型变量,定义变量类型,若选了“Numeric”，则用户可在定义变量类型(Define Variable Type)对话框中部的“Width”、“Decimal”文本框中键入相应的数值型的宽度（长度）及小数位数。其默认值为宽度：8，小数位数：2。应该注意，数值型的宽度应该

22、大于该变量的数据的“整数位数+小数位数+”。若选了“String”，则用户可在定义变量类型(Define Variable Type)对话框“Width”文本框中键入字符串的长度。,定义变量标签和变量值标签,单击定义变量对话框中的“Labels”按钮，键入“性别”即可单击定义变量对话框中的“Values”按钮，弹出变量值标签对话框在“Value Labels”区域用户可键入变量值标签：首先在“Value:”后的文本框内键入变量值，再在“Value”后的文本框内键入该变量值的标签，然后用单击“Add”按钮。重复此操作，直到全部变量值及其标签都输完为止。例如sex变量，应先在“Value:”中键

23、入1，再在“Value”中键入“男”，然后击“Add”按钮。类似的，继续在“Value:”中键入2, 在“Value”中键入“女”，然后再单击“Add”。至此，所有变量值都已赋以标签，按“OK”钮，返回到定义变量对话框。,定义变量的显示格式,定义变量的显示格式包括两部分内容，即变量的显示宽度及变量显示的对齐方式。这种显示格式的设置不仅在屏幕的数据窗口中有反映，并且在数据打印输出时，也按此显示格式，所以，是很有实用价值的。单击定义变量对话框中的“Columns”按钮，输入变量的显示宽度。单击定义变量对话框中的“Align”按钮，弹出定义变量显示格式对话框，在“ Align”中，选“Left”（左

24、齐）、“Center”（居中）、“Right”(右齐)。,数据录入,按变量输入数据把光标移到要输入的该变量名对应的一列的顶部，即序号为1的单元格并单击之，使该单元格为当前操作的单元格，输入该变量的第一个值，回车。此时，序号为1的单元格接受该数值，并且当前操作单元格下移到序号为2的单元格。输入第二个值，回车。如此一直到把该变量的数值输完为止。按观察序号输入数据先把光标移到第一个变量和第一个观察单位序号的交叉单元并单击之，使之成为当前操作单元格。输入第一个观察单位序号的第一个变量值，按“Tab”键，该单元格接受该数据，同时激活右边一个单元格（即成为当前操作单元格）。接着，输入第一个观察单位序号的

25、第二个变量，按“Tab”键；。直到输完第一个观察序号的最后一个变量值。按全屏幕任意单元格输入数据要想输入某个观察序号的某个变量值，可以移动光标到二维数据表格中的相应的单元格并单击之，使之成为当前操作单元格。键入变量值，回车即可。,数据文件的存储,数据存储SPSS for Windows提供两种数据保存方式:1.保存为SPSS for Windows数据文件中2.保存为其他格式的数据文件选主菜单“File”中的“Save”或“Save as”,弹出保存文件（Save Data As）对话框，选择保存路径，键入文件名，确定数据类型，单击保存。SPSS的文件类型l 数据文件：扩展名为.savl

26、结果文件：扩展名为.spol 图形文件：扩展名为.chtl 命令文件：扩展名为.sps,调用已建立的数据文件,选择“File”/“Open/Data”，打开文件（Open File）“文件类型”下拉列表框中选择相应的文件类型。 SPSS (*.sav) SPSS for Windows建立的数据文件 SPSS/PC+ (*.sys) SPSS for DOS建立的数据文件 SPSS Portable (*.por) 其他软件生成的ASCII文件 EXCEL (*.xls) EXCEL建立的数据文件 DBASE (*.dbf) dBASE、FOXBASE、FOXPRO产生的数据文件 Lotus

27、 (*.w*) 用Lotus 1.2.3产生的数据文件选定文件,单击打开(O)按钮，选定的文件就被读入。,数据文件的编辑,在建立数据文件之后，有时需要对原来的数据文件进行编辑加工，它包括对数据的排序、变量的增加或删减、观察值的增加或修改，对数据进行转换或重新编码，根据已存在的变量建立新变量等， SPSS for Windows提供了丰富的编辑功能，现分述于下：,数据的搜索(一)搜索指定的观察序号(个案),从菜单选择Data / Go to Case，弹出 Go To Case （到某一记录）对话框，填入某一记录的编号（数据编辑窗左侧一列的顺序号），击 OK 按钮后，光标移到该记录。,数据的搜

28、索(二) 搜索指定变量中的指定数据的单元格,1. 单击主菜单中的“File”菜单项，在其下拉菜单中“Open”寻找“Data”，用鼠标单击之，在弹出的打开数据文件对话框中，选择“练习题.sav”并单击，再按“OK”钮，则读入了数据文件。2. 光标移到变量名为年龄所在列中任意单元格，单击鼠标键。3. 单击主菜单中的“Edit”菜单项，在其下拉菜单中寻找“Find”并用鼠标单击，则打开了“Find Data in Variable AGE”的对话框。4. 在“Find”后矩形框内键入32，按“Find Next”钮，如果找不到则会出现“Not found”。如果找到了，则激活数据编辑器，在数据文件

29、中显示找到的变量值。光标自动跳到该值所在的单元格，读者可以进行编辑。在“Find Data in Variable AGE ”的对话框中，“Match case”表示忽略字符中的大小写的区别。,变量的插入与删除,(一) 插入一个变量1. 选定“Variable View”，单击该按钮；2. 把光标定位于新的变量要占据的那一行的变量名序号的位置上，右击鼠标键，展开快捷菜单；3.在快捷菜单中选择“Insert Variable”并单击鼠标左键。结果在选定的位置上插入一个变量名为“Var0000n”的变量，其原来占此行的变量及其下侧的变量全部下移。读者可以对插入变量进行变量及其属性的定义。(二) 删

30、除一个变量1.将光标移至待删除的变量名处，单击鼠标键。被选中的变量占有列的全部单元格都被反白显示；2.右击鼠标键，展开快捷菜单；3.在快捷菜单中单击“Cut”项，选中的变量(整个列)暂时消失(存入剪贴板)，还可用Paste恢复；如果鼠标单击“Clear”，则为不可恢复的删除。结果被选中的变量消失，其后的变量左移一列。,观察单位(个案)的插入与删除,(一) 插入一个观察单位1.用光标置于要插入的那一行的最左边的序号单元格中，单击鼠标键；2.点按鼠标右键，弹出快捷菜单3.在快捷菜单中选择“Insert Case”，单击鼠标键。结果在选中的一行上增加一个空行，可以在此空行上输入该观察单位(个案)的各

31、变量值。而原来在此行的观察单位及其以下的观察值都自动下移一行。 (二) 删除一个观察单位(个案)1.用光标置于选定的观察单位的序号上，单击鼠标键。则该观察单位全部单元格都反白显示；2.点按鼠标右键，弹出快捷菜单3.在快捷菜单中选择“Cut”项，单击鼠标键，选中的观察单位暂时消失(存入剪贴板)，尚可用Paste恢复；如果鼠标单击“C1ear”，则为不可恢复的删除。结果，被选定的观察单位消失，其下面的各观察值都自动上移。,数据的剪切、复制和粘贴,(一) 选择操作对象 1.选择变量：将光标置于选定的变量名上，单击鼠标键。该变量名所在列的各单元格都反白显示。 2.选择观察单位：将光标置于选定的观察单位

32、序号上，单击鼠标键。则该观察单位一行上的单元格全部反白显示。 3.选择某个变量的若干个连续单元格：如果要选择某个变量的第二个至第九个的变量值，则得将光标置于该变量的第二个变量值上，按下鼠标左键向下拖动鼠标一直到第九个变量值再松开鼠标键，使选中的单元格全部反白显示。 4.选择某观测量中的若干个连续的单元格：选择开始的单元格，按下鼠标左键，向右横向拖动鼠标，直到选中的单元格全部变为反白显示时，松开鼠标键。,(二) 剪切、拷贝和粘贴,1.剪切包含两种状态：一种是单纯剪切，相当于删除;另一种在原处剪切，转移粘贴到另一处适当的地方。剪切的操作是：单击主菜单“Edit”菜单项，展开下拉菜单，选择“Cu

33、t”，单击鼠标键，选定的内容从数据编辑器中消失，并且暂时转存到假想的剪贴板上保存起来。 2.拷贝是要把选中的内容复制到另一适当的位置，而其原来的内容还在原来的位置上。拷贝的操作是：单击主菜单“Edit”菜单项，展开下拉菜单，选择“Copy”，单击鼠标键。其结果是原来选定不变，而其相同内容存储到剪贴板上。应该注意，剪贴板上的内容是暂时保存的，一旦新的剪切或拷贝的内容存入剪贴板，原来在剪贴板上的内容将全部消失。 3.粘贴是把剪切操作或拷贝操作存人剪贴板的内容粘贴到新的适当的地方。, 拷贝和粘贴一个变量首先按本节 (一)的方法选择一个变量；其次按剪切或拷贝操作，把它转存到剪贴板上; 再次，

34、按插入变量的办法，在适当位置上选定插入一个空变量；最后单击主菜单“Edit”菜单项，展开下拉菜单，在其中选择“Paste”，单击鼠标键。结果，暂存在剪切板上的变量值全部填充在插入的空变量的各单元格中。但是，其变量名是“Var0000n”，它的属性与原来系统默认值相同，必要时，读者应重新定义其变量名和属性。拷贝和粘贴一个观察单位首先按本节一、(二)选择一个观察单位；其次用剪切拷贝操作，将其存入剪贴板上；再次用插入一个观察单位的办法，在适当的位置上插入一个空观察单位；最后单击主菜单的“Edit”菜单项，展开下拉菜单，选择“Paste”单击鼠标键。结果，暂存在剪贴板上的观察单位的诸变

35、量值全部填充到该插人的空观察单位上。拷贝和粘贴变量或观察单位的部分内容，其操作方法与上面类似。,排序（按某个变量值进行排序）,(一)先打开某个数据文件。(二)在主菜单中单击“Data”菜单项，展开下拉菜单。(三)在下拉菜单中选择“Sort Cases”并单击之，则弹出“Sort Cases”的对话框。在对话框中上部，有“Sort by：”，读者事先要想好根据哪一个或哪些变量的值对观测量进行排序,这些变量我们可称之为BY变量。在左边源变量框中选择这些变量，并通过单击向右箭头按钮将选中的BY变量移到右面的Sort by下面的矩形框中。应该注意，如果选择了两个以上BY变量，观测量排序的结果与BY变

36、量在栏内的顺序有关。列在首位的称之为第一BY变量，其后的顺序称之为第二BY变量、第三BY变量。把某变量调入其下面的对话框。 (四)在对话框中下部有“Sort Order”，读者可选择其中之： Ascending表示按所选变量的升序排序 Descending表示按所选变量的降序排序(五)单击对话框中的“OK”钮，则实现了对观测量进行排序的操作。,根据已存在的变量建立新变量,使用SPSS函数建立新变量 SPSS提供的许多的函数中，常用的有： ABS(数值表达式)数值型函数。返回一个数值表达式的绝对值。 EXP(数值表达式)数值型函数。返回以e为底的数值表达式的幂值。 LG10(数值表达式)数值型函

37、数。返回以10为底的对数值。 LN(数值表达式)数值型函数。返回以e为底的对数值。 SORT(数值表达式)数值型函数。返回一个正数的平方根。 RND(数值表达式)数值型函数。返回数值表达式取四舍五入后的整数。 TRUNC(数值表达式)数值型函数。返回数值表达式被截取的整数。,使用SPSS函数建立新变量步骤,1单击主菜单中“Transform”，展开下拉菜2在下拉菜单中选择“Compute”，用鼠标单击，出现“Compute Variable”主对话框。3在对话框的左上角的“Target Variable:”下的矩形框中键入目标变量，即新变量。有的时候也可用已经存在的旧变量，但是，其结果将把旧变

38、量的内容冲掉。4在对话框的右上角的“Numeric Expression：”下的矩形框中，建立合理的表达式。其方法如下：(1)在对话框的左下方的矩形框中选择原始变量的变量名，单击之，再单击向右箭头按钮，可以使选中的原始变量名出现在右上角的表达式矩形框中。(2)对话框中央的计算器板(Calculator Pad)包括了数字、加减乘除各种关系符号等，读者可以像使用计算器那样，用鼠标进行操作，组成各种表达式。(3)在对话框的右边中部，“Function”矩形框中，都是一系列SPSS的函数，可以操作滚动棒，选择所需的函数，并用其上的向上箭头，单击之，调入上面的表达式矩形框内。(4)移动光标，到上述函数

39、的括号内，然后选择适当的自变量调入括号内，必要时图5.3计算新变量的对话框还可以键人其他符号。5.单击“OK”，表示对主对话框中确定的“Numeric Expression”计算新变量值。,对数据进行重新编码,在练习题中的年龄其最小值为24，最大值为52。现要把它分成几个年龄组，比如5岁为一个年龄组，即“2428”、“2933”、“3438”、“3943”、“4448”、“49一53”6个组。此时可用Recode重新编码方法建立新的变量，把各对象按年龄分配到各个年龄组中。,对数据进行重新编码步骤,(一) 单击主菜单中的“Transform”，展开下拉菜单，单击“Recode”，则出现“Int

40、o Same Variable”、“Into Different Variables”的选择项。此处读者可以选“Into Different Variables”(只有在不需保存原变量时，可以选“Into Same Variables”)，单击鼠标键，出现“Recode into Different Variables”的对话框,对数据进行重新编码步骤,(二) 在对话框中间的“Input VariableOutput Variable:”下的矩形框中，把年龄送入该矩形框。(三) 在对话框右侧的“Output Variable”矩形框中键入新变量名(本例取名年龄组)，然后单击该矩形框中的Chan

41、ge钮。此时在对话框的中间出现年龄年龄组。(四) 把光标移到对话框中下部的“Old and New Values”钮,单击之，则弹出“Recode into Different Variables：Old and New Values”对话框，对话框的左半部分为旧变量值，右半部分为新变量值。读者可以根据相应的新变量值进行操作。,合并文件（Merge Files）,添加观察单位（Add Cases）：将外部文件的观察单位添加到当前数据文件中，合并后新数据文件的观察单位数应为两文件之和。从菜单选择Data / Merge Files / Add Cases。添加变量（Add Variables）：

42、从外部文件添加变量到当前数据文件中。从菜单选择Data / Merge Files / Add Variables。,数据文件的拆分,(一)在主菜单中，单击“Data”菜单项，展开下拉菜单。(二)选择“Split File”，鼠标单击之，弹出对话框“Split File”。(三)在对话框的中上部，激活“Compare groups”项。(四)从变量表中，选择变量“性别”调入对话框的中间的“Groups Based on：”下的矩形框。其含义就是按性别分组进行统计分析。有时，在该矩形框中可以调人多个变量，那么，以后的统计分析将按所选的变量值的组合分组来执行。(五)指明数据文件的当前状态由于在

43、数据文件进行拆分时，如果“Group Based on：”下的变量,已经排序，则运算速度会很快，否则拆分的时候会很慢。为此，需指明数据文件的当前的状态。在对话框中间的下部分，有两个选择项： Sort the file by grouping variables File is already sorted读者在上述两个选择中选择一个，让计算机明确如何计算。(六)在对话框中，单击“OK”钮，执行数据文件拆分过程。,变量加权（Weight Cases）,变量加权是指对变量，特别是频数变量赋以权重，常用于计数频数表资料，如列联表和等级资料频数表，加权后的变量被说明成频数。从菜单选择Data / We

44、ight Cases，弹出Weight Cases（变量加权）对话框。,描述统计（一）（Descriptive Statistics ）,描述统计（二）（Descriptive Statistics ）,操作步骤 1. 建立数据文件“例02-01.sav”：将101例血清总胆固醇值输成101行1列变量的数值变量。 2. 从菜单中选择：通过“AnalyzeDescriptive StatisticsFrequencies”, 弹出频数分布分析“Frequencies”对话框。在左侧的源变量框中，选胆固醇变量，单击向右箭头，使其进入“Variable(s)”下面的矩形框中。3激活“Displa

45、y frequency tables”按钮。4单击“Statistics”按钮，弹出“Statistics”对话框,激活要分析的统计量。5单击“Continue”按钮，返回到主对话框。6单击“Charts”按钮，弹出“Charts”对话框，激活“Histograms”和“With normal curve”按钮。7单击“Continue”按钮，返回到主对话框。8单击“OK”按钮。,描述统计（三）（Descriptive Statistics ）,操作步骤 1. 打开数据文件“例02-01.sav”。 2.从菜单中选择：通过“Analyze Descriptives Statistics

46、Descriptives”，弹出描述性统计分析“Descriptives”对话框。 3选择胆固醇变量进入“Variable(s)”下面的矩形框。4单击“Options”按钮，进入“Options”对话框。5选择要分析的统计量后，按“Continue”按钮，返回到主对话框。 6单击“OK”按钮。,分组段频数表,1. 打开数据文件“例02-01.sav”。2. 通过“Transform Recode Into Same Variables” ，弹出 “Recode into Same Variables”对话框。3将对话框中左边的源变量“胆固醇”调入右边的“Variables”下的矩形框中。4单击“Old and new Values”按钮，弹出“Old and new Values”对话框。5激活左侧第一个“Range”按钮，输入第一个组段的下限和上限（旧值）；在“New Values”下的框中，输入该组段的编码值（新值），单击“Add”按钮，使其进入“Old New：”下的框中。重复此操作，直到组段输完为止。6单击“Continue”按钮，返回到主对话框。7单击“OK”按钮。8通过“Variable View” 按钮，定义新变量。,

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？