1、统计软件应用 SPSS,华东交通大学经济管理学院 韩胜娟,第一章 SPSS for Windows概述,软件发展与特点 SPSS的安装与启动 SPSS的窗口及功能 SPSS软件运行方式 数据统计分析的基本步骤,软件发展与特点,软件名称Statistical Package for the Social ScienceStatistical Product and Service Solutions 软件发展60年代:美国斯坦福大学三位研究生研制70年代:SPSS公司总部成立于芝加哥,推出SPSS中小型机版(SPSSx)80年代:微机版(SPSS/PC+)90年代:SPSS for Window
2、s,软件发展与特点,软件特点操作简单输出结果美观强大的文件转换功能强大的辅助教学功能吸收了绝大多数发展较为成熟的统计方法,但最新的统计方法尚未纳入输出结果与WORD尚存在一定兼容问题,第一章 SPSS for Windows概述,软件发展与特点 SPSS的安装与启动 SPSS的窗口及功能 SPSS软件运行方式 数据统计分析的基本步骤,SPSS的安装与启动,安装双击SPSS statistics 17.0文件,运行安装程序关闭许可授权向导将lservrc文件拷贝到程序安装目录下如:C:Program FilesSPSSIncStatistics17 启动从“开始”菜单“程序”找到SPSS Inc
3、Statistics 17.0SPSS statistics 17.0图标打开SPSS程序选择SPSS statistics 17.0桌面图标并双击,SPSS的安装与启动,SPSS程序界面语言选择Data Editor窗口选择“Edit Optins”命令单击【General】选项卡在User interface(用户界面)下的Language中选择simplitied Chinese,单击确定,即可将程序操作界面转化为中文界面在Output(输出设置)下的Language中选择simplitied Chinese,单击确定,即可将输出结果部分转化为中文输出,simplitied Chines
4、e,第一章 SPSS for Windows概述,软件发展与特点 SPSS的安装与启动 SPSS的窗口及功能 SPSS软件运行方式 数据统计分析的基本步骤,SPSS的窗口及功能,SPSS Statistics数据编辑器,绿色加号表示当前数据,SPSS的窗口及功能,SPSS Statistics数据编辑器功能:对SPSS数据文件进行定义、录入、修改、管理等基本操作组成:窗口主菜单、工具栏、数据编辑区、状态显示区在系统启动过程中自动打开,且运行过程中可以打开多个(当前数据窗口)SPSS中各统计分析功能都是针对该窗口中的数据进行;窗口中的数据以.sav为扩展名保存关闭窗口则退出对当前数据的操作,SP
5、SS的窗口及功能,SPSS Statistics查看器,SPSS的窗口及功能,SPSS Statistics查看器功能:显示和管理SPSS统计分析结果、报表及图形组成:窗口主菜单、工具栏、结果显示区、状态显示区第一次运行程序时自动打开,也可手动打开可手动打开若干个可相互切换的输出窗口图标有绿色加号表示当前输出窗口窗口内容以.spo为扩展名保存,第一章 SPSS for Windows概述,软件发展与特点 SPSS的安装与启动 SPSS的窗口及功能 SPSS软件运行方式 数据统计分析的基本步骤,SPSS软件运行方式,完全窗口菜单运行管理方式 程序运行管理方式 混合运行管理方式,数据统计分析的基本
6、步骤,第二章 数据文件的建立和编辑,SPSS数据文件的特点 SPSS数据文件结构的定义 数据的录入与保存 SPSS数据文件的编辑 与其他软件共享数据,SPSS数据文件的特点,SPSS 数据文件是一种有结构的数据文件,包括文件结构和数据两部分SPSS数据文件的结构是对每个变量及相关属性的描述,一列数据为一个变量一行数据为一个个案,所有个案组成了SPSS数据文件的数据部分 建立SPSS数据文件的两大步骤定义SPSS数据文件的结构输入分析数据,第二章 数据文件的建立和编辑,SPSS数据文件的特点 SPSS数据文件结构的定义 数据的录入与保存 SPSS数据文件的编辑 与其他软件共享数据,SPSS数据文
7、件结构的定义,变量名(名称):变量存取的唯一标志可以是英文字母(区分大小写)、汉字、数字变量名中可出现/#/$,其他符号不能出现,以符号“_”结尾代表特殊变量可以包含数字,但数字不能作为开头字符不能与SPSS内部特有的具有特定意义的保留字符相同(AND、BY、ALL、OR、NOT)默认的变量名为Var三个字母开头,后补5位数字(Var00001),SPSS数据文件结构的定义,变量类型(Type)、宽度(Width)和小数位数(Decimal)数值型 N标准数值型C逗号数值型D圆点数值型S科学计数法型L带美元符号的数值型U用户自定义型A日期型R字符型,SPSS数据文件结构的定义,变量名标签(La
8、bel):对变量名含义的解释说明 变量值标签(Values Label):对变量取值含义的解释说明,SPSS数据文件结构的定义,变量缺失值(Missing Values):漏填的数据、有明显错误和不合理的数据可看作缺失值,以区别对待宽度,SPSS数据文件结构的定义,变量列显示宽度(Columns) 数据的对齐方式(Align),SPSS数据文件结构的定义,变量度量方法(Measure)Scale定距数据Ordinal顺序水准数据Norminal名义水准数据,SPSS数据文件结构的定义,第二章 数据文件的建立和编辑,SPSS数据文件的特点 SPSS数据文件结构的定义 数据的录入与保存 SPSS数
9、据文件的编辑 与其他软件共享数据,数据的录入与保存,数据的录入一般数据的录入按个案输入(Tab);按变量输入带变量值标签数据的录入Value Labels 值标签 SPSS数据文件的保存 SaveSave as,第二章 数据文件的建立和编辑,SPSS数据文件的特点 SPSS数据文件结构的定义 数据的录入与保存 SPSS数据文件的编辑 与其他软件共享数据,SPSS数据文件的编辑,打开SPSS数据文件FileOpenData双击数据文件图标 SPSS数据定位 人工定位:适用于数据量较少时自动定位:适用于数据量较多时按个案/变量定位:编辑转至个案/变量按变量值数据自动定位:编辑查找,SPSS数据文件
10、的编辑,插入和删除个案/变量插入:编辑插入个案/变量删除:编辑剪切/清除,SPSS数据文件的编辑,数据的移动、复制和删除选择操作对象单击鼠标右键,或在编辑菜单项下选择操作如果是要清除,选择Clear;如果是要复制,选择Copy;如果是要移动,选择Cut指定目标单元,单击鼠标右键,选择Paste 恢复删除:Edit编辑Undo撤销,第二章 数据文件的建立和编辑,SPSS数据文件的特点 SPSS数据文件结构的定义 数据的录入与保存 SPSS数据文件的编辑 与其他软件共享数据,与其他软件共享数据,共享xls格式文件SPSS数据文件保存为Excel文件FileSave as,与其他软件共享数据,共享x
11、ls格式文件SPSS程序调用Excel文件FileOpen,指定Excel文件,第三章 SPSS数据文件的管理,SPSS数据文件的整理 数据加工 数据分组 SPSS数据文件的其他处理功能,SPSS数据文件的整理,个案排序(Sort Cases)将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列单值排序/多重排序Data数据Sort Cases排序个案,SPSS数据文件的整理,变量排列将所有变量按照用户指定的某个属性进行升序或降序重新排列Data数据排列变量,SPSS数据文件的整理,个案选取(Select Cases)根据不同的需要,从所有个案中筛选出希望的个案,对它们进行操作
12、、处理和分析Data数据Select Cases选择个案个案选取方式All cases:所有个案If condition is satisfied:符合条件的个案Random sample of cases:随机选取Based on time or case range:选取某区域内的Use filter variable:用滤选器变量选取,SPSS数据文件的整理,数据文件的拆分(Split File)为了分组分析,将数据文件根据一个或多个分组变量拆分为不同的组拆分并非将一个数据文件拆分成两个或若干个独立的数据文件,只是将原数据文件中的个案进行分组拆分数据文件后必须立即启动使用拆分结果对数据进
13、行分组分析的过程,否则拆分结果会失败Data数据Split File拆分文件,SPSS数据文件的整理,数据文件的拆分(Split File)Compare groups比较组:有关统计分析结果显示在Output窗口中以一张表格显示Organize output by groups按组组织输出:有关统计分析结果按每组一表在Output窗口显示Groups Based on分组方式:选择分组变量(最多8个)Sort the file by grouping variables按分组变量排序文件File is already sorted文件已排序,SPSS数据文件的整理,数据文件的合并(Merge
14、 Files)将两个SPSS数据文件合并到一个数据文件中数据文件的纵向合并将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行首尾对接Data数据Merge Files合并文件Add Cases添加个案,SPSS数据文件的整理,数据文件的合并(Merge Files)数据文件的纵向合并Variables in New Working Data新的活动数据集中的变量:列出两个数据文件中变量名、变量类型相同的变量,在合并后的数据文件中出现Unpaired variables非成对变量表示当前数据文件中的变量表示外部数据文件中的变量Indicate case source as variabl
15、e将个案源保存为变量0来自当前数据文件;1来自外部数据文件,SPSS数据文件的整理,数据文件的合并(Merge Files)将两个SPSS数据文件合并到一个数据文件中数据文件的横向合并将已存储在磁盘上的一个SPSS数据文件中的若干变量追加到当前数据编辑窗口的数据中Data数据Merge Files合并文件Add Variables添加变量,SPSS数据文件的整理,数据文件的合并(Merge Files)数据文件的横向合并New Working Data File新的活动数据集:列出合并后的数据文件中存在的变量Excluded variables已排除的变量:列出同名变量(一般将其指定为关键变量
16、)Match cases on key variables in sorted files按照排序文件中的关键变量匹配个案:激活后指定关键变量须先按关键变量对两数据文件升序排列,SPSS数据文件的整理,数据文件的合并(Merge Files)数据文件的横向合并Match cases on key variables in sorted files按照排序文件中的关键变量匹配个案两个文件都提供个案非活动数据集为基于关键字的表活动数据集为基于关键字的表Indicate case source as variable:将个案来源表示为变量,SPSS数据文件的整理,数据文件的转置(Transpose)
17、将数据文件行、列互换,即将个案转为变量,变量转为个案Data数据Transpose转置Variables变量:选择要进行转置的变量Name variable名称变量:指定转置后数据文件中各变量名如何确定K变量取值;Var001(002);字符型数据文件转置后,SPSS自动产生一个名为Case_lbl的新变量,存放原数据文件的各变量名,SPSS数据文件的整理,数据文件的转置(Transpose)Data数据Transpose转置,第三章 SPSS数据文件的管理,SPSS数据文件的整理 数据加工 数据分组 SPSS数据文件的其他处理功能,数据的加工,变量计算(Compute)在原有SPSS数据文件
18、的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足SPSS条件表达式的个案,计算产生一系列结果,并将结果存到指定的SPSS变量中。Transform转换Compute计算变量Target Variable:输入目标变量名Type&Label:定义变量类型和标签默认为数值型,数据的加工,变量计算(Compute)Transform转换Compute计算Numeric Expression:输入计算新变量值的数学表达式 算术函数:ABS(numexpr);EXP(numexpr); LG10(numexpr);LN(numexpr);TRUNC(numexpr) 统计函数:CFV
19、AR(numexpr, numexpr, ); MAX(value,value,);MIN(value,value,);SD (numexpr, numexpr, );SUM (numexpr, numexpr, );VARIANCE (numexpr, numexpr, );MEAN (numexpr, numexpr, ),数据的加工,变量计算(Compute)Transform转换Compute计算If:设置个案选取条件,仅对满足条件的个案进行计算include all casesinclude if case satisfies condition:包含符合一定条件的个案,输入条件表达
20、式 SPSS关系运算符:、 SPSS逻辑运算符:或NOT、&或AND、|或OR,数据的加工,产生计数变量(Count)对所有个案或满足一定条件的个案,计算若干个变量中有几个变量的值落在指定的区域内,并将计算结果存入到新变量中Transform转换Count对个案内的值计数Target Variable目标变量:输入目标变量名,其值用来识别符合用户设定条件的变量值在一个个案中的出现次数Target Label:目标变量标签,数据的加工,产生计数变量(Count)Transform转换Count对个案内的值计数Variables数字变量:从源变量框中选择与用户指定条件相关的相同类型的一个或多个变量
21、Define Value定义值:指定计数条件Value值:有6个单选项,指定要计数的变量所满足的条件,条件不能重复If如果:输入条件表达式,对满足一定条件的个案产生计数变量,数据的加工,产生计数变量(Count)Transform转换Count对个案内的值计数计数条件:Value:输入一个确定的变量值System missing:系统缺失值System or user missing:系统或用户缺失值Rangethrough:确定变量值范围Range lowest throughRangethrough highest,各门课程中80分以上课程门数,设定条件,设定的条件不能出现重复!,数据的加
22、工,分类汇总(Aggregate)按指定的分类变量的变量值对个案分组,计算每组个案的汇总变量的基本统计量,将计算结果生成到一个新文件中Data数据Aggregate分类汇总Break Variables:分组变量Aggregate Variables:汇总变量Name&Label:指定结果文件变量名及标签Function函数:指定计算哪些描述统计量个案数及名称,数据的加工,分类汇总(Aggregate)Data数据Aggregate分类汇总保存将汇总变量添加到活动数据集创建只包含汇总变量的新数据集写入至包含汇总变量的新数据文件适用于大型数据集的选项文件已经按分组变量排序在汇总之前排序文件,第三
23、章 SPSS数据文件的管理,SPSS数据文件的整理 数据加工 数据分组 SPSS数据文件的其他处理功能,数据的分组,目的:了解数据的总体分布状况 数据分组的主要步骤指定分组变量定义分组变量的分组区间指定一个存放分组结果的标志变量,其值为个案所属组的组号 数据自动分组无需指定分组变量的分组区间一个分组变量值为一组,数据的分组,数据自动分组Transform转换Automatic Recode自动重新编码从源变量框中指定分组变量进入VariableNew Name(变量-新名称)框New Name新名称:框后输入标志变量名,并点击New Name(添加新名称)确定Recode Starting f
24、rom重新编码的起点:指定组号编制方法Lowest Value最低值/Highest Value最高值,性别为字符型 通过自动分组将其转换为数值型,数据的分组,数据手工分组可以对数据编辑窗口中的所有个案或部分满足条件的个案进行分组需指定分组变量和标识变量,并需定义分组变量的分组区间分组结果存入原变量数据编辑窗口中的分组变量值被相应分组后的组号替代分组结果存入新变量数据编辑窗口中出现一个存放分组结果的新变量,数据的分组,数据手工分组分组结果存入原变量Transform转换重新编码为相同变量Recode Into Same Variables Variables数字变量:指定分组变量 If如果:输
25、入条件表达式,仅对符合一定条件的个案进行分组 Old and New Value旧值和新值:定义分组区间(在Old Value中定义区间,在New Value中给出该区间对应的分组标志或指定该区间数据在分组后为系统缺失值,通过Add确认、Change修改、Remove删除),对年龄按阶段进行分组,指定分组区间,数据的分组,数据手工分组分组结果存入新变量Transform转换Recode Into Different Variables重新编码为不同变量指定分组变量到Numeric Variable Output Variable(数字变量输出变量)框中在Output Variable输出变量下
26、的Name框中输入标志变量名,按Change确认,在Label后输入标志变量名标签信息If:输入条件表达式Old and New Value旧值和新值,第三章 SPSS数据文件的管理,SPSS数据文件的整理 数据加工 数据分组 SPSS数据文件的其他处理功能,数据文件的其他处理功能,对个案进行加权处理指定某一变量为加权变量Data数据Weight Cases加权个案Do not weight cases:不进行加权处理Weight cases by:加权个案Frequency Variable频数变量:权变量若取消指定的加权变量,同样的操作选择“请勿对个案加权”即可,计算平均人家面积时需要以常
27、住人口来加权,加权计算结果,未加权计算结果,数据文件的其他处理功能,变量集的定义和使用目的:简化处理和分析过程中变量选择的操作过程SPSS变量集是一种存放着许多SPSS变量名的集合,包括系统变量集和用户自定义变量集系统变量集:SPSS系统事先定义好的,包括两个,ALLVARIABLES和NEWVARIABLES用户自定义变量集:用户根据实际需要自己定义的(可多个),数据文件的其他处理功能,变量集的定义和使用定义变量集(Define Sets)将一些进行相同处理和分析操作的变量名定义在一个集合中Utilities实用程序Define Sets定义变量集 选择变量进入Variables in Se
28、t“集合中的变量”框中 Set Name设置名称:定义用户变量集名称Add Set:添加集合Change Set:修改集合Remove Set:删除集合,数据文件的其他处理功能,变量集的定义和使用定义变量集(Define Sets)变量集的名称最长可由12个字符或6个汉字组成SPSS保留的两个系统变量集名称不能使用变量集定义附属于数据窗口中的数据文件,保存当前数据文件即保存了定义的变量集,若未保存,在下次重新启动SPSS后,上次定义过的变量集将不复存在,数据文件的其他处理功能,变量集的定义和使用使用变量集(Use Sets)激活已定义过的变量集,使调用分析过程时,在分析过程对话框的源变量表中将
29、只显示选定的变量集中的变量Utilities实用程序Use Sets使用变量集Sets in Use:选择应用的变量集,需取消默认变量集,数据文件的其他处理功能,变量集的定义和使用使用变量集(Use Sets)在Sets in Use(选择应用的变量集)栏中至少保留一个变量集若使用用户自定义变量集,应将两个系统变量集取消存盘退出后,下次重新启动SPSS时,上次定义过的变量集仍存在,但不在Sets in Use栏中,它将恢复默认状态(显示系统变量集),若想再次激活需重新操作,第四章 SPSS输出窗口的操作与管理,SPSS输出窗口结果显示区构成 索引输出区管理 详解输出区管理 输出窗口分析结果的存
30、取,SPSS输出窗口结果显示区构成,索 引 输 出 区,详 解 输 出 区,索引输出区的管理,索引输出区的组成根名为Output(输出)一个统计分析结果索引就是一颗索引子树,挂在根下索引首部(Head):索引子树的根索引标题(Title)索引附注(Note)多张分析报表的简要说明,索引输出区的管理,索引输出区的操作与管理选择索引树、子树、子树项展开(Expand)、折叠(Collapse)索引树隐藏(Hide)、显示(Show)索引树降低(Demote)、提升(Promote)索引子树删除(Delete)索引子树和子树项重命名子树项复制(Copy/Paste After)索引子树或子树项,索引
31、输出区的管理,索引输出区的操作与管理移动(Cut/Paste After)索引子树或子树项插入SPSS文本Insert插入New Text新建文本插入文本文件格式对齐(Format)改变索引输出区的显示样式:“视图”改变显示字体:Outline Font概要字体改变显示大小:Outline Size概要尺寸,详解输出区的管理,分析表格的组成表层(Layer)表标题(Title)行标题(Row)列标题(Column)表说明(Caption)表下注(Footnote)表单元(Cell),职称与文化程度分布情况表,性别:男职工,注:截止到2003年底 a:不包括离退休人员,详解输出区的管理,详解输出
32、区的操作与管理使分析表格处于编辑状态确定分析表格各组成部分的状态(选中/编辑)了解表格数据项的含义(Whats it?)编辑表格各组成部分的内容调整表格的行列宽度鼠标拖动FormatSet Data Cell WidthsFormatAuto fit,华东交通大学经济管理学院 P71,详解输出区的管理,详解输出区的操作与管理使分析表格处于编辑状态确定分析表格各组成部分的状态(选中/编辑)添加表格组成部分Insert插入Title标题、Caption题注、Footnote脚注表格层、行、列的三维互换Pivot透视Pivoting Trays透视托盘,输出窗口中分析结果的存取,保存输出窗口的内容使输出窗口为当前窗口File-Save (Save as)指定文件夹和路径并给出文件名称 打开存在磁盘上的输出结果文件使输出窗口为当前窗口File-Open-Output输入输出结果文件所在的文件夹(路径)和文件名,