1、第1 章 统计软件SPSS基础 1.1 SPSS 的产生及发展 SPSS是软件英文名称的首字母缩写,全称为: S tatistical Package for the S ocial S ciences , 即 “ 社会科学统计软件包” 。 它是 目前世 界上 流行的 三 大统计分析软件之一(SAS 、SPSS 及SYSTAT )。在 我国,SPSS 以其强大的统计分析功能、方便的用户 操作界面、灵活的表格式报告及 其精美 的图 形展现 , 受到了社会各界统计分析人员的 喜爱。 1.2 SPSS的主要特点 操作简便、上手容易 分析功能强大 图表类型丰富 数据转换接口完善 二次开发功能强大 1.
2、3 SPSS对系统的要求及安装 S P S S S tatistics 1 9. 0 对硬件的基本要求 : 1G H z 以上的Int el 或 AMD 处理器。 至少5 12 M 的内存。官方推荐1G 内存及以上。 至少80 0 M 的硬盘剩余空间。 DVD光盘驱动器。 W indows 98/M e/2000/XP/2003/7 兼容的图形 适配卡及以上。 支持TCP/ IP网络协议的网络适配卡,主要用于软件 更新及各类相关服务。 1.3.1 硬件环境要求 S P S S S tatistics 1 9. 0 要求的操作系统是 Wi n d o w s X P (32 位)、Vista (
3、32 位或 64 位)或Wi n d o w s 7 (32 位或64 位)。 IE7.0 及以上版本。 Adobe R eader 阅读器。主要用它来阅读 各类SPSS 安装及使用文件。 1.3.2 软 件 环境要求 1.3.3 SPSS的安装和卸载 SPSS St a t ist ic s 1 9.0 光盘版的安装步骤: 1. 将SPSS St a t is t ic s 1 9.0 安装光盘插入光驱。 2. 若系统设置为自动运行光盘状态,则 会自动 执行 安 装文件;若光盘没有自动运行, 则在光 盘目 录中双 击setup.exe 文件,系统立即自动安装程序。 3. 按照安装向导界面的提
4、示,指定安装 路径、 输入 用 户信息、序列号等,一步步的单 击Ne x t 按钮,最后 单击安装向导界面上的Finish 按钮后,表示SPSS 软 件的安装程序结束。 1.3.3.1 SPSS的安装 1.3.3.2 SPSS的卸载 1. 在Windows 的 【 开始 】 菜单中,选择 【 设置 】 【 控制面板 】 【 添加或删除 硬件 】 命令 , 弹出 【 添加或删除硬件 】 对话框 。 2.在程序列表中选择 【S pss S tatistics 1 9.0 】 项,然后单击 【 删除 】 按钮。 3.在执行完删除命令后,单击 【 确定 】 按钮 ,此 时删除SPSS 软件成功。 1.
5、4 SPSS的启动与退出 正确安装完SPSS 1 9.0 后,可以创建快捷方式快速 使用SPSS 软件,也可以执行计算机 【 开始 】 菜单 中的 【 程序 】 【I B M S P S S S tatistics 】 【IBM SPSS St a t is t ic s 1 9 】 命令,启动软件。 注意:在首次运行SPSS 软 件时,会弹出右图所示的 对话框,该对话框主要是 启动引导窗口。 1.4.1 SPSS 的 启动 1.4.2 SPSS 的退出 选择菜单栏中的 【File( 文件) 】 【Ex it ( 退 出) 】 命令退出SPSS 。 单击数据编辑器右上角的关闭按 钮。 直接使用
6、快捷键Alt +F4 。 注意:无论采用哪种方式退出软 件,软 件都 不 会自动保存修改的数据文件或结 果,因 此关 闭时,要注意及时存盘。 1.5 SPSS的主要窗口 1 .5.1 数据编辑窗口 1 .5.2 结果输出窗口 1 .5.3 语句窗口 1 .5.4 脚本编辑窗口 1. 5. 1 数据编辑窗口 启动SPSS St a t is t ic s 1 9.0 后,系统会自动打开数据编辑 窗口(D ata E ditor )。 可以选择菜单栏中的 【File ( 文件) 】 【Ne w( 新建) 】 【D ata( 数据) 】 命令,新建 一个SPSS 的数据文件,如右 图所示;或者选择菜
7、单栏中的 【File( 文件) 】 【Open( 打 开) 】 【D ata( 数据) 】 命令 打开一个保存的数据文件。 1. 5. 2 结果输出窗口 PSS 的Output (输出) 窗口SPSS Vie we r ,一 般随执行统计分析命令而 打开,用于显示统计分析 结果、统计报告、统计图 表等内容,允许用户对输 出结果进行常规的编辑整 理,窗口内容可以直接保 存,保存文件的扩展名为 “*.sp v” 。 1. 5. 3 语句窗口 选择菜单栏中的 【File( 文件) 】 【Ne w( 新建) 】 【Sy n t a x ( 语法) 】 命令,新建一个SPSS的语句文 件,如下图所示。
8、选择菜单栏中的 【File( 文件) 】 【Open( 打开) 】 【Sy n t a x ( 语法) 】 命令,打开一个保存的语句文 件。 1. 5. 4 脚本编辑窗口 选择菜单栏中的 【File( 文件) 】【Ne w( 新建) 】 【Sc r ip t ( 脚本) 】命令,新建一 个SPSS的脚本 编辑 窗口,如下图所示。 选择菜单栏中的 【File( 文件) 】【Open( 打开) 】 【Sc r ip t ( 脚本) 】命令,打开 一个保 存的脚 本语 言文件。 1.6 SPSS菜单命令详解 1.6.1 基本菜单栏 1.6.2 File菜单 1.6.3 Edit菜单 1.6.4 Vi
9、ew菜单 1.6.5 Data菜单 1.6.6 Transform 菜 单 1.6.7 Analyze 菜单 1.6.8 Direct Market ing菜单 1.6.9 Graphs 菜单 1.6.10 Utilities 菜 单 1.6.11 Add-ons菜单 1.6.12 Windows 菜单 1.6.13 Help菜单 1. 6. 1 基本菜单栏 名称 基本用途 File 文件操作 Edit 文件编辑 View 视图编辑 Data 数据操作 Transform 数据转换 Analyze 统计分析方法 Diect Marketing 直销分析 Graphs 图形编辑 Utilitie
10、s 实用程序 Add-ons 附加程序 Windows 窗口控制 Help 帮助 1.6.2 File 菜单 Ne w Open Open D ata base R ead Text D ata Clo se Sa v e Sa v e As S ave all D ata 新建文件 打开文件 打开数据库 读取文本数据 关闭文件 保存文件 另存为,按指定路径存盘 保存所有数据 E xport to D ata base Ma rk File Re a d Only R enam e D ata set D i spl ay D ata I nform ati on C ache D ata S
11、top Processor Switch Se rve r 输出至指定数据库 标注文件只读 数据集更名 显示数据信息 建立数据高速缓冲区 停止进程 打开服务器 R epository Print Pre vie w Pr in t R ecentl y U sed D ata R ecentl y U sed F i l es Ex it 存储库 打印预览 打印 最近使用数据 最近使用文件 退出 1.6.3 Ed it 菜单 Und o R edo Cut Co p y Pa st e Paste Variable Cle a r Insert Variable 撤销上次编辑操作 恢复上次编辑
12、操作 剪切 复制 粘贴 粘贴变量 删除所选择的内容 插入变量 Insert Cases Fin d Fin d Ne xt Re p la c e Go to Case Go t o Va ria b le Go to I m putati on Op t io n 插入观测量 查找 查找下一个 替换 光标移动到指定观测量 光标移动到指定变量 光标移动到错误处 选项,设置SPSS工作环境等 1.6.4 V iew 菜单 S tatus Bar T oolbars M enu E ditor Fo nt s Grid Lines Value Labels M ark Im puted D ata
13、 Custom ize Variable View Variables 状态栏显示 工具条栏显示 菜单编辑器 字体 显示/ 隐藏格线 显示/ 隐藏变量值标签 标记错误数据 查看自变量 变量定义窗口和数据编辑 窗口转换 1.6.5 Da t a 菜单 D efine Variable Properties S et M easurem ent Level for Unknown Copy D ata Properties N ew C ustom A ttribute D efine D ates D efine M ultiple R esponse Se t s Validation Ide
14、ntify D uplicate Cases 定义变量属性 设置未知测量级别 复制数据属性 新的自定义属性 定义日期 定义多重反应集 验证 标识重复观测量 Identify U nusual Cases Sort Ca s e s So rt Va ria b le s T ranspose M erge F i l es R estructure 标识异常观测量 观测量排序 变量排序 行列转置 合并文件 重新构建数据文件 Aggregate Ort ho go na l De s ign C opy D ataset Sp lit File S el ect C ases W ei ght
15、C ases 数据汇总 正交设计 复制数据集 分割文件 选择观测量 观测量加权 1.6.6 Transform 菜单 Com pute Variable Count Values within Case s Shift Values R ecode into S am e Variabl es R ecode into D ifferent Var iables Autom atic R ecode Visual Binning Optimal Binning 通过计算建立新变量 依据观测量计数 生成滞后数据 变量重新赋值给同一变量 变量重新赋值给不同变量 自动赋值 可视离散化 最优离散化 P
16、repare D ata for M odeli ng R ank C ases D ata and T i m e W i zard C reate T i m e S eri es R epl ace M i ssi ng V al ues R andom N um ber G enera tors Run Pending Transforms 准备建模数据 求观测量的秩 设定日期/ 时间变量 产生时间序列 缺失值替换 产生随机数 运行待解决的变量变换 1.6.7 Analyze 菜单 Re p o r t s Descriptive Statistics T ables Com pare
17、 M eans General Linear M odel Generalized Linear M o des M ixed M odels C orrelate 生成数据报告 描述性统计 生成统计表格 均值比较分析 一般线性模型 广义线性模型 混合模型 相关分析 R egression Lo g lin e a r N erual N etw orks Cla s s if y Dime ns io n Re d uc t io n Sc a le N onparam etri c T ests F orecasti ng 回归分析 对数线性模型 人工神经网络 聚类与判别分析 降维分析 测
18、度分析 非参数检验 预测分析 S urvival Mult ip le Re s p o ns e Mis s ing Va lu e s Ana l y s is Mult ip le Imp ut a t io n Co mp le x Sa mp le s Qua lit y Co nt ro l ROC Curve 生存分析 多选项分析 缺失值分析 多重插补分析 复杂样品分析 质量控制分析 ROC 曲线 1.6.8 Direct Marketing 菜单 H elp identify m y best contacts(R F M A naly sis) :择帮助标识我的最佳联系人(R
19、FM 分析) S egm ent m y contacts into clusters :将我 的联系人分段到聚类 Generate proFiles of m y contacts who re sponded to an offer :生成对产品做出响应的 我的联系人的概要文件 Identify the top responding postal codes :标识最佳响应邮政编码 S elect contacts m ost likely to purchase :选择最有可能购买的联系人 C om pare effecti veness of cam pai gns ( Control
20、 Package T est) :比较活动效果 (控制包装检验) Ap p ly s c o re s fro m a mo d e l File :应用来 自模型文件的得分 1.6.9 Graphs 菜单 Chart Builder 图形生成器 Graphboard Tem plate Chooser 图形模板选择 1B a r 条形图 3- D Ba r 三维条形图 Line 线图 Area 面积图 Pie 饼图 Hig h- Lo w 高低图 Bo x Plot 箱图 E rror B ar 误差条图 P opulation P yram id 人口金字塔图 S catter/D ot
21、散点图 His t o gr a m 直方图 1.6.10 Utilities 菜单 Variables OMS Control Panel OM S Identifiers Scoring W izard M erge M odel XM L D ata File Com m ents D efine Variable S et s Use Variable S ets 变量信息说明 OMS 控制面板 OMS 标识符 评分向导 合并模型XML 数据文件说明 定义变量集合 使用变量集合 Show All Variables Sp e llin g Ru n Sc rip t Producti
22、on Job Cu s t o m Dia lo gs Extension Bundles 显示所有变量 拼写检查 运行脚本语言 生产工作 生成对话框 拓展束 1.6.11 A d d - ons 菜单 Applications S ervices Programmability Ext ension Statistics Guides 添加其他应用程序 服务帮助 可编程延续 统计向导服务 1.6.13 Help 菜单 To p ic s Tut o r ia l Case S tudies S tatistics C oach Com m and S ynatx R efer ence D
23、eveloper Central Abo ut Algorithms SPSS Inc .Ho me Check for U pdates SPSS帮助主题 用户指南 统计辅导学习 统计训练指导 语句命令参考 研发中心 关于SPSS版本信息 算法 SPSS官方主页 版本更新检查 1.7 SPSS中英文界面的转换 当首次安装软件时,SPSS界面为英文显示,此时可以采用如 下方法将其转换为中文界面。 1. 选择菜单栏中的 【Ed it ( 编辑) 】 菜单中的【Opt ion( 选项) 】 命令。 2.在弹出的对话框的【U ser Interface( 用户界面) 】 选项卡 的 【Languag
24、e( 语言) 】 选项组中点选【Simplified Ch inese( 简体中文) 】 单选钮,表示选定软件中文界面显示。 3.最后单击【OK( 确定) 】 按钮,表示SPSS软件的界面语言转 换过程结束。 如果需要从中文界面转换为英文界面,也可按照上述操作 来实现。 第2章SPSS统计分析前的准备2.1 SPSS数据文件的建立 SPSS数据文件的建立可以利用【File(文件)】菜单中的命令来实现。具体来说,SPSS提供了四种创建数据文件的方法: 新建数据文件; 直接打开已有数据文件; 使用数据库查询; 从文本向导导入数据文件。2.1.1 新建数据文件 打开SPSS软件后,现在菜单栏中的【F
25、ile(文件)】【New(新建)】【Data(数据)】命令,可以创建一个新的SPSS空数据文件。接着,用户可以进行直接录入数据等后续工作。 值得注意的是,SPSS19.0可以同时打开多个数据文件,用户可以在多个文件中进行转换操作,这比起低版本的SPSS来说,更方便用户使用。2.1.2 直接打开已有数据文件 打 开 SPSS软件后,现在菜单栏中的【File(文件)】【Open (打开)】【Data(数据)】命令,弹出【Open Data(打开数据)】对话框。选中需要打开的数据类型和文件名,双击打开该文件。2.1.3 利用数据库导入数据 打开软件后,现在菜单栏中的【File(文件)】【Open D
26、atabase(打开数据库)】【New Query(新建查询)】命令,弹出【Database Wizard(数据库向导)】对话框。通过这个数据库向导窗口,用户可以选择需要打开的文件类型,并按照窗口上的提示进行相关操作。2.1.4 文本向导导入数据 SPSS提供了专门读取文本文件的功能。打开软件后,现在菜单栏中的【File(文件)】【Read Text Data(打开文本数据)】命令,弹出【Open Data(打开数据)】对话框。这里用户需要选择需要打开的文件名称,并且单击【Open(打开)】按钮进入文本文件向导窗口。2.1.4 文本向导导入数据2.1.5 实例分析:股票指数的导入 文件2-1.
27、xls是上证指数从2007年1月4日至2008年10月16日的数据资料,包括了开盘价、当日最高价、当日最低价和收盘价等选项,请将该数据导入至SPSS中。2.1.5 实例分析:股票指数的导入 Step01:选定对话框 打开SPSS软件,选择菜单栏中的【File(文件)】【Open(打开)】【Data(数据)】命令,弹出【Open Data(打开数据)】对话框。2.1.5 实例分析:股票指数的导入2.1.5 实例分析:股票指数的导入 Step02:选定打开文件类型 在【Files of type(文件类型)】下拉列表框中指定打开Excel文件类型。接着,选择2-1.xls文件。最后单击【Open(
28、打开)】按钮。2.1.5 实例分析:股票指数的导入2.1.5 实例分析:股票指数的导入 Step03:设置变量名称 弹出的对话框中的【Read variable names from the first row of date(从第一行数据读取变量名)】复选框表示SPSS将Excel工作表的第一行设定为SPSS的变量名称,【Range(范围)】文本框表示选定Excel文件导入SPSS的数据范围。这里,保持系统默认选项。2.1.5 实例分析:股票指数的导入2.1.5 实例分析:股票指数的导入 Step04:完成操作 最后,单击【OK(确定)】按钮,数据即可导入成功。此时,SPSS的数据浏览窗口中
29、会出现相关的数据内容。2.1.5 实例分析:股票指数的导入2.2 SPSS数据文件的属性 一个完整的SPSS文件结构包括变量名称、变量类型、变量名标签、变量值标签等内容。用户可以在创建了数据文件后,单击数据浏览窗口左下方的【Variable View(变量视图)】选项卡,进入数据结构定义窗口。用户可以在该窗口中设定或修改文件的各种属性。 注意:SPSS数据文件中的一列数据称为一个变量,每个变量都应有一个变量名。SPSS数据文件中的一行数据称为一条个案或观测量(Case)。2.2 SPSS数据文件的属性2.2.1 变量名:Name栏 变量名(Name)是变量存取的唯一标志。在定义SPSS数据属性
30、时应首先给出每列变量的变量名。变量命名应遵循下列基本规则: SPSS 变量长度不能超过64个字符(32个汉字); 首字母必须是字母或汉字; 变量名的结尾不能是圆点、句号或下划线; 变量名必须是唯一的; 变量名不区分大小写; SPSS的保留字不能作为变量名,例如ALL、NE、EQ和AND 等; 如果用户不指定变量名,SPSS软件会以“VAR”开头来命名变量,后面跟5个数字,如VAR00001、VAR00019等。 注意:为了方便记忆,用户所取的变量名最好与其代表的数据含义相对应。2.2.2 变量类型:Type栏 变量类型是指每个变量取值的类型。SPSS提供了三种基本数据类型:数值型、字符型和日期
31、型。2.2.3 变量格式宽度:With栏 变量格式宽度With是指在数据窗口中变量列所占的单元格的列宽度,一般用户采用系统默认选项即可。值得注意的是,如果变量宽度大于变量格式宽度,此时数据窗口中显示变量名的字符数不够,变量名将被截去尾部作不完全显示。被截去的部分用“*”号代替。2.2.4 变量小数位数:Decimals栏 【Decimals Places】文本框可以设置变量的小数位数,系统默认为两位。2.2.5 变量名标签:Label栏 变量名标签(Label)是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。用户有时在处理大规模数据时,变量数目繁多,此时对每个变
32、量的含义加以标注,有利于用户弄清每个变量代表的实际含义。变量名标签可用中文,总长度可达120个字符。同时该属性可以省略,但建议最好给出变量名的标签。2.2.5 变量名标签:Label栏2.2.6 变量值标签:Values栏 变量值标签(Values)是对变量的可能的取值的含义进行进一步说明。变量值标签特别对于数值型变量表示非数值型变量时尤其有用。 定义和修改变量值标签,可以双击要修改值的单元格,在弹出的对话框的【Values(值)】文本框中输入变量值,在【Label(标签)】文本框中输入变量值标签,然后单击【Add (添加)】按钮将对应关系选入下边的白框中。同时,可以单击【Change(改变)
33、】和【Remove(移动)】按钮对已有的标签值进行修改和剔除。最后单击【OK(确定)】按钮返回主界面。2.2.6 变量值标签:Values栏2.2.7 变量缺失值:Missing栏 在统计分析中,收集到的数据可能会出现这样的情况:一是数据中出现明显的错误和不合理的情形;另一种是有些数据项的数据漏填了。 双击【Missing(缺失)】栏,在弹出的对话框中可以选择三种缺失值定义方式。2.2.8 变量列宽:Columns栏 【 Columns(列)】栏主要用于定义列宽,单击其向上和向下的箭头按钮选定列宽度。系统默认宽度等于8。2.2.9 变量对齐方式:Align栏 【Align(对齐)】栏主要用于定
34、义变量对齐方式,用户可以选择Left(左对齐)、Right(右对齐)和Center(居中对齐)。系统默认变量右对齐。2.2.10 变量测度水平:Measure栏 【Measure(测度)】栏主要用于定义变量的测度水平,用户可以选择Scale(定距型数据)Ordinal(定序型数据)和Nominal(定类型数据。2.2.11 变量角色:Role栏 【 Role(角色)】栏主要用于定义变量在后续统计分析中的功能作用,用户可以选择Input、Target和Both 等类型的角色。2.2.11 实例分析:员工满意度调查表的数据属性设计 1.实例内容 为了提高员工的工作积极性,完善公司各方面管理制度,并
35、达到有的放矢的目的,某公司决定对本公司员工进行不记名调查,希望了解员工对公司的满意情况。请根据该公司设计的员工满意度调查题目(行政人事管理部分)的特点,设计该调查表数据在SPSS的数据属性。2. 实例操作 具体步骤如下。 Step01:打开SPSS中的Data View窗口,录入或导入原始调查数据。 Step02:选择菜单栏中的【File(文件)】【Save (保存)】命令,保存数据文件,以免丢失。 Step03:单SPSS中的【Variable View(变量视图)】选项卡,按窗口提示进行数据属性的定义,如变量名称、标签、标签值等。3. 实例结果2.3 SPSS数据文件的整理 通常情况下,刚
36、刚建立的数据文件并不能立即进行统计分析,这是因为收集到的数据还是原始数据,还不能直接利用分析。此时,需要对原始数据进行进一步的加工、整理,使之更加科学、系统和合理。这项工作在数据分析中称之为统计整理。 【Data(数据)】菜单中的命令主要用于实现数据文件的整理功能。2.3.1 观测量排序:地区生产总值分析 SPSS操作详解 Step01:打开观测量排序对话框 打开SPSS软件,选择菜单栏中的【File(文件)】【Data(数据)】【Sort Cases(排序个案)】命令,弹出【Sort Cases(排序个案)】对话框。 Step02:选择排序变量 在左侧的候选变量列表框中选择主排序变量,单击右
37、向箭头按钮,将其移动至【Sort by(排序依据)】列表框中。 Step03:选择排序类型 在【Sort Order(排列顺序)】选项组中可以选择变量排列方案。 Step04:单击【OK】按钮,此时操作结束。 1. SPSS操作详解2.实例内容:地区生产总值分析 地区生产总值是指某地区在一定时间内的国内生产总值,它可以作为衡量该地区经济发展的重要综合指标。随书光盘中的数据2-3.sav列出了2005年我国部分省份的地区生产总值及第一产业、第二产业和第三产业的生产总值,请根据这些数据分析不同省份经济发展状况的差异性。 Step01:选定对话框 打开SPSS软件,选择菜单栏中的【Data(数据)】
38、【Sort Cases(排序个案)】命令,弹出【Sort Cases(排序个案)】对话框。 Step02:选择排序变量 在左侧的候选变量列表框中选择主排序变量DQ,单击右向箭头按钮,将变量选择进入【Sort by(排序依据)】列表框中。 Step03:选择排序类型 为了表示不同省份生产总值的差异,按照从高到低的排列顺序,这里点选【Descending(降序)】单选钮,表示观测值按照降序进行排序。Step03:选择排序类型 Step04:完成操作 最后,单击【OK(确定)】按钮,操作完成。此时,SPSS的数据浏览窗口中观测量的顺序发生改变。2.3.2数据的转置:国家财政分项目收入 1.操作详解
39、Step01:打开转置对话框 打开SPSS软件,选择菜单栏中的【File(文件)】Data(数据)】【Transpose(转置)】命令,弹出【Transpose(转置)】对话框。 Step02:选择转置变量 在左侧的候选变量列表框中选择需要进行转置的变量,单击右向箭头按钮,将其移动至【Variable(s)(变量)】列表框中。 Step03:新变量命名 从左侧的候选变量列表框中可以选择一个变量,应用它的值作为转置后新变量的名称。此时,选择该变量进入【Name Variable(名称变量)】列表框内即可。如果用户不选择变量命名,则系统将自动给转置后的新变量赋予Var001、Var002的变量名。
40、 Step04:单击【OK】按钮,操作结束。 注意:数据文件转置后,数据属性的定义都会丢失,因此用户要慎重选择本功能。2.实例内容:国家财政分项目收入数据(2-4.sav)Step01:选定对话框Step02:选择转置变量Step03:新变量命名Step04:完成操作2.3.3文件合并:固定资产投资 【data(数据)】【Merge Files(合并文件)】菜单中有两个命令选项:【Add Cases(添加个案)】和【Ad d Variables(添加变量)】。1. 观测量合并的SPSS操作详解 观测量合并要求两个数据文件至少应具有一对属性相同的变量,即使它们的变量名不同。具体步骤如下。 Ste
41、p01:打开观测量合并对话框 选择菜单栏中的【File(文件)】【Data(数据)】【Merge Files(合并文件)】【Add Cases(添加个案)】命令,弹出【Add Cases(添加个案)】对话框 Step02:选择合并文件 点选【An external SPSS Statistics data file(外部SPSS Sta tistics数据文件)】单选钮,同时单击【Browse】按钮,选中需要合并的文件,并指定文件路径,然后单击【Continue】按钮。 Step03:选择合并方法。 Step04:单击【OK】按钮,操作结束。2.变量合并的SPSS操作详解 变量合并要求两个数据
42、文件必须具有一个共同的关键变量(Key Variable),而且这两个文件中的关键变量还具有一定数量的相同的观测量数值。 Step01:打开变量合并对话框。 Step02:选择合并文件。 Step03:选择合并方法。 Step04:单击【OK】按钮,操作结束。3. 实例内容:固定资产投资文件的合并 已知2-5-1.sav、2-5-2.sav和2-5-3.sav中的数据是北京、天津、河北等省市在2005年部分行业的固定投资额(亿元)数据,请完成以下问题。 问题一:将2-5-1.sav和2-5-2.sav的数据文件纵向合并。 问题二:将2-5-2.sav和2-5-3.sav的数据文件横向合并。St
43、ep01:打开对话框(问题一)Step02:选择合并文件Step03:选择合并方法Step04:建立指示变量Step05:完成操作Step01:打开对话框(问题二)Step02:选择合并文件Step03:建立指示变量Step04:完成操作2.3.4 数据分类汇总:城乡居民储蓄存款 对数据进行分类汇总就是按指定的分类变量值对所有的观测量进行分组,对每组观测量的变量求描述统计量,并生成分组数据文件。例如,将一个工厂的数据资料,按照该工厂的各个部门进行分组,并统计各个部门的人员年龄均值、方差等,这些工作就属于数据分类汇总的范畴。1.数据分类汇总的SPSS操作详解 分类变量(Break Variabl
44、e):它是对样本数据进行分类的变量,如按性别、民族、行业性质等进行分类汇总。这种变量可以为数值型或字符型变量。 汇总变量(Aggregate Variable):利用源数据文件中的变量和相应的汇总函数产生的新变量名称及其表达式。这种变量必须要求为数值型变量。例如,按性别统计年收入的平均值,此时“性别”是汇总变量,“每人年收入”是源变量,“不同性别的年收入均值”就属于汇总变量。Step01:打开数据汇总对话框 打开SPSS软件,选择菜单栏中的【File(文件)】【Data(数据)】【Aggregate(分类汇总)】命令,弹出【Aggregate D ata(汇总数据)】对话框。 Step02:选
45、择分类变量 在左侧的候选变量列表框中选择一个或多个变量作为分类变量,将其移入【Break Variable(s)(分组变量)】列表框中。 Step03:选择汇总变量 在左侧的候选变量列表框中选择一个或多个变量作为汇总变量,将其移入【Summaries of Variable(s)(变量摘要)】列表框中。Step04:选择汇总函数 在 【 Summaries of Variable(s)(变量摘要)】列表框中可以选择相应汇总变量,此时可以单击下方的【Function】按钮,打开如下图所示的对话框。Step05:添加变量标签 在【Summaries of Variable(s)(变量摘要)】列表框
46、中可以选择相应汇总变量,此时可以单击下方的【Name and Label】按钮,弹出如下图所示的对话框。 Step06:选择汇总结果保存方式 在【save(保存)】选项组中可以选择汇总结果的保存方式。 Step07:大规模数据的排序选择 勾选【Options for Very Large Datasets(适用于大型数据集的选项)】复选框,可以对含有大规模数据的数据文件进行汇总之前的排序工作,这样能使得后续操作更有效率。 Step08:完成上述操作后,单击【OK】按钮,操作结束。2. 实例内容:城乡居民人民币储蓄存款 下图是我国部分省份2004年度城乡居民的人民币储蓄存款金额(年底余额,单位:
47、亿元)。Step01:打开对话框 Step02:选择分类变量 从对话框左侧的候选变量列表框中选择“省份”变量作为分类变量,将其移入【Break Variable(s)(分组变量)】列表框中。 Step03:选择汇总变量 从对话框左侧的候选变量列表框中选择“城镇储蓄”和“农户储蓄”作为汇总变量,将其移入【Summar ies of Variable(s)(变量摘要)】列表框中。由于这里主要是比较存款金额的高低水平,因此选择系统默认的平均值函数。 Step04:选择汇总结果保存方式 在【Save(保存)】选项组中点选【Write a new data file containing only th
48、e aggregated variables】单选钮,其目的是新建aggr.sav的外部数据文件保存汇总结果。 Step05:单击【OK(确定)】按钮完成操作。2.3.5 数据文件的拆分Split 1.数据分类汇总的SPSS操作详解 Step01:打开数据拆分对话框 打开SPSS软件,选择菜单栏中的【File(文件)】【Data(数据)】【Split File(拆分文件)】命令,弹出【Split File(拆分文件)】对话框。 Step02:选择数据拆分方式。 Step03:选择拆分变量。 Step04:单击【OK】按钮,操作结束。 注意:拆分后的文件在保存之后,下次调用该文件时,拆分结果仍然有效。当不需要分组时,可以按上述操作,点选【Analyze all cases,do not create groups(分析所有