收藏 分享(赏)

2016数据分析方法02c-SPSS入门-自学部分.ppt

上传人:精品资料 文档编号:11319475 上传时间:2020-03-17 格式:PPT 页数:58 大小:1.04MB
下载 相关 举报
2016数据分析方法02c-SPSS入门-自学部分.ppt_第1页
第1页 / 共58页
2016数据分析方法02c-SPSS入门-自学部分.ppt_第2页
第2页 / 共58页
2016数据分析方法02c-SPSS入门-自学部分.ppt_第3页
第3页 / 共58页
2016数据分析方法02c-SPSS入门-自学部分.ppt_第4页
第4页 / 共58页
2016数据分析方法02c-SPSS入门-自学部分.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

1、数据分析方法及软件应用,授课教师:杨小宝 北京交通大学 2016.09,2020/3/17,SPSS入门-自学章节,1. SPSS数据的录入、编辑 2. SPSS数据文件合并 3. 数据预处理的其它功能,SPSS数据的录入 (与Excel类似,自学) SPSS数据的编辑 (与Excel类似,自学) SPSS数据的定位插入和删除一条个案插入和删除一个变量数据的移动、复制和删除,1. SPSS数据的录入、编辑,1) 录入,定义好SPSS数据结构后,可将具体的数据输入到SPSS中,最终形成SPSS数据文件。 SPSS数据的录入操作在数据编辑窗口中的数据视图(Data View)卡片中实现。其操作方法

2、与EXCEL基本类似,也是以电子表格的方式进行录入。,录入带有变量值标签的数据时,可以在下拉按钮中的值标签列表中选择一个作为输入,2) SPSS数据的编辑,数据必须输入正确才能保证正确的分析结果。但很难一次输入正确,所以就需要进行修改,一般包括数据的定位、插入、删除、修改、复制等。,2a) SPSS数据的定位,数据的定位目的是将当前数据单元定位到某个特定的单元中。有三种定位方式:1、按个案号码定位:将当前单元格定位在任何单元格中,选择菜单编辑(Edit)转至个案(Go to Case),出现如下对话框,输入欲定位的个案号码并确认。 2.按变量号码定位:编辑(Edit)转至变量(Go to Va

3、riable),3、按变量值定位: 编辑Edit查找Find 将当前单元定位在某变量列的任何一个个案上选择菜单编辑Edit查找Find,出现如下对话框输入定位变量值并确认于是, SPSS自动对指定的变量进行搜索,并将当前单元定位于定位变量值相等的第一个个案上。,2b) 插入和删除一个个案,插入一个个案,即在数据编辑窗口的某个个案前插入一个新个案:将当前数据单元确定在一个个案上,选择菜单 编辑Edit插入个案Insert Case(或工具栏插入个案图标按钮)删除一个个案,在欲删除的个案号码上单击鼠标左键,于是待删除的个案数据全部反向显示;单击鼠标右键,从弹出菜单中选择清除cut选项。,2c) 插

4、入和删除一个变量,插入一个变量,即在数据编辑窗口的某个变量前插入一个新变量:将当前数据单元确定在一个变量上,选择菜单菜单 编辑Edit插入变量Insert Variable 删除一个变量,在欲删除的变量名上单击鼠标左键,于是待删除的数据全部反向显示;单击鼠标右键,从弹出菜单中选择清除cut选项。,2d) 数据的移动、复制和删除,数据的移动、复制和删除:与一般的应用程序相同 选择操作对象(变量、个案、若干连续单元等) 剪切:Edit+Cut(Ctrl+X) 复制:Edit+Copy(Ctrl+C) 粘贴:Edit+Paste(Ctrl+V)恢复删除或修改前数据 Edit+Undo (或工具栏Un

5、do图标按钮),纵向合并数据文件 横向合并数据文件,2. SPSS数据文件合并,当数据量较多时经常会把一份大的数据分成几个小的部分,有几个录入员分别录入,以期加快数据录入速度,但一份完整的数据被分别存储在几个数据文件中,如果要分析这份数据就必须首先将若干个小的数据文件合并起来。要实现两个或多个SPSS数据文件的合并,应首先将其中的某个数据文件读入数据编辑窗口中,然后依次与其他数据文件合并。合并的方式有两种:纵向合并和横向合并。,1) 纵向合并数据文件,从外部数据文件中增加个案到当前数据文件中,称为纵向合并,相互合并的数据文件应该有相同的变量。 步骤: 打开一个数据文件; 菜单: 数据Data合

6、并文件Merge Files 添加个案Add Cases 在弹出窗口中打开一个存在于磁盘上的需要纵合并的文件,不同名变量,同名变量,注意:有变量的Pair(配对)问题,右边的新的活动数据集中的变量Variables In new working data file框中显示的变量名是两个数据文件中都有的变量名,左边的非成对变量Unpaired Variables框中的变量名是两个文件中的不同变量名, 其中变量名后面的*表示该变量是当前数据编辑窗口中的变量,+表示该变量是待合并文件中的变量。 如果希望在合并后的数据文件中看出个案的来源,可以选择将个案源表示为变量Indicate case sour

7、ce as variable 项将自动生成一个变量名为source01取值0或1的变量。,可选择其中的两个变量名并单击对pair按钮指定配对, 表示虽名称不同但数据含义是相同,可合并的数据; 也可指定某变量,不经匹配,强行合并。,匹配合并后 的数据结果,2) 横向合并数据文件,从外部数据文件增加变量到当前数据文件,称为横向合并,横向合并文件时要注意以下三个问题: 1、 相互合并的数据文件必须至少有一个名称相同的变量,该变量是两文件横向合作的依据,称为关键变量; 2、两个数据文件都必须先按关键变量进行升序排列; 3、不同数据文件中数据含义不相同的数据项变量名不应相同。,步骤: 打开一个数据文件;

8、 菜单: 数据Data合并文件Merge Files 添加变量Add Variables 在弹出窗口中打开一个存在于磁盘上的需要横向合并的文件,横向合并后的数据结果,1) 计数 2) 数据转置 3) 加权处理 4) SPSS缺失值处理 5) 数据排秩 6) SPSS变量集,3. 数据预处理的其它功能(自学),(1) 计数目的 (2) 计数区间 (3) 计数的基本操作 (4) 计数的应用举例,1) 计数,(1) 计数目的,SPSS实现的计数是对所有个案或满足某条件的部分个案,计算若干变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新变量中的过程。 例如对大学毕业班学生的成绩进行综合测评

9、时,可以依次计算每个学生的若干门课程中有几门课程得了优,有几门课程得了良,有几门课程不及格。 SPSS实现计数的关键步骤是: 指定哪些变量参与计数,计数的结果存入哪个新变量中 指定计数区间(尤为关键),SPSS中的计数区间可以有以下几种描述形式: 单个变量值(Value) 系统缺失值(System-missing) 系统缺失值或用户缺失值( System or user-missing) 给定最大值和最小值的区间(n through m) 小于等于某指定值的区间(Lowest through n) 大于等于某指定值的区间(n through highest),(2) 计数区间,(a) 选择菜单

10、转换Transform对个案内的值计数Count,出现如下窗口:,(3) 计数的基本操作,居民储蓄调查数据.sav,(b) 将参与计数的变量选到 变量(V)Numeric Variables框中 (c) 在目标变量Target Variable框中输入存放计数结果的变量名,并在目标标签Target Label框中输入相应的变量名标签。 (d) 单击定义值Define Values按钮定义计数区间,出现如下图窗口:,通过单击添加Add、更改Change、删除Remove按钮完成计数区间的增加、修改和删除。,(e) 如果仅希望对满足某条件的个案进行计数,则单击如果If按钮并输入相应的SPSS条件表

11、达式。否则,本步可略去。,居民储蓄调查数据.sav,利用居民储蓄调查数据分析近些年储户收入的总体状况。我们认为如果储户收入今年比去年增加了,且认为今后收入仍会增加则认为收入状况较好。试分析有多少个储户的收入状况较好。 收入情况为顺序数据,其中1表示增加,2表示基本不变,3表示减少。,(4) 计数的应用举例,思路: 从两个变 量中分别选出其 值为1, 即收入增 加的,计数为1。 若两变量都为1, 则计数为2,结果,居民储蓄调查数据.sav,SPSS的数据转置就是将数据编辑窗口中数据的行列互换。基本操作步骤如下:(1) 选择菜单数据Data转置Transpose。(2) 指定数据转置后应保留哪些变

12、量,将它们选入变量Variables框中,未被选中的变量将在新文件中缺失。(3) 指定转置后数据文件中各变量如何取名。,2). 数据转置,应选择一个取值唯一的变量(如职工号)作为标记变量并放到名称变量Name Variable框中。转置后数据各变量取名为K_标记变量值(如K_001、K_002、K_003等)。如果略去本步,则转置后数据各变量名默认为VAR00001,VAR00002,VAR00003等。同时,SPSS还会自动产生一个名为Case_lbl的新变量,用来存放原数据文件中的各变量名。,注: 字符串数据不能转置,数据加工(职工数据).sav,应用举例,结果,3) 加权处理,统计分析中

13、的加权处理是极为常见的,如计算加权平均数等。例如,希望掌握菜市场某天蔬菜销售的平均价格。如果仅用各种蔬菜销售单价的平均数作为平均价格就很不合理,还应考虑到销售量对平均价格的影响。因此,以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数,就能够较准确地反应平均价格水平。,SPSS中指定加权变量的操作步骤是:(1) 选择菜单数据Data加权个案Weight Cases。(2) 选择加权个案Weight Cases by选项,并将某变量作为加权变量选到Weight Cases by框中。注意的是一旦指定了加权变量,那么以后的分析处理中加权是一直有效的,直到取消加权为止。取消加权应选择请勿对个案加权

14、Do not weight cases选项。,大量的缺失值会给数据分析带来极大的影响,这就需要采用科学的方法对缺失值进行插补。操作步骤如下:(1) 选择菜单转置Transform替换缺失值replace missing values。(2) 将需要插补的变量单击按钮送到新变量New Variables框中,该变量自动会生成一个新的变量,变量名为原变量名_13)在方法Method中选择插补方法。,4) SPSS缺失值处理,Series mean :该变量所有非缺失值的均值 Mean of nearby points:该变量相邻非缺失值的均值 Median of nearby points:该变量

15、相邻非缺失值的中位数 Linear interpolation:线性内插法(用缺失值前后两点的中点值做替代,如果前后值有一个是缺失值,则得不到替换值 ) Linear trend at point:用线性拟合方式确定替代值,自变量为1-n的数值。,结果,数据排秩是根据某变量观测值的大小,按一定的顺序排秩,生成一个代表其秩次的新变量,但原始观测值本身顺序不发生改变。操作步骤如下:(1) 选择菜单转置Transform个案排秩rank cases(2) 将需要排秩的变量单击按钮送到变量 Variables框中,该变量自动会生成一个新的变量,变量名为R+原变量名;可选择分类变量到排序标准By框中,如

16、果选择,系统将按照此变量的不同组别分别进行排秩。,5) 数据排秩,(3) 选择将秩指定给Assign Rank 1 to下面的复选框选择排秩的顺序。 (4) 在秩的类型Rank Types 对话框中选择排秩方式;在结Ties对话框中选择相同观测值排秩方式。,秩结果=(N+1)/2,数据加工(职工数据).sav,应用举例,实际统计分析中SPSS数据编辑窗口的变量会有几十甚至上百个, 此时简化变量选择的操作变显得非常必要, SPSS变量集变是一种通过减少变量显示个数而简化变量选择操作的方式。,6) SPSS变量集,SPSS变量集是存放许多SPSS变量名的集合。SPSS变量集包括系统变量集和用户变量

17、集两大类。 系统变量集 用户变量集,系统变量集SPSS事先定义好的的变量集,它包括两个集合,分别名为ALLVARIABLES和NEWVARIABLES。其中ALLVARIABLES变量集中存放数据编辑窗口中的所有变量名, NEWVARIABLES变量集中存放数据编辑窗口中所有尚未存盘的新定义的变量名。这两个系统变量集有时包含的变量名是完全相同的。,用户变量集是用户根据实际需要自己定义的变量集,可以有若干个。如果用户仅希望对SPSS众多变量中的某几个变量进行相同的处理及分析,则可以先将这几个变量定义到一个用户变量集中,然后再指定使用这个变量集。于是,在数据处理或分析时,SPSS仅显示指定变量集中

18、的变量名,进而大大减少了显示变量的个数,加快了变量选择的操作速度。,1、定义用户变量集SPSS定义用户变量集的操作步骤如下: (1) 选择菜单实用程序Utilities定义变量集Define Sets (2) 在设置名称Set Name框中输入用户变量集的名称。 (3) 选择若干变量单击小箭头按钮将它们送到集合中的变量Variables in Set框中,表示用户变量集将包含这些变量。,(4) 单击添加集合Add Set按钮将定义的用户变量集加到SPSS变量集中。更改集合Change Set按钮可对已定义的用户变量集做修改。删除集合Remove Set按钮可从SPSS变量集中删去某个用户变量集。,2、变量集的使用SPSS有许多变量集,用户应告知将使用哪个变量集。系统默认使用的变量集是系统变量集。使用SPSS变量集的基本操作步骤如下: (1) 选择菜单实用程序Utilities 使用变量集Use Sets (2) 单击小箭头按钮将需使用的变量集选到选择应用的变量集Set in Use框中。还可将不需使用的变量集从Set in Use框中剔出。需要说明的是,在SPSS运行过程中应至少有一个变量集正在被使用,因此在Set in Use框中应至少有一个变量集。,结果:现在只包含6个变量,居民储蓄调查数据.sav,Thank you!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报