收藏 分享(赏)

spss.ppt

上传人:天天快乐 文档编号:1200770 上传时间:2018-06-18 格式:PPT 页数:44 大小:577.50KB
下载 相关 举报
spss.ppt_第1页
第1页 / 共44页
spss.ppt_第2页
第2页 / 共44页
spss.ppt_第3页
第3页 / 共44页
spss.ppt_第4页
第4页 / 共44页
spss.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

1、第二章 SPSS数据与数据文件,2.1 数据的来源与分类,数据是数据分析的关键之一,数据通常和我们研究的对象联系在一起。个体就是一组数据描述的对象;变量就是一个个体的任意特征。将数据按照不同的标准进行分类,有助于对数据来源和用途及其分析方法的深入理解和研究。,2.1.1观测数据与试验数据观测数据:是爱自然的未被控制的条件下观测到的数据,如社会商品零售额,消费价格指数,降雨量等。抽样调查、普查都是重要的观测研究,得到的数据是观测数据。试验数据:是在人工干预和操纵下产生的数据,这种数据通常来自于科学和技术试验。 将数据分为观测数据和实验数据是基于观测的对象是在自然的还是在可控的实验条件下产生的。他

2、们是数据最根本的两个来源。对这两种类型的数据要通过建立文件才能使用SPSS进行分析。,2.1.2一手数据与二手数据一手数据:针对特定的研究问题,通过专门收集、调查或试验取得的数据称为一手数据。(要通过建立文件才能使用SPSS进行分析)二手数据:由各种媒体、机构发布的数据,如证券市场行情、物价指数、利率、国民生产总值等,对于数据分析人员来说,可以根据研究的问题,从这些数据中加以选择,这样间接得到的数据称为二手数据。(要通过外部文件引入才能使用SPSS进行分析)一手数据和二手数据是根据数据分析人员获取数据的方式是直接还是间接的来划分的。,2.1.3时间序列数据与横截面数据这是计量经济学中的数据分类

3、方法。时间序列数据是对同一研究对象按时间顺序收集得到的数据,如国内生产总值、失业率等。这类数据是按照一定的时间间隔如每日、每周、每月、每季、每年收集的;横截面数据是指在同一时点上不同研究对象的数据的集合,如2007年沪深股市上市公司中期业绩。由这两类数据衍生出合并数据,合并数据中既有时间序列数据又有横截面数据。时间序列数据和横截面数据是数据沿时间与个体两个维度上的视图。,2.2 数据文件的建立,建立数据文件步骤:1、定义变量:定义变量名、指定变量类型、宽度、小数位数、定义变量标签、变量值标签。2、数据录入与编辑3、保存数据文件,2.2 .1 数据类型,1. 常量与变量(1) SPSS 常量 (

4、a)数值型常量 数值型常量就是程序在SPSS 语句中的数字,一般使用两种书写方式,一种是普通书写方式例如26 、38.4 等;另一种书写方式是科学记数法,用于表示特别大或特别小的数字例如1.23E18 、2.56E-16 等。,(b) 字符串常量 字符串常量是被单引号或双引号括起来的一串字符,如果字符串中带有字符“ ”,则该字符串常量必须使用双引号括起来例如 :“BOY S BOOK ”,(2)SPSS 变量(a) 为变量命名应该遵循以下四个原则 SPSS 变量的变量名由字符组成。首字母是字母,其后可为字母或数字或除“?、!、*” 以外的字符,但应该注意不能以连接线“-”和圆点“. ” 作为变

5、量名的最后一个字符。变量名不能与SPSS 保留字相同,SPSS 的保留字有ALL AND BY EQ GE GTLE LT NE NOT OR TO WITH系统不区分变量名中的大小写字符例如ABC 和abc 被认为是同一个变量,(b) 变量类型与默认长度 SPSS 变量有三种基本类型:数值型、字符型、日期型。定义时有以下可选的数据类型:Numeric(标准数值型) Comma(带逗点的数值型) Dot(逗点作小数点的数值型)ScientificNotation(科学记数法) Date(日期型) Dollar(带有美元符号的数值型) CustomCurrency(自定义型) String(字符

6、型),(c)变量标签和变量值标签,返回,(d) 变量的格式变量值标签是对变量的可能的取值所附加的进一步说明对分类变量往往要定义其取值标签当然变量值标签也是一个可选择的属性可以定义也可以不定义 例如: 变量 值 值标签 Sex f Female m Male,e)变量度量(Measurement)在统计学上按照对事物描述的精确尺度,将所采用的测量尺度从低级到高级分为4个层次:定类尺度、定序尺度、定距尺度(interval measurement)和定比尺度。下面是SPSS可以定义的变量测量尺度类型scale: 定距数据Ordinal:定序数据Nominal:定类数据,2 操作符与表达式(1) 算

7、术运算符与算术表达式(2) 比较算符与比较表达式(3) 逻辑运算符与逻辑表达式,数学运算操作符 关系运算符 逻辑运算符+ 加 (GT) :大于 | Or :或* 乘 =(GE) : 大于等于* * 幂 = EQ 等于( ) 括号 = NT 不等于,输入数据之前首先要定义变量定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式(显示宽度对齐方式缺失值标记等)(1) 对一般文件的变量定义(2) 调查问卷中开放题的变量定义(3)调查问卷中简单单选题变量定义(值标签)(4)调查问卷中对多选题变量定义(a.多重二分法 b.多重分类法),2.2.2 变量的定义,Name

8、 SexX 1X2X3yWang M35690.701 600Ning F 40742.502600Peng M42642.002 100Gu M40743.002650Hu F37721 . 1 02400You M45681 .502200Lu F43784.302750Lou M37662.001 600Chan M44703.202750Shen F42653.002500Zhou F4 1642.702400Deng M38722.52200,调查问卷例子1.姓名2.性别:1男 2女3.出生年月:4.家庭收入a.3000以下 b.30004999 c.50006999 d.70009

9、999 e.10000以上5.请问你购物的打折信息主要来自那些渠道:a.报纸 b.杂志 c.电视 d.网络 e.朋友介绍 f.手机短信g.其他,请指出6,每天上网的小时数:小时7,你在选择购物商场的时候,关注那些因素a.交通条件b.促销活动 c.购物环境 d.服务质量 e.其他,Data View和Variable View,返回,定义变量的普通方法,返回,定义变量类型,返回,定义值标签,返回,定义用户缺失值,返回,列格式、对齐、测度方式,返回,定类尺度(Nominal ):对事物的类别或属性的一种测度,可按某属性对其分类或分组定序尺度(ordinal ):对事物之间等级或顺序差别的一种测度,

10、可以比较优劣或排序定比尺度(scale):能够测算两个测度值之间比值的一种计量尺度,表现为数值,2.2.3 数据录入与编辑,数据输入方法1按变量输入数据2按观测量输入数据(case)概率事件观测量(Cases) 在数据编辑器的二维表格中每行都是数据文件的一个记录,在统计学中称作一个概率事件。在SPSS 的菜单中或帮助信息中用Cases 这个单词表示,每个Cases 是由各变量的一定的值组成,是一个事件或者说是对一个被观测对象的各种特征的实测值组成。因此相对应变量来说可以称之为观测量单元格中的数据即是某个观测量中的一个值,因此可以称之为变量值,也可以称之为某个观测值,在Help 信息中往往使用C

11、ase 这个单词。,对一般文件的数据录入a按变量输入数据b按观测量输入数据(case)(2) 调查问卷中开放题的数据录入a按变量输入数据b按观测量输入数据(case)(3)调查问卷中简单单选题数据录入a.直接录入 b.字符代码+值标签 c.数值代码+值标签(4)调查问卷中对多选题数据录入a.多重二分法 b.多重分类法,2.2.4 数据文件的保存,1、 文件类型SPSS(*.sav) (6.0以上)SPSS(*.sys) (4.0版)SPSS Portable (*.por) Tab-delimited (*.dat) Fixed ASCII (*.dat) Excel (*.xls),1-2-

12、3 Rel 3.0 (*.wk3)1-2-3 Rel 2.0 (*.wkl) 1-2-3 Rel 1.0 (*.wks)SYLK (*.slk) dBASEIV(*.dbf) dBASEIII(*.DBF) dBASEII(*.dbf),2、保存数据文件 在数据编辑器中定义变量输入修改数据形成一个可供SPSS 分析的数据文件,使用Edit 菜单项中的各种功能可以对数据文件进行编辑处理。 如果将数据文件存盘磁盘数据文件的扩展名为SAV ,利用菜单项File 的Data或Save As 功能展开的对话框指定存储路径位置和磁盘文件名,将数据窗中的数据保存为.sav格式的数据文件或者其他的数据文件如数

13、据库文件等。,NameSexX 1X2X3yWangM35690.701 600NingF40742.502600PengM42642.002 100GuM40743.002650HuF37721 . 1 02400YouM45681 .502200LuF43784.302750LouM37662.001 600ChanM44703.202750ShenF42653.002500ZhouF4 1642.702400DengM38722.52200,表 3-1待 入的数据,简单数据定义和输入实例,2.2.5 数据编辑,数据编辑器1.数据编辑器的组成(1) 窗口标题栏(2) 窗口状态栏(3) 数据

14、输入栏(4) 数据显示区,2 数据编辑器的功能概述 (1) 变量与观测量的编辑功能 (2) 数据编辑功能,已输入数据的修改1 在一个区域中修改数据2 恢复删除或修改前的数据,数据的剪切复制与粘贴 (1) 选择变量 (2) 选择观测量 (3) 选择属于某个变量的若干个连续的单元格 (4) 选择属于某个观测量的若干个连续的单元格,变量观测量的插入与删除1 插入一个变量2 删除一个变量3 插入一个观测量4 删除一个观测量,恢复删除或修改前的数据如果对本次的修改与删除不满想恢复操作前的状态,只要使用鼠标单击系统菜单中的Edit 展开下拉菜单选择第一项Undo 鼠标单击之即可,2.3其他格式数据文件的导

15、入,直接打开(如excel文件)使用数据库查询打开使用导入向导导入文本文件,2.3.1 Excel文件读入,步骤:1, file-open-data 弹出文件操作对话框2,通过查找范围查找要转换文件所在路径3,选择要打开文件类型:exel(*.xls)4,找到要转换的文件选定,按“打开”按钮弹出一个对话框5,保留默认选项,选择“ok”6,将读入的文件保存file-save,选择正确路径,根据要求命名保存即可。,2.3.2使用导入向导导入文本文件,1,选择菜单File=Read Text Data,系统就会弹出Open File对话框,文件类型自动跳到了Text (*.txt)。选中要读入的文件

16、,打开2,does your file match a preddfined format 选择 “no”,选下一步3,how are your variables arranged 一般选择Delitmited are variable names included at the top of your file,根据御览窗口可以看到第一行是变量还是数据,一般选择:yes ,然后选择“下一步”,4,The first cases of data begins on which默认:2(因为第一行一般是变量名)How are your cases represented?一般选择:each l

17、ineHow many cases you want to import通常选择:all选好后选择“下一步”,5,which delimiters appear between variables?变量间用的哪种分隔符,一般系统会自己有判断,选择默认的即可What is the text qualifier数据中采用的是什么文本限定符,一般选择“none”默认,但如果有,应该指定。都选择好后按“下一步”,6,specifications for variables selected in the data preview:定义在数据御览窗口所选择的变量。默认,选下一步7,默认,选“完成”8,将读入的文件按要求保存,2.3.3使用数据库查询打开数据库文件,选择菜单File=Open Database=New Query,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报