收藏 分享(赏)

SPSS_入门讲义.ppt

上传人:saw518 文档编号:5433935 上传时间:2019-03-03 格式:PPT 页数:64 大小:1.70MB
下载 相关 举报
SPSS_入门讲义.ppt_第1页
第1页 / 共64页
SPSS_入门讲义.ppt_第2页
第2页 / 共64页
SPSS_入门讲义.ppt_第3页
第3页 / 共64页
SPSS_入门讲义.ppt_第4页
第4页 / 共64页
SPSS_入门讲义.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

1、SPSS 入门讲义,蓝志坚,关于SPSS软件,SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT),目前,世界上最著名的数据分析软件是SAS和SPSS

2、。SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。而SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。,SPSS软件的特点,集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含

3、多少个案例,统计功能囊括了教育统计学中所有的项目,包括常规的集中量数和差异量数、 相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。从某种意义上讲,SPSS软件还可以帮助数学功底不够的使用者学习运用现代统计技术。使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程,可能在使用手册的帮助下定量分析数据。,自从1995年SPSS公司与微软公司合作开发SPSS界面后,SP

4、SS界面变得越来越友好,操作也越来越简单。熟悉微软公司产品的用户学起SPSS操作很容易上手。SPSS for Windows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践中了解各种统计结果的实际意义,一、SPSS统计数据的创建与编辑,SPSS数据的属性及其定义方法 SPSS数据文件的构成 应用案例:定义SPSS数据结构 SPSS数据的录入 SPSS数据的编辑 数据文件的操作,1.SPSS数据的属性及其定义方法,一个完整的

5、SPSS数据结构包括:变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据的显示属性(显示宽度、列宽度、对齐方式),1.1变量名,首字符必须是字母或汉字,后面可以是除(!、?*)之外的任意字符。 变量名的结尾不能是圆点、句点、下划线 变量名的长度不能超过64个字符 变量名必须唯一,并且不区分大小写 SPSS的保留字不能作为变量名(ALL、NE、EQ、GT AND、NOT、WITH) 如不指定变量名,则系统默认变量名以VAR开头后面跟5个数字为了便于记忆和理解变量名与其所代表的具体含义致。,1.2变量的类型(Type),数值型:根据其功能和形式又可细分为(标准型、逗号型、句

6、点型、科学计数型、美元型和自定义货币型) 字符型 日期型 系统默认为标准数值型,1.2.1数值型变量,标准型:是SPSS默认的类型,宽度8、小数点2、小数点用圆点。 科学计数类型:适合数值很大或很小的变量,变量显示为指数形式。如:-1.28E+002表示-1.28102 逗号型(comma ) 圆点型(Dot) 美元型(Dollar) 自定义货币型,1.2.2日期型变量(Date),用于表示日期和时间的变量类型SPSS提供了多达29种日期型变量的格式.,1.2.3字符型变量(String),是非数值型变量类型,其值是由字符串组成的.对其定义的对话框只有一个输入项,1.2.4修改数据变量的默认值

7、,对于SPSS变量的参数,系统都会自动给出默认值.也可通过Edit菜单中的Date对话框重新设置,点击,1.3变量标签(Label),变量名标签(variable label)对变量名含义的进一步补充说明。,变量值标签(alue Label)是对数值型变量各个取值的含义给予进一步的解释和说明,.4变量缺失数据(missing value),系统默认无缺失值:如当前变量测试值、记录完全正确、无遗漏,则可用无缺失值。,离散缺失值:如性别0、3、4都是非法的,可分 别填入,点击,定义缺失值范围:这种缺失值针对连续的变量值。当指定某一范围的值出现在当前定义的变量中,则被当作缺失值处理。如在性别变量值中

8、输入了3、4、5、6。可以在LOW后面输入3,HIGHT后面输入6。注意这个定义范围内不能有合法值。,”0“就是包括不了的离散值,1.5度量尺度,定距型变量(scale)可以表示如温度、重量等含义的连续性数值变量,也可以表示年龄、次数等离散型变量.还可以表示时间的日期变量或者货币的货币型变量,但不能是字符型变量. 定序型变量(ordinal)其值表示一种顺序的前后,如职称变量可分为高中低三个档次,可用A(1)、B(2)、C(3)表示,定序型变量可以是数值型也可以字符型 定类型变量(nominal):该变量不存在变量值之间的大小、顺序的前后等。只表示属于的类别。如性别中“1”表示男,“2”表示女

9、等,可以是数值型也可以字符型,2.SPSS数据文件的构成,由数据结构和数据内容构成结构规定了数据文件的基本构成属性(变量名、变量类型、变量名标签、变量值标签、缺失值定义、度量尺度及数据显示属性如宽度列宽度和对齐方式等)如一个班考试成绩表包含姓名、考号、各科科目成绩(英语、数学、政治、专业)等六个变量。对每一个变量定义其属性,如“姓名”变量定义为字符型、宽度定义为8个字符,度量尺度为定类型,由于变量含义清楚,无须定义变量标签和变量值标签,缺失值默认为0,2.1创建SPSS数据文件,1.在Variables View 视区定义变量及其变量的属性 2.在Date View视区录入数据文件的内容 浏览

10、数据文件变量名的三种方法 在Variable View视区中浏览 在SPSS菜单中选择Utilities Varibles 在SPSS主界面选择File Display Date File information,SPSS数据的录入,当变量的属性定义完成后就可以开始进行数据的输入 切换窗口从Variables View Date View出现了二维的空白表格如Excel(见03 Date1)Enter输入一列相同参数Tab 输入一行同一案例的数据Shift+Tab光标左移,SPSS数据的编辑,保证录入的数据准确无误,需要对SPSS数据进行修改、删除、插入、复制、定位等操作。,创建和读取SPSS

11、数据文件,直接通过SPSS数据编辑窗口定义变量输入数据(如前所述) 通过打开不同格式的数据文件,间接创建SPSS数据文件。支持*.doc,*.xls,*.txt等,保存SPSS数据,经读取、修改后把SPSS窗口的数据以数据文件的形式保存到外部的储介质中。,二、均值的比较与检验,T 检验是检验差异显著性的十分重要的统计工具,这种差异显著性的检验是样本均值间的比较。因此T 检验也可以称为一种均值比较分析。它包括单样本T检验、独立样本T 检验、配对样本T 检验。 来自正态总体的两个样本进行均值比较常使用T 检验的方法。T 检验要求两个被比较的样体来自正态总体。 两个样本方差相等与不等时使用的计算t

12、值的公式不同。,1.单样本T检验,检验单个变量的均值是否与给定的常数之间存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本T 检验。,示例1,圆盘制动闸直径:标准为322mm 四台机器生产,每台抽出16个。检验是否与322有差异?,先拆分文件,按机器编号分四组,然后采用单样本T检验,点击,2.点击,1.填入检验参照指标,某轮胎厂的质量分析报告中说明,该厂某轮胎的平均寿命在一定的载重负荷与正常行驶条件下会大于25000 公里。平均轮胎寿命的公里数近似服从正态分布。现对该厂该种轮胎抽取一容量为15 个的样本,试验结果得样本均值为27000 公里能否作出结论:该厂产品与申报的质量标准相符数

13、据? 见示例轮胎.,示例2,点击,1.输入比较参照值,2.点击,2.两独立样本T检验,进行独立样本T 检验,要求被比较的两个样本彼此独立,即没有配对关系。要求样本均来自正态总体,而且均值对于检验是有意义的描述统计量。 独立样本T 检验和配对样本的T 检验均使用T test 过程,但是使用的菜单不同对于数据文件结构的要求和所使用的命令语句也有区别。,示例1,某物质在处理前与处理后分别抽样分析其含脂率如下 处理前(Xi) 0.19 0.18 0.21 0.30 0.41 0.12 0.27 处理后(Yi) 0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12 假定处理前后

14、的含脂率都服从正态分布,且方差相同。问处理前后的含脂率的平均值是否有显著变化?( =0.05)。,点击group进入分组变量,点击处理前后进入检验变量,1.点击group,定义分组 组1处理前 组2处理后,2.点击继续,点击确定,示例2,几何均数的比较选甲型流感病毒血凝抑制抗体滴度(对数) 共24 人,随机分为两组,每组12人,用甲型流感病毒活疫苗进行免疫,一组用气雾法,另一组用鼻腔雾法。免疫后一月采血,分别测定血凝抑制抗体滴度结果如下。问两法的效果有无差异?气 雾 组(1) 40 20 30 25 10 15 25 30 40 10 15 30鼻腔雾组(2) 50 40 30 35 60 7

15、0 30 20 25 70 35 25,选择TransformCompute ,激活Compute Variable 新变量赋值主对话框令,lgx=lg10(x),点击OK 按钮,执行数据文件新增变量lgx,,示例3,作T 检验时,应首先检验方差是否相等。以上例子都是经检验后两样本方差相等的。下面举出一个经检验后方差不相等的例子。 甲乙两矿坑平均产煤中含矸率( %)指标是服从正态分布的,今分别从两坑所产煤中各抽取7 个样品测得含矸率指标如下甲坑(x) 5.9 3.8 6.5 18.3 18.2 16.1 7.6乙坑(y) 7.6 0.4 1.1 3.2 6.5 4.1 4.7能否判断出它们的含

16、矸率有显著差异( =0.05),3.配对样本T 检验,配对的三种情况: (1)同一窝实验用小白鼠按性别、体重相同配对。再随机分到实验组和对照级分别,喂加入海藻的饮料和普通饮料,三个月后,分别将每对白鼠置于水中,测量其到溺死前的游泳时间比较两组白鼠游泳时间均值,从而比较两种饮料对抗疲劳的作用。,(2)同一组高血压病人,在进行体育疗法前后,测量其血压。每个病人在体育疗法前后的血压测量值构成观测量对。可以是这组病人体育疗法前后血压的平均值。进行配对T检验。分析体育疗法对降血压的疗效。,(3)在研究人体各部位体温是否有差别时,一个人的两个部位的温度构成一对数据,测量若干人的同样部位的温度数据,可以比较

17、这两个部位平均温度是否有显著性差异,使用配对t 检验,示例,某单位研究饮食中缺乏维生素E 与肝中维生素A 含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子。共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组。过一定时期后将大白鼠杀死,测得其肝中维生素A的含量。,不同饲料组大白鼠维生素A 含量数据表 大白鼠对号 1 2 3 4 5 6 7 8 正常饲料组 3550 2000 3000 3950 3800 3750 3450 3050 维生素A缺乏组2450 2400 1800 3200 3250 2700 2500 1750,示例2,为了检验甲、乙、丙三种分离机在析出某种有用物质效能上的高低,今抽取8批溶液,每批均分成三份分别由甲、乙、丙机分解处理。其析出效果数据如表8-20所示。试问甲、乙、丙三种机在析出效能上有无差异( =0.05)?,样号 1 2 3 4 5 6 7 8 甲(X) 4.0 3.5 4.1 5.5 4.6 6.0 5.1 4.3 乙(Y) 3.0 3.0 3.8 2.1 4.9 5.3 3.1 2.7 丙(Z) 3.2 3.8 4.3 3.6 4.0 4.9 4.7 2.4,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 简明教程

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报