收藏 分享(赏)

SPSS统计软件使用指导dayinbannew.docx

上传人:dreamzhangning 文档编号:2300600 上传时间:2018-09-10 格式:DOCX 页数:57 大小:3.74MB
下载 相关 举报
SPSS统计软件使用指导dayinbannew.docx_第1页
第1页 / 共57页
SPSS统计软件使用指导dayinbannew.docx_第2页
第2页 / 共57页
SPSS统计软件使用指导dayinbannew.docx_第3页
第3页 / 共57页
SPSS统计软件使用指导dayinbannew.docx_第4页
第4页 / 共57页
SPSS统计软件使用指导dayinbannew.docx_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、1SPSS 统计软件使用指导1 SPSS 简介SPSS 是:Statistical Program for Social Sciences,即社会科学统计程序。1.1 SPSS 的基本功能1SPSS 的数据编辑功能利用 SPSS 的数据编辑器窗口,可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等一般性操作,还可以对数据文件中的数据进行顺序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。可以根据需要把将要分析的变量集中到一个集合中,打开时指定打开该集合,而不必打开整个数据文件。2表格的生成和编辑利用 SPSS 可以生成数十种风格的表格,利用编辑窗口或监视器可以编辑

2、所要生成的表格。在SPSS 的高级版本中,统计成果多被归纳为表格或图形的形式。3图形的生成和编辑利用 SPSS 可以生成数十种基本图形和交互式图形。其中基本图形包括条形图、线形图、面积图、圆饼图、高低图、帕雷托图、控制图、箱形图、误差条形图、散点图、直方图、ROC 曲线图、P-P 概率图、QQ 图、序列图和时间序列图等。交互式图形比基本图形更漂亮,可有不同风格的 2D、3D 图形。交互式图形包括条形交互作用图、点形交互作用图、线形交互作用图、带形交互作用图、圆形交互作用图、箱形交互作用图、误差条形交互作用图、直方交互作用图和散点交互作用图等。4SPSS 的统计功能(1) 摘要性分析 摘要性分析

3、是对原始数据进行描述性分析,是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。SPSS 统计软件通过调用摘要性分析,可完成均数、标准差、标准误差等指标的计算,对于计数和一些等级资料,可完成构成比率等指标的计算和 检验。SPSS 的摘要性分析包括以下几个过程:21) Frequencies(频数)过程 调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。2) Descriptives(描述)过程 调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始

4、数据转换成标准 Z 分值并存人数据库。3) Explore(探索)过程 调用此过程可对变量进行更为深入详尽的描述性统计分析,即探索性统计。它是在一般描述性统计指标的基础上,增加有关数据其他特征文字与图形描述,有助于思考对数据进行分析的方案。(2)平均水平的比较 在正态或近似正态分布的计量资料中,经常在使用前面介绍的摘要性分析后,还要进行组与组之间平均水平的比较,也就是要进行常用的 t 检验和单因素方差分析。在 SPSS 统计软件中实现这一功能可调用以下几个过程:1) Means(平均数)过程 与摘要性分析中的 Descriptives(描述)过程相比,若仅仅计算单一组别的均数和标准差,Mean

5、s(平均数)过程并无特别之处;但在指定条件分组计算均数和标准差时,如分性别同时分年龄计算各组的均数和标准差,则用 Means(平均数)过程更显简单快捷。2) One-Samples T Test(单一样本 T 检验)过程 调用此过程可完成样本均值与总体均值的比较。3) Indendent-Samples T Test(双样本 T 检验)过程 调用此过程可完成两样本均数差别的显著性检验,即两组资料的 t 检验。24) Paired-Samples T Test(配对样本 T 检验)过程 调用此过程可完成配对资料的显著性检验,即配对 t 检验。用于同对或同一研究对象分别给予两种不同处理的效果比较,

6、以及同一研究对象处理前后的效果比较。5) One-Way-ANOVA(单因素方差分析)过程 调用本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。(3)方差分析 方差分析主要用于:1)均数差别的显著性检验。2)分离各有关因素并估计其对总变异的作用。3)分析因素间的交互作用;方差齐性检验。SPSS 软件除上面介绍的 One-Way-ANOVA(单因素方差分析)过程外,可调用以下过程: Simple Factorial(单一因素)过程、General Factorial(综合因素)过程、Multivariate(多变量)过程等实现方差分析的功能。(4)相关分析 相关分析是判定变量间相互依

7、存关系的统计方法,借助于 Statistics(统计)菜单的 Correlate(相关)选项完成的。包括 Bivariate(两个变量之间相关分析)过程、 Partial(偏相关分析)过程、Distances(距离相关分析)过程。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来。(5)回归分析 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。用于说明这种依存变化的数学关系。SPSS 软件通过 Linear(线性回归)过程、 Curve Estimation(曲线估计)过程、Binary Logistic(二值逻辑回归)过程、Probit (概率回归)过程、 Nonlinea

8、r(非线性回归)过程等实现回归分析功能。(6)对数线性模型 对数线性模型是用于离散型数据或整理成列联表格式的统计资料的统计分析工具。SPSS 软件通过 General(一般对数线性分析)过程、Logit (分对数线性分析) 、Model Selection(选择模型的对数线性分析)过程实现这一功能。(7)分类分析 分类分析方法主要是聚类分析与判别分析。通过 Twostep Cluster(两步聚类)过程、KMeans Cluster(快速聚类)过程、Hierarchical Cluster(分层聚类)和 Tree(树状分析)过程、Discriminant(判别分析)过程实现。(8)因子分析 多

9、元分析处理的是多指标的问题,由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又会让人陷入混乱不清的状态。在实际工作中,由于指标间经常具备一定的相关性,所以希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。调用 Data Reduction(数据缩减)菜单的 Factor(因子分析)命令,可对多指标或多因素资料进行因子分析。(9)可靠性分析 可通过调用 Reliability(信度)过程完成。(10)非参数检验 许多统计分析方法的应用对总

10、体有特殊的要求,如 t 检验要求总体符合正态分布,F 检验要求误差呈正态分布且各组方差整齐。这些方法常用来估计或检验总体参数,但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设( 如总体分布) ,这类方法称非参数统计。通过调用 Chi-Square(卡方检验)过程、Binomial(二项分布检验)过程、 Runs(游程检验)过程、1-Sample K-S 过程(单样本 K-S 检验) 、2 1ndependent Samples(两独立样本非参数检验)过程、k lndependent Samples(多独立样本非参数检验)

11、过程、2 Related Samples(两配对样本非参数检验)过程、 K Related Samples(多配对样本非参数检验)过程,可实现非参数检验功能。1.2 SPSS 的数据处理1SPSS 录入数据3(1)将数据录入成 SPSS 的数据文件。SPSS 也可以读入其他格式的数据文件。(2)对数据文件进行必要的编辑。(3)利用 SPSS 的统计功能对编辑好的数据文件进行统计处理。(4)调整 SPSS 输出的统计结果(包括报表、图形和文本等 )。(5)将结果输出、存盘、打印等。例 12-1 某高校一次运动会上大一到大三年级学生铁饼标枪成绩(如表 12-1 所示) ,现将数据文件进行统计处理。

12、表 12-1 某高校一次运动会上大一到大三年级学生铁饼标枪成绩编号 姓名 性别 年级 铁饼(米) 标枪(米)1 周虎 男 大一 83 402 许建 男 大一 74 523 王红 男 大一 95 504 王费 女 大一 63 165 张华 女 大一 86 256 章华 女 大一 71 347 叶飞 男 大二 74 508 许结 男 大二 96 399 王蓬 男 大二 100 4910 果雨 女 大二 55 1911 王莉 女 大二 75 2312 杨微 女 大二 64 2713 孙平 男 大二 11 3314 刘放 男 大二 10 3015 张义 男 大三 89 4016 何龙 女 大三 72

13、2417 陈真 女 大三 72 1718 霍达 女 大三 69 202操作步骤打开 SPSS 的数据编辑器。通常我们先要定义变量的属性,然后再输入数据。在数据编辑窗口的左下端,有两个页标签:Date View(数据视图) 、Variable View(变量视图) 。我们可以通过鼠标单击方便地在两个窗口之间切换。在录入数据之前,应该对数据的统计处理有一个基本的框架:计算哪些变量、做何种统计、生成哪种统计图等。在本例中,只做一般性的描述性统计处理,即求各年级男女选手的成绩平均值、标准差、最大值、最小值等。首先单击 Variable View(变量视图)页按钮,进入图中所示的变量属性窗口。可以像输入

14、数据一样定义一些变量的属性,如变量名、变量的长度、变量标签、变量的缺失值等。对于某些变量属性还会弹出对象框,可以进行进一步的定义工作。然后按照表 12-1 的结构输入数据即可(如图 12-4 所示) 。4图 12-4 某高校一次运动会上大一到大三年级学生铁饼标枪成绩2 描述性统计SPSS 基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法,可以对要分析数据的总体特征有比较准确的把握,从而可以选择其他更为深入的统计分析方法。本节内容主要包括频数分析、描述性分析、探索分析、基本统计报表制作。我们主要讲述了如何在 SPSS 中进行的频数分析、描述性分析和基本统计报表制作等操作。2.1 频数

15、分析1频数分析的基本原理频数分析(Frequencies)过程是描述性统计分析中最常用的方法之一,它不仅可以产生详细的频数分析表,还可以按要求给出平均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差、四分位数、十分位数、百分位数。频数分析中涉及到的有关描述性统计量的理论知识,在本书前几章中已经进行了详细的论述,现只对 Kurtosis (峰度)和 Skewness(偏度)作以解释。峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为 0 表示其数据分布与正态分布的陡缓程度相同,峰度大于 0 表示比正态分布高峰更加陡峭,为

16、尖顶峰。峰度小于 0 表示比正态分布的高峰要平坦,为平顶峰。峰度的计算公式如下:(12-1)3/)(14niiSDxKurtosi偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。具体的计算公式如下:(12-2)niiSxSkewns13/)(5这个统计量是与正态分布相比较的量,偏度为 0 表示其数据分布形态与正态分布偏度 X 相同;偏度大于 0 表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边:偏度小于 0 表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。2SPSS 实现过程例 12-2 某公司 20 名员工的收入

17、中的 “基本工资”变量为例,求“基本工资”的均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差(如表 12-2 所示) 。表 12-2 某公司 20 名员工的收入姓名 性别 基本工资 奖金 分红A 男 5000 1500 800B 男 4800 1300 500C 男 3700 1300 500D 男 1980 1000 400E 男 1540 1000 400F 男 4690 1300 500G 男 3150 1000 800H 男 1680 1000 500I 男 4800 1300 500J 男 3760 1000 400K 男 3478 1000 4

18、00L 女 4800 1300 500M 女 2080 1000 800N 女 2440 1000 500O 女 3980 1300 500P 女 1730 1000 400Q 女 2488 1000 400R 女 4042 1500 500S 女 2880 1000 500T 女 3740 1200 600(1)单击 Analyze(分析)菜单 Descriptive Statistics(描述统计)项中的 Frequencies(频数)命令(如图 12-5、12-6、12-7 所示) 。图 12-56图 12-6图 12-7(2)弹出 Frequencies(频数)对话框。在对话框左侧的变

19、量列表中选择 “基本工资” ,点击“”按钮使之添加到 Variable(s)(变量)框中。(3)单击下方的 Statistics(统计)按钮,弹出 Frequencies(频数):Statistics(统计)对话框。选择要统计的项目,Mean(均值) 、Median(中位数) 、Mode(众数) 、Sum(合计) 、Std deviation(标准差) 、Variance(方差) 、Range (全距) 、Minimum(最小值 )、Maximum(最大值)、StdError of Mean(平均标准误差) 、Skewness(偏度) 、Kurtosis(峰度) 。选中对话框下方的 Displ

20、ay frequency tables(频数分布表)复选框,表示显示频数分布表。选好后单击 Continue(继续)按钮返回Frequencies(频数)对话框,单击 OK 按钮,SPSS 即开始计算(如图 12-8 所示) 。7图 12-8(4)结果解读(如图 12-9 所示)8图 12-9从结果中可以看出,此公司 20 名职工的基本工资 Mean(均值) 3337.90 元、StdError of Mean(平均标准误差) 262.42174、Median(中位数)358900 元、Mode (众数)4800.00 元、Stddeviation(标准差)1173.586 元、Varianc

21、e(方差) 1377303 元、Skewness(偏度)-0.116 元、StdError of Skewness(偏度标准误差 ) 0.512 元、Kurtosis (峰度) -1.369 元、Std Error of Kurtosis ( 峰度标准误差) 0.992 元、Range(全距)3460 元、Minimum(最小值 ) 1540 元、Maximum(最大值) 5000 元、Sum(合计)66758 元。3求 Quartiles (四分位数)、Deciles ( 十分位数) 和 Percentiles (百分位数)(1)Quartiles (四分位数)基本原理 四分位数是将一组个案

22、由小到大(或由大到小)排序后,用 3 个点将全部数据分为四等份,与 3 个点上相对应的变量称为四分位数,分别记为 Q1(第一四分位数) 、Q2(第二四分位数) 、Q3(第三四分位数)。其中,Q3 到 Q1 之间的距离的一半又称为四分位差记为 Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。(2)Deciles ( 十分位数 ) 基本原理 十分位数是将一组数据由小到大(或由大到小) 排序后,用 9 个点将全部数据分为十等份,与 9 个点位置上相对应的变量称为十分位数,分别记为Dl,D2,D9,表示 10的数据落在 Dl 下,20的数据落在 D2 下,90落在

23、D9 下。(3)Deciles ( 百分位数 ) 基本原理 百分位数是将一组数据由小到大(或由大到小) 排序后分割为100 等份,与 99 个分割点位置上相对应的变量称为百分位数,分别记为 P1,P2,P99,表示1的数据落在 P1 下,2的数据落在 P2 下,99落在 P99 下。现利用 SPSS 求四分位数、十分位数和百分位数。以某公司 20 名员工的收入资料为例,求“基本工资”的四分位数、 “奖金”的十分位数和“分红”的百分位数。(4)SPSS 实现过程1)同求均值的操作步骤(1) 。2)同求均值的操作步骤(2) 。3)单击下方的 Statistics(统计)按钮,弹出 Frequenc

24、ies(频数): Statistics(统计) 对话框,选择要统计的项目:Quartiles 复选框:四分位数,输出 25%,50%,75%的分位数值;Cut points for n equal groups 复选框:十分位数。将数据按大小顺序排序后,平均分成 n 等份,输出相应数据。如果选择此项,要求在右侧的编辑框输入一个整数数字。若输入数字 n=10,即平均分成 10 等份;Percentile(s) 复选框:是自定义百分位数。依次键入一系列按大小排列的整数,键入值通过左侧的 Add(增加) 、Change(更改) 、Remove(移除)按钮进行编辑。也可以自定义百分位数,若键入 35,

25、可求出在 35%9状态下的分红值。(5)结果解读1)求“基本工资”的四分位数(如图 12-10、12-11 所示)图 12-10图 12-11从结果中可以看出,此公司员工基本工资的第一四分位差 Q1=2170.00 元,第二四分位差Q2=3589.00 元,第三四分位差 Q3=4528.00 元,Q= = =1176.5 元。2Q1375482)求“奖金”的十分位数(如图 12-12、12-13 所示)图 12-1210图 12-13从结果中可以看出,此公司员工奖金的 DlD5=1000 元,D6=1260 元,D7、D8=1300 元,D9=1480 元。3)求“分红”的百分位数(如图 12

26、-14、12-15 、12-16、12-17 所示)图 12-14图 12-1511从结果中可以看出,此公司员工分红的百分位数是 P1P30=400 元,P30P40=430 元,P40P70=500 元,P70 P80=580 元,P80 P100=800 元。若自定义百分位数是 35,求出的在 P35 状态下的分红值为 500 元。图 12-16图 12-172.2 描述性分析1描述性分析的基本原理描述性统计分析过程就是计算并列出一系列描述性统计量指标。这与前面讲的频数分析过程相同,但它可以将原始数据转换成标准化值,并以变量的形式存入数据库 ,供进一步分析。将原数据变量 X 转化成新的标准

27、化值变量 Z。我们称为 Z 分数。Z 分数定义:从平均数为 ,标准差为 的总体中抽出一个变量值 X,Z 分数表示的是此变量大于或小于平均数几个标准差。计算公式: x将原始数据直接转换为 Z 分数时,常会出现负数和带小数点的值,实际使用起来很不方便。因此,可以对 Z 分数进一步加以线性转换,使之成为正的数值。最典型的一种 Z 分数线性转换就是 T 分数。计算公式: 501T2SPSS 的实现过程现利用 SPSS 以表 12-2“基本工资 ”变量为例,求它的 Z 分数。步骤如下:12(1)单击 Analyze(分析)菜单 Descriptive Statistics(描述统计)项中的 Descri

28、ptives(描述)命令。 (如图 12-18 所示)图 12-18(2)弹出 Descriptives(描述)对话框。在对话框左侧的变量列表中选择“基本工资” ,单击“”按钮使之添加 Variable(s)(变量)框中,同时选中对话框左下方的 Save standardized values as variables(把标准化后的值保存为变量)项。(3)单击右下方的 Options(选项)按钮,出现 Descriptives(描述):Options(选项)对话框,在此选择 Mean(均值) 、Std deviation(标准差) 、Variance(方差) 、3 项统计量。 (如图 12-1

29、9 所示)图 12-19选好后单击 Continue(继续)按钮返回 Frequencies(频数)对话框,单击 OK 按钮,SPSS 即开始计算。3结果解读在数据编辑窗口中。新变量“Z 基本工资”表示“基本工资”Z 分数。 (如图 12-20、12-21 所示)13图 12-20图 12-214Z 分数转换为 T 分数由于 Z 分数有正有负,而且小数点位数较多,因此可以把它通过线性转换为 T 分数。在 SPSS 中的转换步骤:(1)在 Transform(转换)菜单中选择 Compute(计算) (如图 12-22 所示)图 12-2214(2)在弹出的 Compute Variable(计

30、算变量)对话框中,在 Target Variable(目标变量)文本框中输入目标变量 t,接着在 Numeric Expression(数值表达)文本框中输入“10Z 基本工资+50” 。单击Type Kendallstua-b(肯德尔) 复选框:等级相关系数,是一个用反映分类变量一致性的指标,只能在两个变量均属于有序分类时使用; Spearman(斯皮尔曼) 复选框:是最常用的无参数相关分析。2)确定双尾检验还是单尾检验。在 Test of Significance(显著性检验)框中,选择单选钮 Tow-tailed(双侧)表示选择双尾检验,选择单选钮 One-tailed(单侧)表示选择单

31、尾检验。默认设置将对相关显著性进行双尾检验,本例采用默认设置。3)是否突出显示相关是否显著。选择复选框 Flag significant correlations(标识显著相关) ,在输出结果中将用“*”号标记有统计学意义的相关系数,P0.05 的系数值旁会标记一个星号,PO.01 的则标记两个星号。默认设置选中该项,本例采用默认设置。(3)指定输出内容和缺失值处理方法。单击 Bivariate Correlations(两个变量相关)对话框中的Options(选项)按钮,弹出 Bivariate Correlations Options(两个变量相关选项)对话框。1) Statistics(

32、统计)复选框组:选择要输出的统计量。 Means and standard deviations(平均值和标准差);Cross-product deviations and covariances(产品交叉离差和协方差)复选框:输出各对变量的离均差平方和以及协方差阵。2) Missing Values(缺失值)单选框组:指定对缺失值的处理方法。本例采用默认设置。Excludes casespairwise(排除因变量和自变量均有缺失值观测量)单选钮:在分析过程中遇到缺失值时将缺失值排除在数据分析之外;Excludescaseslistwise(排除因变量或自变量有缺失值观测量)单选钮:只要相关

33、变量有缺失值,则在所有分析中都将该记录去除(如图 12-57 所示) 。26图 12-573) 最后单击 Continue(继续)按钮,返回 Bivariate Correlations(两个变量相关)对话框。(4)所有设置确认无误后,单击 OK 按钮,得到输出结果。4结果解读SPSS 的两变量间的相关分析(Bivariate)的结果比较简单,输出结果中只有一个描述性统计量表和一个各变量间的相关关系表。如果进行相关分析的变量是两个以上,输出时会分别显示两两变量间的相关关系(如图 12-58 所示) 。图 12-58(1)输出结果文件中的第一个表格:描述性统计量表。从表中可知,参与分析的两个变量

34、的样本数都为 10,亩产量的均值为 361(kg),标准差为 63.96;施肥量的均值为 9(kg),标准差为 4.397。(2)输出结果文件中的第二个表格:相关系数及显著性检验结果表。从表中可知,亩产量和施肥27量的相关系数 r=0.982 显著性水平为 0000 (Sig(2-tailed),因此在相关系数旁以两个“*”号进行标识,亩产量和施肥量的相关性十分显著。5.2 偏相关分析1偏相关分析的基本原理事物之间的联系往往是受到多种因素相互综合作用而产生的。在多变量的情况下,两变量的相关分析有时不能真实准确地反映事物之间的相关关系。例如,在研究某作物亩产量与施肥量时,亩产量和施肥量之间的关系

35、中实际还包含了降雨量对亩产量的影响,在这种情况下单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。偏相关分析是指在对其他变量的影响进行控制的条件下,分析多个变量中某两个变量之间的线性相关程度。同时要对偏相关系数的显著性进行检验3SPSS 实现过程例 12-11 为研究某种农作物亩产量增长的原因,选取了 10 块条件基本相同的地块进行试验得到施肥量、有效灌溉面积对农作物的亩产量的影响,试讨论农作物亩产量在扣除施肥量之后,有效灌溉面积对农作物的亩产量的偏相关系数,数据(如表 12-7 所示) 。表 12-

36、7 农作物亩产量增长情况表地块编号 1 2 3 4 5 6 7 8 9 10施肥量 )(kgx2 4 5 8 8 10 11 13 14 15有效灌溉面积( %)36 37 38 52 50 51 60 58 64 63亩产量 )(kgy253 294 298 360 348 366 410 401 443 437(1)在 Analyze(分析)菜单中选择 Correlate(相关分析)中的 Partial(偏相关分析)命令。弹出 Partial Correlations(偏相关)对话框(如图 12-59 所示) 。图 12-59(2)选择进行相关分析的变量。现欲分析亩产量与有效灌溉面积的相关

37、关系,故在 Partial Correlations(偏相关)对话框左侧的变量列表中选“亩产量”和“有效灌溉面积”使之进入Variables(变量)框。将“施肥量” ,使之进入 Contro11ing for(控制)框,表示在扣除降雨量影响情28况下来分析。(3) 确定双尾检验还是单尾检验。在 Test of Significance 框中,选择单选钮 Tow-tailed(双侧)表示选择双尾检验,选择单选钮 One-tailed(单侧)表示选择单尾检验。默认设置是对相关显著性进行双尾检验,本例采用默认设置。(4) 是否相关的显著性显示。选择 Display actual significan

38、ce level(显示实际显著性水平),在输出结果中将用“*”号标记。若 P0.01 的系数值旁则会标记两个星号。本例选中该项。(5)指定输出内容和缺失值处理方法。单击 Partial Correlations(偏相关)对话框中的Options(选项)按钮,弹出 Partial Correlations:Options(偏相关:选项)对话框。1) Statistics(统计)复选框组:选择要输出的统计量。 Means and standard deviations(平均值和标准差) ; Zero-ordercorrelations (零次序相关)复选框:输出所有变量的相关阵;2) Missin

39、g Values(缺失值)单选框组:指定对缺失值的处理方法。本例采用默认设置。其中:Excludes cases listwise(排除因变量或自变量有缺失值观测量):只要有关变量有缺失值,则在所有分析中都将该记录去除,再进行分析计算;Excludes cases pairwise(排除因变量和自变量均有缺失值观测量):在分析过程中遇到缺失值时将缺失值排除在数据分析之外(如图 12-60 所示) 。图 12-603) 单击 Continue(继续)按钮,返回 Partial Partial Correlations(偏相关)对话框。(6) 单击 OK 按钮,得到输出结果4结果解读SPSS 的偏

40、相关分析的输出也比较简单,输出结果中只包含一个描述性统计量表和一个各变量间的相关关系表(如图 12-61 所示) 。29图 12-61(1)输出结果文件中的第一个表格:是描述性统计表。从表中可知,参与分析的亩产量、有效灌溉面积和施肥量 3 个变量的样本数都为 10,其中亩产量的均值为 361(kg),标准差为 63.96。有效灌溉面积的均值为 50.9(%),标准差为 10.723。施肥量的均值为 9(kg),标准差为 4.397。(2)输出结果文件中的第二个表格:是变量间的相关系数、偏相关系数及其显著性检验结果。从表中可知,亩产量和有效灌溉面积的相关系数为 r=0.986,对应的显著性水平为

41、 0.000 (Significance (2-tailed),即亩产量和有效灌溉面积是的相关性的;以施肥量为控制变量,即在扣除施肥量影响情况下,亩产量和有效灌溉面积的偏相关系数为 r=0.77,对应的显著性水平为 0.015(Significance (2-tailed),可得出结论,在扣除降雨量影响情况下,土壤侵蚀量和降雨强度相关性显著。6 回归分析回归分析的基本思想和方法以及 Regression (回归) 名称是由英国统计学家 FGalton (18221911年)。和他的学生 KPearson(18561936 年)提出的,他们在研究父母身高与其子女身高的遗传问题时,观察了 1078

42、 对夫妇,以每对夫妇的平均身高作为解释变量 y,取他们的一个成年儿子的身高作为被解释变量 X,将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。计算出的回归直线方程为 y=33.73+0.516X。这种趋势及回归方程表明父母身高 X 每增加一个单位时,其成年儿子的身高 y 也平均增加 0.516 个单位。结果表明,虽然高个子父辈有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。反之,矮个子父辈的确有生矮个子儿子的趋势,但父辈身高减少一个单位,儿子 身高仅减少半个单位左右。平均来说,一群高个子父辈的儿子们在同龄人中平均仅为略高个子;一群矮个子父辈的儿子们在同龄人中

43、平均仅为略矮个子,即父辈偏离中心的部分在子代被拉回来一些。正是因为子代身高有回到同龄人平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高其子女更高,父辈个子矮其子女更矮现象。为了描述这种有趣的现象,FGalton 引进了 regression (回归)这个词来描述父辈身高 X 与子代身高 y 的关系。根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回归分析等类型。6.1 一元线性回归一元线性回归是涉及一个自变量的回归分析,主要是处理两个变量(因

44、变量与自变量) 之间的线性关系,建立线性数学模型并进行评价预测。即: 式中 和 是未知参数, 称为回归常xy10010数, 称为回归系数。 称为随机扰动项。1301拟合优度检验回归方程的拟合优度检验,就是要检验样本数据聚集在样本回归直线周围的密集程度而判断回归方程对样本数据的代表程度。一般用判定系数 实现。2R2回归方程的显著性检验(F 检验)回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。一般采用 F 检验,利用方差分析的方法进行。3回归系数的显著性检验(t 检验)是根据样本估计的结果对总体回归系数的有关假设进行检验。一般采用 t 检验。4SPSS 实现过程例

45、 12-12 以例 12-10 为例,为研究某种化肥对农作物产量的影响,选取了 10 块条件基本相同的地块进行试验得到施肥量与农作物的亩产量,试求农作物亩产量对施肥量的回归直线方程。数据(如表 12-8 所示) 。表 12-8 某种化肥对农作物产量影响表地块编号 1 2 3 4 5 6 7 8 9 10施肥量 )(kgx2 4 5 8 8 10 11 13 14 15亩产量y253 294 298 360 348 366 410 401 443 437(1)在 Analyze(分析)菜单中选择 Regression(回归分析)中的 Linear(线性)命令(如图 12-62 所示) 。图 12

46、-62(2) 在弹出的linear Regression(线性回归)对话框中,从对话框左侧的变量列表中选择“亩产量”,单击“”按钮使之添加到Dependent(因变量)框中,表示该变量是因变量 y;选择“施肥量”,单击“”按钮使之添加到Independent(s)(自变量)框中,表示其为自变量X。1) SPSS一般默认在回归分析中只有一组可进入回归方程的自变量和相应的筛选方法。当有多组自变量和与其相对应的多种不同的变量筛选方法时,可以通过使用Previous(先前的)和Next(下一步)按钮将它们放置在不同的 Block (块)中。具体操作执行的步骤如下:SPSS从当前Block ( 块)(默认为1)开始,提取自变量和相应的变量筛选方法对回归方程进行拟合;自动提取下一块中的自变量组和相应的变量筛选方法,在上一个回归方程的基础上再次进行拟合,直到结束。在Method(方法)框中可以选择多元线性回归分析的自变量筛选方法选项如下(如图12-63所示) 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报