收藏 分享(赏)

第7章 相关分析.ppt

上传人:yjrm16270 文档编号:6972641 上传时间:2019-04-29 格式:PPT 页数:47 大小:1.59MB
下载 相关 举报
第7章 相关分析.ppt_第1页
第1页 / 共47页
第7章 相关分析.ppt_第2页
第2页 / 共47页
第7章 相关分析.ppt_第3页
第3页 / 共47页
第7章 相关分析.ppt_第4页
第4页 / 共47页
第7章 相关分析.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

1、第七章 相关分析,本章主要内容:,1.相关分析概述及列联相关 2.二元定距变量的相关分析 3.二元定序变量的相关分析 4.偏相关分析,第一节 相关分析概述及列联相关,一、相关与不相关 寻找变量间的关系是科学研究的首要目的。 在统计学上,通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。,性别与四级英语考试通过率的相关统计,统计结果显示,当性别取值不同时,通过率的取值并未发生变化,因此性别与考试通过率无关。 自变量的不同取值在因变量上无差异,两变量无关。 自变量的不同取值在因变量上有差

2、异,两变量有关。,二、函数关系和统计关系,任何事物的变化都与其他事物是相互联系和相互影响的。变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。 函数关系是一一对应的确定性关系。 一个变量的值不能由另一个变量的值惟一确定,这种关系称为统计关系。,三、相关系数,(一)相关系数 相关系数的取值范围在-1和+1之间,即-1r+1。其中:1.若 0 r1,变量之间存在正相关关系。2.若-1r0,变量之间存在负相关关系。3.当r=1时,一个变量的取值完全取决于另一个变量,为函数关系。4.当r0时,变量之间不存在线性相关关系,(二)变量关系强度,1.r0.8,视为高度相关; 2.0.5r0.8时

3、,视为中度相关; 3.0.3r0.5,视为低度相关; 4.r0.3,相关程度极弱,可视为不相关。,五、变量类型与相关系数的确定,卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积。,(一)列联分析的基本原理 自变量发生变化,因变量取值是否也发生变化。,六、列联相关,在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,或称两变量不独立。,由此可见,期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡方的表达式如下:卡方的取值

4、在0之间。卡方值越大,关联性越强。,的改进标准化系数:为使 值有一固定的区间,便于比较,采用了以下几个修正:,A.系数(Phi): (01), 适用于22表。 B.列联系数(Contingency Coefficient):(01),适用任意表。 C. Cramer V系数:(01),适用任意表。 D.系数(Lambda): (01),适用任意表。 E.Goodman & Kruskal-tau系数: (01),适用任意表。,(二)列联表分析的功能,调用列联表分析过程可进行定类与定序资料列联表分析,一个行变量和一个列变量可组成一个二维列联表。而多个行、列、控制变量就可组成一个复杂的多维列联表。

5、在分析中可对二维和多维列联表资料进行统计描述和卡方检验,并计算相应的百分数指标。,列联表的格式,(三)列联表分析过程,列联表分析步骤:按AnalyzeDescriptive Statistics Crosstabs 顺序打开 Crosstabs 主对话框。,Crosstabs 对话框,绘制各变量交叉分组下的频数分布柱形图,不输出列联表,Statistics 对话框,Gamma不考虑并列值,即在计算时,并列值出现的次数不被计入分母之中(大家可以立刻想象这意味着什么:分母变小系数变大)。Somers d其实是Gamma的一个修正,将自变量的并列值考虑了进去、但没有考虑因变量的并列值,所以SPSS的

6、说明中称其为“非对称”的。 Kendalls tau-b则将自变量和因变量的并列值同时考虑了进去;而Kendalls tau-c 则如同Gamma一样,忽略任何并列值(但使用不同计算公式,故其结果并不完全一样)。 当等级有许多,且很少有ties的情况下,我们可用适合于此种资料的Spearmans Rho来测量相关。,Cell Display 对话框,Table Format 对话框,决定各单元格的输出排列顺序: 以行变量取值的升序排列 以行变量取值的降序排列,(四)应用举例 为了探讨吸烟与慢性支气管炎有无关系,调查了339人,情况如下:,(1)录入数据“Crosstab.sav” 。变量h为频

7、次;变量x为是否吸烟:1为吸烟,2为不吸烟;变量n为是否患病:1为患病,2为不患病。 (2)选择变量h进行加权。 (3)按Analyze-Descriptive Statistics-Crosstabs 顺序打开 Crosstabs 主对话框。将n变量 选入Row框作为行变量,将x变量 选入Column 框作为列变量。 (4)打开Statistics对话框,选中Chi-squareContingency coefficient和Phi and CramersV复选框,单击Continue返回。 (5)单击Cell按钮,打开Cell display对话框,选中observed和Expected

8、复选框,单击Continue返回;单击OK。,1.操作步骤,Statistics 对话框,2.输出结果及分析,卡方检验,对称性检验表,预测性检验表,第二节 二元定距变量的相关分析,一、简介 (一)spss相关分析简介相关分析用于描述两个变量间联系的密切程度,其特点是变量不分主次,被置于同等的地位。检验的假设为相关系数为0。在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令Bivariate过程、Partial过程、 Distances过程。,(二)spss相关分析类型,Bivariate过程用于两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。 Par

9、tial过程,可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。 Distances过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析。,(三)二元定距变量的相关分析,二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数对两个或两个以上定距变量之间两两相关的程度进行分析。 Pearson简单相关系数用来衡量定距变量间的线性关系。,二、命令,例:某班级学生数学和化学的期末考试成绩如表(具体分数值略),现要研究该班学生的数学和化学成绩之间是否具有相关性。操作步骤如下:,1.调用命令:Analyze/Correlate/Bivariate,弹

10、出如下对话框,选择相应选项。,不显示统计检验的相伴概率,而以星号表示,选择数学、化学变量进入右侧的变量框,2.单击options按钮,出现Bivariate correlations:Options对话框,选择相应选项。单击continue按钮返回,按0K按钮执行。,计算某个统计量时,在这一对变量中排除有缺省值的观测值。 对于任何分析,有缺省值的观测值都会被排除。,对每一个变量输出均值、标准差和无缺省值的观测数。 对每一个变量输出叉积离差和协方差,数学成绩和化学成绩的相关性系数为0.742,两个星号表示用户指定的显著性水平为0.01时,统计检验的相伴概率值小于等于0.01,即数学和化学显著相关

11、,且为正相关。,第三节 二元定序变量的相关分析,一、定义spearman和kendalls tau-b等级相关系数用以衡量定序变量间的线性相关关系,它们利用的是非参数检验的方法。对spearman和kendalls tau-b等级相关系数的统计检验,分n30 和n30 两种情况。,二、命令,例如:某语文老师先后两次对其班级学生同一篇作文加以评分。两次成绩分别记为变量“作文1”和“作文 2”(具体分数值略)。问两次评分的等级相关有多大,是否达到显著水平? 操作步骤如下:1.调用命令:Analyze/Correlate/Bivariate,弹出对话框,选择相应选项。2.单击ok, spss即开始运

12、行。,可以看出该语文老师两次评分的kendalls tau-b系数和spearman等级相关系数分别为0.745和0.874。在这两个数字旁边均有两个星号,表示用户指定显著性水平为0.01时,统计检验的相伴概率小于等于0.01,即两次评分显著相关,且为正相关。,当等级有许多,且很少有ties的情况下,我们可用适合于此种资料的Spearmans Rho来测量相关。,第四节 偏相关分析,一、定义二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。 偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除只分析另外两个变量之间相关程度的过程。,,,二、命令,例如:某

13、农场通过试验取得某农作物产量与春季降雨量和平均温度的数据(具体数值略)。现求降雨量对产量的偏相关。操作步骤:1.调用命令:Analyze/Correlate/Partial,弹出对话框,选择相应选项。2.单击Options按钮,出现Partial correlations:Options对话框 ,选择选项。3.单击 Continue按钮,返回 Partial Correlations对话框,单击 OK按钮即可得到统计结果。,显示统计检验中具体的相伴概率,选“产量”和“降雨量”变量,添加到Variables框中;再选择“温度”变量,使这个变量添加到controlling for框中,输出偏相关系数的同时还输出变量间的简单相关系数,上半部分输出的是变量两两之间的pearson简单相关系数,以产量和降雨量为例,它们之间的简单相关系数为0.981。下半部分是偏相关系数的输出结果,在剔除温度变量的影响条件下,产量和降雨量之间的偏相关系数为0.780,相伴概率为0.013,可见前者有夸大相关的成分。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑环境 > 建筑资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报