收藏 分享(赏)

SPSS学习系列17. 交叉表与多选题.doc

上传人:精品资料 文档编号:8223451 上传时间:2019-06-15 格式:DOC 页数:16 大小:797.20KB
下载 相关 举报
SPSS学习系列17. 交叉表与多选题.doc_第1页
第1页 / 共16页
SPSS学习系列17. 交叉表与多选题.doc_第2页
第2页 / 共16页
SPSS学习系列17. 交叉表与多选题.doc_第3页
第3页 / 共16页
SPSS学习系列17. 交叉表与多选题.doc_第4页
第4页 / 共16页
SPSS学习系列17. 交叉表与多选题.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、17. 交叉表与多选题(一)基本理论分类变量包括无序分类变量、有序分类变量、多选题变量集。对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标。一、单分类变量的统计描述1. 频数分布分类变量的分析,首先要了解:各类别的样本数(频数) ,以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。2. 集中/ 离散趋势观察原始频数,或者使用众数。对于分类变量,集中/离散趋势是一体的。3. 相对频数指标(1)比(Riatio)两个有关指标之比 A/B, 用来反映相对的大小关系,例如,月销售额/ 销售人数;(2)构成比用于描述事物内部

2、各构成部分所占的比重,例如,百分比、累积百分比;(3)率(Rate)率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。二、多分类变量的联合描述列联表。例如,rc 二维列联表:(1)共 n 个样本;(2)按两种属性 A、 B,属性 A 有 r 个水平值:A 1, , Ar; 属性B 有 c 个水平值: B1, , Bc. 属性 A=Ai,属性 B=Bj 的样本数为 nij. (3)n i. = “属性 A=Ai”的合计数,n .j = “属性 B=Bj”的合计数。注:多分类变量对应高维列联表。三、多选题的统计描述多选题是调查问卷的常见题

3、型,因为多选题是回答同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。1. 应答人数(Count )选择各题项的人数,原始频数;2. 应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程度;3. 应答人次(Response)选择各选项的总人次,1 个受访者选择 2 个选项,即 2 人次;4. 应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例。(二)SPSS 实现有某调查问卷的数据文件(部分):变量属性:一、单分类变量的描述频率变量“s4”表示学历:问题 1:描述受访者的学历分布情况【分析】【描述统计】【频率】 ,将“学历”选入【变量】框,点【确定

4、】得到S4. 学历频率 百分比 有效百分比 累积百分比初中/技校或以下 154 13.4 13.4 13.4高中/中专 313 27.3 27.3 40.7大专 331 28.9 28.9 69.6本科 292 25.5 25.5 95.0硕士或以上 57 5.0 5.0 100.0有效合计 1147 100.0 100.0注:详细操作见第 15 篇频率图表 。二、多分类变量的联合描述交叉表问题 2:描述“性别” 和“学历”的交叉频数分布1. 【分析】【描述统计】【交叉表】 ,打开“交叉表”窗口,将“性别”选入【行】框,将“学历”选入【列】框,勾选“显示复式条形图”注:若是 3 个分类变量的三

5、维列联表,将第 3 个分类变量选入【层 1 的 1】框,通过【下一张 】可以设置更多层;2. 【精确】设置计算概率值的方法,保持默认;【统计量】设置计算行/列变量关联性的统计指标和检验方法,保持默认;【格式】 【Bootstrap】 一般不用设置;3. 点【单元格】 ,勾选【计数】的“观察值” ,勾选【百分比】的“列” , 【非整数权重】选默认的“四舍五入单元格计数” ;点【继续】回到原窗口,点【确定】得到S2. 性别* S4. 学历 交叉制表S4. 学历初中/技校或以下 高中/中专 大专 本科 硕士或以上合计计数 74 167 191 169 36 637男S4. 学历 中的 % 48.1%

6、 53.4% 57.7% 57.9% 63.2% 55.5%计数 80 146 140 123 21 510S2. 性别女S4. 学历 中的 % 51.9% 46.6% 42.3% 42.1% 36.8% 44.5%计数 154 313 331 292 57 1147合计S4. 学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%注:若将变量“城市”选入第1步中的【层1的1 】框,则得到三维列联表,S2. 性别* S4. 学历* S0. 城市 交叉制表S4. 学历S0. 城市初中/技校或以下 高中/中专 大专 本科 硕士或以上合计计数 28 43

7、59 47 11 188男S4. 学历 中的 % 47.5% 51.8% 50.9% 46.5% 57.9% 49.7%计数 31 40 57 54 8 190S2. 性别女S4. 学历 中的 % 52.5% 48.2% 49.1% 53.5% 42.1% 50.3%计数 59 83 116 101 19 378100北京合计S4. 学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%计数 23 64 54 64 16 221男S4. 学历 中的 % 48.9% 52.5% 62.1% 59.3% 69.6% 57.1%计数 24 58 33 44

8、 7 166S2. 性别女S4. 学历 中的 % 51.1% 47.5% 37.9% 40.7% 30.4% 42.9%计数 47 122 87 108 23 387200上海合计S4. 学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%计数 23 60 78 58 9 228男S4. 学历 中的 % 47.9% 55.6% 60.9% 69.9% 60.0% 59.7%计数 25 48 50 25 6 154S2. 性别女S4. 学历 中的 % 52.1% 44.4% 39.1% 30.1% 40.0% 40.3%计数 48 108 128 8

9、3 15 382300广州合计S4. 学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%计数 74 167 191 169 36 637合计 S2. 性别 男S4. 学历 中的 % 48.1% 53.4% 57.7% 57.9% 63.2% 55.5%计数 80 146 140 123 21 510女S4. 学历 中的 % 51.9% 46.6% 42.3% 42.1% 36.8% 44.5%计数 154 313 331 292 57 1147合计S4. 学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100

10、.0%(三)多选题处理多重响应一、多选题的编码多选题的编码方式有两种:1. 多重二分法是标准的多选题数据格式,即每个选项各设一个变量, “选中=1”“未选中=0”例如,C0 题:请问您的家庭目前有下列还贷支出吗?(1)房贷 (2)车贷 (3)其他一般消费还贷用变量 C0_1、C0_2 、C0_3 分别代表上述 3 个选项,取值“1=选中、0= 未选中、99=拒答” ;注:“99=拒答”后续可作为缺失值,或合并到“0=未选中” 。2. 多重分类法若题项较多限定回答数较少,多重二分法就显得太啰嗦(过多的“未选中” ) ,此时适合用多重分类法:为所有选项设置一套值标签,需要多少个变量取决于限选项数。

11、例如,Q 题:如果你喝酒,主要受哪方面的影响?(限选 2 项,请按主次程度排出顺序,不喝酒的不用填)(1)家人 (2)朋友同学 (3)影视剧 (4)文学作品(5)网络 (6)风俗习惯 (7)其他用变量 Qa_1、Qa_2 分别表示第 1 影响、第 2 影响,取值为选项编号,如 Qa_1=3, Qa_2=2.二、设定多选题变量集多选题按前文的编码方式录入后只是若干个离散的变量,SPSS并不知道它们代表一道多选题,这就需要将其设置为多选题变量集(也称为多重响应集) ,SPSS 提供了两种方式:方法 1:【分析】 【表】【多响应集】方法 2:【分析】 【多重响应】【定义变量集】二者操作基本相同,区别

12、在于方法 1 可以保存定义的信息,方法 2关闭数据文件后相应信息将丢失。下面以方法 2 为例,有数据文件:多选题变量是 c0 和 a3,其中 c0_1, c0_2, c0_3 是多重二分法编码;a3a_1, a3a_2 是多重分类法编码。1. 【分析】【多重响应】【定义变量集】 ,打开“定义多重响应集”窗口;2. 将变量 “c0_1, c0_2, c0_3”选入【集合中的变量】框;勾选【将变量编码为】的“二分法” ,在【计数值】框输入“1” ,即指定“1 ”表示选中;【名称】框输入“C0” , 【标签】框输入“家庭每月还贷情况” ;点【添加】 ;3. 将变量“a3a_1, a3a_2”选入【集

13、合中的变量】框;勾选【将变量编码为】的“类别” ,在【范围】框输入取值范围:“0”到“150” ;【名称】框输入“A3a ”, 【标签】框输入“ 家庭经济状况” ;点【添加】 ,得到注意:同一多选题必须采用相同的编码方式和编码值。三、多选题的频数对前文得到的“多重响应集”C0 进行频数分析。1. 【分析】【多重响应】【频率】 ,打开“多响应频率”窗口,将多响应集“C0 ”选入【表格】框;【缺失值 】处理“在二分集内按照列表顺序排除个案”对应多重二分法多选题, “在类别内按照列表顺序排除个案”对应多重分类法多选题;点【确定】得到个案摘要个案有效的 缺失 总计N 百分比 N 百分比 N 百分比$C

14、0a 163 14.2% 984 85.8% 1147 100.0%a. 值为 1 时制表的二分组。在1147受访者中,共有163人选择了至少一个贷款种类。$C0 频率响应N 百分比个案百分比C0. 请问您的家庭目前有下列还贷支出吗:房贷118 59.3% 72.4%C0. 请问您的家庭目前有下列还贷支出吗:车贷33 16.6% 20.2%家庭每月还贷情况 aC0. 请问您的家庭目前有下列还贷支出吗:其他一般消费还贷48 24.1% 29.4%总计 199 100.0% 122.1%a. 值为 1 时制表的二分组。共199个有效回答(各种贷款种类共被选择199次),其中房贷118次,车贷33次

15、,其他一般消费还贷48次;响应百分比,给出了每类贷款选择次数占总选择数的百分比;个案百分比,给出了选择某类贷款的人数占总人数的百分比,即应答人数百分比,以房贷为例,118/163=72.4%; 最后的 122.1%说明 163 个人平均每人选择了 1.221 种贷款。四、多选题的列联表分析若要就多选题对不同人群分别描述,即对多选题变量集合其它分类变量进行交叉表描述。问题:按“婚姻状况”考察贷款情况1.【 分析 】 【多重响应】【交叉表】 ,打开“多响应交叉表”窗口,将变量“s7 婚姻状况”选入【 行】框,将【多响应集】“$C0$”选入【列】框;2. 选中【行】框中的“s7(? ?)”,点【定义

16、范围】 ,打开“定义变量范围”子窗口,根据变量 s7 的取值范围, 【最小值】框输入“1”, 【最大】框输入 “3”3. 点【继续】回到原窗口,点【选项】打开“选项”子窗口,勾选【单元格百分比】的“行” ;注:“百分比基于”可选择是基于“应答人数”还是“应答人次” ;“跨响应集匹配变量”当行/列变量均为多重分类法多选题时,可以让结果表格按两个变量集取值一一对应的方式来生成。点【继续】回到原窗口,点【确定】得到个案摘要个案有效的 缺失 总计N 百分比 N 百分比 N 百分比s7*$C0 163 14.2% 984 85.8% 1147 100.0%s7*$C0 交叉制表家庭每月还贷情况 aC0.

17、 请问您的家庭目前有下列还贷支出吗:房贷C0. 请问您的家庭目前有下列还贷支出吗:车贷C0. 请问您的家庭目前有下列还贷支出吗:其他一般消费还贷总计计数 91 23 30 120已婚 s7 内的 %75.8% 19.2% 25.0%计数 27 10 17 42未婚 s7 内的 %64.3% 23.8% 40.5%计数 0 0 1 1S7. 婚姻状况离异/分居/丧偶s7 内的 %0.0% 0.0% 100.0%总计 计数 118 33 48 163百分比和总计以响应者为基础。a. 值为 1 时制表的二分组。可以发现已婚人群的房贷比例高于未婚人群,而未婚人群的车贷和其他消费还贷比例则均高于已婚人群,但要注意上述结论只是基于163个有贷款的受访者计算的,而不是全部1147个受访者。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报