1、社会统计作业因子分析一、因子分析的总体思路判断数据是否适合做因子分析计算因子载荷值旋转并解释因子计算各个公共因子得分计算综合因子得分二、具体过程与步骤S1:变量层次判定在变量视图中查看目标变量的变量层,1-5 分是量表分是量表测量,属于定序层次;但是 9 是类别测量;因此先将 f7.1 到 f7.18 的缺失值设置为 9。S2:变量间的双相关分析操作:分析相关双变量相关表 1 变量之间的相关分析表家庭生活婚姻生活居住环境身体健康情况受教育情况工作单位工作岗位工作环境工作保障工作收入工作福利工作升迁机会与领导关系与同事关系职业社会声望亲戚关系朋友关系休闲活动家庭生活 1.00婚姻生活 0.69
2、1.00居住环境 0.27 0.21 1.00身体健康 0.33 0.30 0.21 1.00受教育情况 0.19 0.15 0.28 0.26 1.00工作单位 0.25 0.13 0.33 0.22 0.23 1.00工作岗位 0.25 0.15 0.34 0.21 0.29 0.73 1.00工作环境 0.21 0.14 0.42 0.22 0.26 0.65 0.72 1.00工作保障 0.20 0.06 0.33 0.17 0.23 0.60 0.50 0.63 1.00工作收入 0.23 0.09 0.29 0.20 0.18 0.57 0.46 0.47 0.59 1.00工作福
3、利 0.17 0.08 0.30 0.20 0.19 0.59 0.43 0.50 0.68 0.80 1.00升迁机会 0.17 0.08 0.31 0.11 0.26 0.52 0.42 0.46 0.50 0.61 0.61 1.00与领导关系 0.19 0.22 0.20 0.28 0.09 0.50 0.44 0.43 0.40 0.37 0.41 0.39 1.00与同事关系 0.25 0.24 0.12 0.35 0.11 0.33 0.38 0.28 0.27 0.22 0.20 0.18 0.56 1.00职业声望 0.20 0.12 0.26 0.15 0.25 0.50
4、0.52 0.48 0.36 0.39 0.36 0.39 0.39 0.30 1.00亲戚关系 0.30 0.29 0.14 0.23 0.17 0.19 0.31 0.21 0.21 0.10 0.10 0.21 0.32 0.37 0.31 1.00朋友关系 0.26 0.26 0.15 0.26 0.11 0.16 0.26 0.07 0.15 0.12 0.09 0.08 0.26 0.43 0.19 0.61 1.00休闲活动 0.26 0.23 0.33 0.33 0.16 0.28 0.19 0.25 0.31 0.29 0.28 0.21 0.26 0.30 0.28 0.3
5、8 0.44 1.00上表中的斯皮尔曼系数均大于 0,说明都有一定相关性;即便有部分斯皮 尔曼系数小于 0.3,但只是对数据进行对数据进行降维,不涉及理 论归纳,故不 删除 变量。S3:KMO 和 Bartlett 的检验1、KMO 是 Kaiser-Meyer-Olkin 的缩写,指 统计量检验,用于比较变量间简单相关系数和偏相关系数的指标。KMO 统计量是取值在 0 和 1 之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO 值接近 1。KMO 值,越接近于 1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近 0 时,KMO
6、值接近 0。KMO 值,越接近于 0,意味着变量间的相关性越弱,原有 变量越不适合作因子分析。常用的 KMO 度量标准:0.9 以上表示非常适合;0.8 表示适合;0.7 表示一般;0.6 表示不太适合;0.5 以下表示极不适合。2、Bartlett 汉语译作“巴特利球体检验”,用于 检验相关阵是否 为单位阵,即检验各个变量是否各自独立。在因子分析中,若拒绝 原假设, 则说明可以做因子分析,若不拒绝原假设, 则说明这些变量可能独立提供一些信息,不适合做因子分析。3、因子分析前,首先进行 KMO 检验和巴特利球体检验, KMO 检验系数0.5,双侧检验时 Bartlett的球形度检验统计值的显著
7、性概率 Sig.值(即 P 值) 0.8,Bartlett 球形度检验的近似卡方值在自由度为 153 时等于 1457.984,检验显著度 P=0.000工作报酬与前景社会交往自身条件工作外部环境。S6:计算综合得分按照一下公式计算出综合因子得分:综合因子得分=(因子 i 的方差贡献率因子 i 的得分)。因子 i 的方差贡献率=因子 i 的方差百分比n 个因子的方差比之和。操作:在 EXCEL 中计算得到 5 个因子的方差贡献率。在 SPSS 中做一下操作:转换计算变量目标变量输入“综合因子得分”,数字表达式按照上式计算。分析统计 描述统计频率选中 “综合因子得分”变量,统计量选择“平均值、中
8、位数、最大值、最小值、标准差 ”,得到描述统计表格得到下表结果。表 8 综合因子得分有效 162N缺失 338均值 47.58中值 46.69标准差 7.85极小值 28.49极大值 69.55S7:其他变量分析首先,对性别(a1 )、全年月平均总收入(C14)和受教育情况(a6.1)、身体状况( a8)、职位(c6)与综合因子得分的双变量分析。表 9 Spearman 相关系数综合因子得分 性别 自己的受教 育情况 职位 健康状况 去年平均每 月总收入综合因子得分 1.00性别 0.04 1.00自己的受教育情况 0.11 0.09* 1.00职位 -0.13 -0.14* -0.41* 1
9、.00健康状况 -0.16* -.097* -0.14* -0.06 1.00去年平均每月总收入 0.14 0.27* 0.45* -.33* -.124* 1.00注:*表示:在置信度(双测)为 0.05 时,相关性是显著的。 *表示在置信度(双 测)为 0.01 时,相关性是显著的。负号代表相关方向性为负向。根据上表中可知,综合因子得分与其余 5 个变量的斯皮尔 曼系数均小于 0.3,说明相关性不显著。另外,受教育情况与去年平均每月总收入相关系数为 0.45,说明置信度(双测)为 0.05 时这两个变量有一定正向相关性,与健康状况相关系数为-0.4, 说明置信度(双测)为 0.05 时有一
10、定负向相关性。然后,对上述变量再做线性回 归分析, 对结果进行比较。操作:分析回归线性模型汇总模型 R R 方 调整 R 方 标准 估计的误差1 .175a .031 -.006 7.94888a. 预测变量: (常量), 健康状况, 职位, 去年平均每月总收入, 性别, 自己的受教育情况。系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 48.720 3.400 14.328 0.000性别 -.119 1.433 -.007 -.083 0.934自己的受教育情况 .334 .286 .113 1.167 0.245去年平均每月总收入 -3.999E-5 .001 -.005 -.053 0.958职位 .024 .471 .005 .051 0.9591健康状况 -1.594 1.101 -.129 -1.448 0.150a. 因变量: 综合因子得分通过观察调整后的判定系数-0.006,拟合优度很低,被解释的变量很少。5 个变量的显著度都远远大于 0.05,表明变量间线性关系的不 显著。