1、统计分析与 SPSS 的应用(第五版) (薛薇)课后练习答案第 11 章 SPSS 的因子分析1、简述因子分析的主要步骤是什么?因子分析的主要步骤:一、前提条件:要求原有变量之间存在较强的相关关系。二、因子提取。三、使因子具有命名解释性:使提取出的因子实际含义清晰。四、计算样本的因子得分。2、对“基本建设投资分析.sav”数据进行因子分析。要求:1)利用主成分方法,以特征根大于 1 为原则提取因子变量,并从变量共同度角度评价因子分析的效果。如果因子分析效果不理想,再重新指定因子个数并进行分析,对两次分析结果进行对比。2) 对比未旋转的因子载荷矩阵和利用方差极大法进行旋转的因子载荷矩阵,直观理解
2、因子旋转对因子命名可解释性的作用。“基本建设投资分析”因子分析步骤:分析降维 因子分析导入全部变量到变量框中详细设置描述、抽取的设置如下:旋转、得分、选项的设置如下:(1)相关系数矩阵国家预算内资金(1995年、亿元)国内贷款 利用外资 自筹资金 其他投资国家预算内资金(1995年、亿元) 1.000 .458 .229 .331 .211国内贷款 .458 1.000 .746 .744 .686利用外资 .229 .746 1.000 .864 .776自筹资金 .331 .744 .864 1.000 .928相关系数其他投资 .211 .686 .776 .928 1.000表一是原有
3、变量的相关系数矩阵。由表可知,一些变量的相关系数都较高,呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。KMO 和巴特利特检验KMO 取样适切性量数。 .706上次读取的卡方 119.614自由度 10Bartlett 的球形度检验显著性 .000由表二可知,巴特利特球度检验统计量的观测值为 119.614,相应的概率 P-值接近 0.如果显著性水平为 0.05,由于概率 P-值小于显著性水平 ,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异,原有变量适合做因子分析。同时,KMO 值为 0.706,根据KMO 度量标准可知原有变量可以进行因子分析。公因子方差初始值 提取国家预算内
4、资金(1995年、亿元) 1.000 .196国内贷款 1.000 .769利用外资 1.000 .820自筹资金 1.000 .920其他投资 1.000 .821提取方法:主成份分析。由表三可知,利用外资、自筹资金、其他投资等变量的绝大部分信息(大于 80%)可被因子解释,这些变量的信息丢失较少。但国家预算内资金这个变量的信息丢失较为严重(近 80%) 。总的来说,本次因子提取的总体效果还不错。为了达到更好的效果,可以重新指定提取特征值的标准,指定提取 2 个因子。补充说明如下:故由表四可知,第 1 个因子的特征值很高,对解释原有变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量
5、的贡献很小,可以忽略,因此选取两个因子是合适的。在上述“抽取”选项中,选择“因子的固定数量(N ) ”并修改其值为 2,其他不变。表五:重新提取因子后的公因子方差表公因子方差初始值 提取国家预算内资金(1995年、亿元) 1.000 .975国内贷款 1.000 .795利用外资 1.000 .860自筹资金 1.000 .937其他投资 1.000 .882提取方法:主成份分析。表五是指定提取 2 个特征值下的变量共同度数据。由第二列数据可知,此时所有变量的共同度均较高,各个变量的信息丢失都较少。因此,本次因子提取的总体效果比较理想。总方差解释初始特征值 提取载荷平方和组件 总计 方差百分比
6、 累积 % 总计 方差百分比 累积 %1 3.526 70.518 70.518 3.526 70.518 70.5182 .923 18.452 88.9703 .306 6.112 95.0824 .200 3.993 99.0755 .046 .925 100.000提取方法:主成份分析。总方差解释初始特征值 提取载荷平方和 旋转载荷平方和组件 总计 方差百分比 累积 % 总计 方差百分比 累积 % 总计 方差百分比 累积 %1 3.526 70.518 70.518 3.526 70.518 70.518 3.244 64.889 64.8892 .923 18.452 88.970
7、.923 18.452 88.970 1.204 24.081 88.9703 .306 6.112 95.0824 .200 3.993 99.0755 .046 .925 100.000提取方法:主成份分析。表六中,第一个因子的特征值为 3.526,解释原有 5 个变量总方差的 70.5%,累计方差贡献率为 70.5%;第二个因子的特征值为 0.923,解释原有 7 个变量总方差的 18%,累计方差贡献率为 88.97%.(2)成分矩阵 a组件1 2国家预算内资金(1995年、亿元) .443 .882国内贷款 .877 .160利用外资 .906 -.199自筹资金 .959 -.132
8、其他投资 .906 -.247提取方法:主成份分析。a. 已提取 2 个成分。表七显示了因子载荷矩阵。由表可知,自筹资金、其他投资、利用外资和国内贷款四个变量在第一个因子上的载荷都较高,意味着它们与第一个因子的相关程度高,第一个因子很重要;第二个因子除了与国家预算内资金相关程度较高外,与其他的原有变量相关性较小,对原有变量的解释作用不明显。下表采用方差极大法对因子载荷矩阵实行正交旋转以使因子具有命名解释性。指定按第一个因子载荷降序的顺序输出旋转后的因子载荷,并绘制旋转后的因子载荷图。旋转后的成分矩阵 a组件1 2国家预算内资金(1995年、亿元) .128 .979国内贷款 .775 .440
9、利用外资 .921 .110自筹资金 .949 .190其他投资 .937 .064提取方法:主成份分析。 旋转方法:Kaiser 标准化最大方差法。a. 旋转在 3 次迭代后已收敛。由表可知,自筹资金、其他投资和利用外资在第 1 个因子上有较高的载荷,第一个因子主要解释了这几个变量,可解释为外部投资;国内贷款和国家预算内资金在第 2 个因子上有较高的载荷,第二个因子主要解释了这几个变量,可解释为内部投资。与旋转前相比,因子含义较清晰。3、利用“消费结构.sav”数据进行因子分析的部分结果如下:成分矩阵 a组件1 2食品 .843 -.435衣着 .596 .687居住 .886 -.057家
10、庭设备用品及服务 .893 -.090医疗保健 .720 .478交通和通信 .898 -.329教育文化娱乐服务 .965 -.070杂项商品和服务 .894 .120提取方法:主成份分析。a. 已提取 2 个成分。旋转后的成分矩阵 a组件1 2食品 .945 .087衣着 .132 .899居住 .777 .429家庭设备用品及服务 .801 .405医疗保健 .349 .791交通和通信 .934 .206教育文化娱乐服务 .851 .460杂项商品和服务 .689 .583提取方法:主成份分析。 旋转方法:Kaiser 标准化最大方差法。a. 旋转在 3 次迭代后已收敛。(1)根据成分
11、矩阵计算各变量的变量共同度以及各因子变量的方差贡献,并以此评价本次因子分析的总体效果是否理想。(2)根据旋转成分矩阵说明两个变量的含义。“消费结构”因子分析(1)各变量共同度如下:食品的变量共同度为0.843 2+(-0.435 ) 2=0.8999,其他类似。衣着为0.827居住为0.788家庭设备用品及服务为0.806医疗保健为0.747交通和通信为0.915教育文化娱乐服务为0.936杂项商品和服务为0.814变量共同度刻画了因子全体对变量信息解释的程度。此题中大多数原有变量的变量共同度均较高(全部变量共同度都大于70%,大部分大于80%) ,说明提取的因子可以解释原有变量的大部分信息,
12、仅有较少的信息丢失,因子分析的效果较好。个因子变量的方差贡献如下:第一个因子的方差贡献为S 12=0.8432+0.5962+0.8862+=5.704第二个为1.029因子的方差贡献反映了因子对原有变量总方差的解释能力。由题中可知,第一个变量解释能力更强,更重要。(2)由旋转成分矩阵可知,食品、居住、家用设备用品及服务、交通和通信、教育文化娱乐服务以及杂项商品和服务在第1个因子上有较高的载荷,第1个因子主要解释了这几个变量,可解释为刚性消费需求;衣着、医疗保健这两个变量在第2个因子上有较高的载荷,第2个因子主要解释了这几个变量,可解释为弹性消费需求。因此消费结构可以分为刚性和弹性消费两个部分。