1、SPSS软 件 进 行 主 成 分 分 析 的 应 用 例 子2002 年 16 家 上 市 公 司 4 项 指 标 的 数 据 5见 表 2, 定 量 综 合 赢 利 能 力 分析 如 下 : 表 2 2002 年 16 家 上 市 公 司 4 项 指 标 的 数 据公司 销售净利率(X 1)资产净利率(X 2)净资产收益率(X 3)销售毛利率(X 4)歌华有线五粮液 用友软件太太药业浙江阳光烟台万华方正科技红河光明贵州茅台中铁二局红星发展伊利股份青岛海尔湖北宜化雅戈尔 福建南纸43.3117.1121.1129.5511.0017.632.7329.1120.293.9922.654.43
2、5.407.0619.827.267.3912.136.038.628.4113.864.225.449.484.6411.137.308.902.7910.532.998.7317.297.0010.1311.8315.4117.166.0912.979.3514.314.3612.535.2418.556.9954.8944.2589.377325.2236.449.9656.2682.2313.0450.5129.0465.519.7942.0422.721. 主 成 分 分 析 的 做 法第 一 , 将 EXCEL 中 的 原 始 数 据 导 入 到 SPSS 软 件 中 ;注 意 :
3、导 入 Spss 的 数 据 不 能 出 现 空 缺 的 现 象 , 如 出 现 可 用 0 补 齐 。第 二 , 对 四 个 指 标 进 行 标 准 化 处 理 ;【 1】 “分 析 ”|“描 述 统 计 ”|“描 述 ”。【 2】 弹 出 “描 述 统 计 ”对 话 框 , 首 先 将 准 备 标 准 化 的 变 量 移 入 变 量 组中 , 此 时 , 最 重 要 的 一 步 就 是 勾 选 “将 标 准 化 得 分 另 存 为 变 量 ”, 最 后 点击 确 定 。【 3】 返 回 SPSS 的 “数 据 视 图 ”, 此 时 就 可 以 看 到 新 增 了 标 准 化 后 数 据的
4、字 段 。所 做 工 作 :a. 原 始 数 据 的 标 准 化 处 理数 据 标 准 化 主 要 功 能 就 是 消 除 变 量 间 的 量 纲 关 系 , 从 而 使 数 据 具 有 可 比 性 , 可 以 举 个 简 单 的 例 子 ,一 个 百 分 制 的 变 量 与 一 个 5 分 值 的 变 量 在 一 起 怎 么 比 较 ? 只 有 通 过 数 据 标 准 化 , 都 把 它 们 标 准 到 同一 个 标 准 时 才 具 有 可 比 性 , 一 般 标 准 化 采 用 的 是 Z 标 准 化 , 即 均 值 为 0, 方 差 为 1, 当 然 也 有 其 他标 准 化 , 比 如
5、 0-1 标 准 化 等 等 , 可 根 据 自 己 的 研 究 目 的 进 行 选 择 , 这 里 介 绍 怎 么 进 行 数 据 的 Z标 准 化 。所 的 结 论 :标 准 化 后 的 所 有 指 标 数 据 。注 意 :SPSS 在 调 用 Factor Analyze 过 程 进 行 分 析 时 , SPSS 会 自 动 对 原 始 数 据 进 行 标 准 化 处 理 , 所 以 在 得 到 计 算 结 果 后 的 变 量 都 是 指 经 过 标 准 化 处 理 后 的 变 量 , 但 SPSS 并 不 直 接 给 出 标 准 化 后的 数 据 , 如 需 要 得 到 标 准 化 数
6、 据 , 则 需 调 用 Descriptives 过 程 进 行 计 算 。第 三 , 并 把 标 准 化 后 的 数 据 保 存 在 数 据 编 辑 窗 口 中 然 后 利 用 SPSS 的factor 过 程 对 数 据 进 行 因 子 分 析 ( 指 标 之 间 的 相 关 性 判 定 略 ) 。【 1】 “分 析 ”|“降 维 ”|“因 子 分 析 ”选 项 卡 , 将 要 进 行 分 析 的 变 量选 入 “变 量 ”列 表 ;【 2】 设 置 “描 述 ”, 勾 选 “原 始 分 析 结 果 ”和 “KMO 与 Bartlett 球 形度 检 验 ”复 选 框 ;【 3】 设 置
7、 “抽 取 ”, 勾 选 “碎 石 图 ”复 选 框 ;【 4】 设 置 “旋 转 ”, 勾 选 “最 大 方 差 法 ”复 选 框 ;【 5】 设 置 “得 分 ”, 勾 选 “保 存 为 变 量 ”和 “因 子 得 分 系 数 ”复 选 框 ;【 6】 查 看 分 析 结 果 。所 做 工 作 :a.查 看 KMO 和 Bartlett 的 检 验KMO 值 接 近 1.KMO 值 越 接 近 于 1,意 味 着 变 量 间 的 相 关 性 越 强 , 原 有 变 量 越 适 合 作 因 子 分 析 ;Bartlett 球 度 度 检 验 的 Sig 值 越 小 于 显 著 水 平 0.0
8、5, 越 说 明 变 量 之 间 存 在 相 关 关 系 。所 的 结 论 :符 合 因 子 分 析 的 条 件 , 可 以 进 行 因 子 分 析 , 并 进 一 步 完 成 主 成 分 分 析 。注 意 :1.KMO( Kaiser-Meyer-Olkin)KMO 统 计 量 是 取 值 在 0 和 1 之 间 。 当 所 有 变 量 间 的 简 单 相 关 系 数 平 方 和 远 远 大 于 偏 相 关 系 数 平 方和 时 , KMO 值 接 近 1.KMO 值 越 接 近 于 1,意 味 着 变 量 间 的 相 关 性 越 强 , 原 有 变 量 越 适 合 作 因 子 分 析 ;当
9、 所 有 变 量 间 的 简 单 相 关 系 数 平 方 和 接 近 0 时 , KMO 值 接 近 0.KMO 值 越 接 近 于 0,意 味 着 变 量 间 的相 关 性 越 弱 , 原 有 变 量 越 不 适 合 作 因 子 分 析 。Kaiser 给 出 了 常 用 的 kmo 度 量 标 准 : 0.9 以 上 表 示 非 常 适 合 ; 0.8 表 示 适 合 ; 0.7 表 示 一 般 ;0.6 表 示 不 太 适 合 ; 0.5 以 下 表 示 极 不 适 合 。2.Bartlett 球 度 检 验 :巴 特 利 特 球 度 检 验 的 统 计 量 是 根 据 相 关 系 数
10、矩 阵 的 行 列 式 得 到 的 , 如 果 该 值 较 大 , 且 其 对 应 的 相伴 概 率 值 小 于 用 户 心 中 的 显 著 性 水 平 , 那 么 应 该 拒 绝 零 假 设 , 认 为 相 关 系 数 矩 阵 不 可 能 是 单 位 阵 , 即原 始 变 量 之 间 存 在 相 关 性 , 适 合 于 做 主 成 份 分 析 ; 相 反 , 如 果 该 统 计 量 比 较 小 , 且 其 相 对 应 的 相 伴 概率 大 于 显 著 性 水 平 , 则 不 能 拒 绝 零 假 设 , 认 为 相 关 系 数 矩 阵 可 能 是 单 位 阵 , 不 宜 于 做 因 子 分 析
11、 。Bartlett 球 度 检 验 的 原 假 设 为 相 关 系 数 矩 阵 为 单 位 矩 阵 , Sig 值 为 0.001 小 于 显 著 水 平0.05, 因 此 拒 绝 原 假 设 , 说 明 变 量 之 间 存 在 相 关 关 系 , 适 合 做 因 子 分 析 。所 做 工 作 :b. 全 部 解 释 方 差 或 者 解 释 的 总 方 差 (Total Variance Explained) 初 始 特 征 根 ( Initial Eigenvalues) 大 于 1, 并 且 累 计 百 分 比 达 到 80%85%以 上 。查 看 相 关 系 数 矩 阵 的 特 征 根
12、 及 方 差 贡 献 率 见 表 3, 由 于 前 2 个 主 成 分 贡 献 率 85%、 结 合 表 4中 变 量 不 出 现 丢 失 , 所 以 提 取 的 主 成 分 个 数 m=2。所 的 结 论 :初 始 特 征 根 : 1=1.897 2=1.550主 成 分 贡 献 率 : r1=0.47429 r2=0.38740注 意 :主 成 分 的 数 目 可 以 根 据 相 关 系 数 矩 阵 的 特 征 根 来 判 定 , 如 前 所 说 , 相 关 系 数 矩 阵 的 特 征 根 刚 好 等于 主 成 分 的 方 差 , 而 方 差 是 变 量 数 据 蕴 涵 信 息 的 重 要
13、 判 据 之 一 。 根 据 值 决 定 主 成 分 数 目 的 准 则有 三 :1.只 取 1 的 特 征 根 对 应 的 主 成 分从 Total Variance Explained 表 中 可 见 , 第 一 、 第 二 和 第 三 个 主 成 分 对 应 的 值 都 大 于1, 这 意 味 着 这 三 个 主 成 分 得 分 的 方 差 都 大 于 1。 本 例 正 是 根 据 这 条 准 则 提 取 主 成 分 的 。2.累 计 百 分 比 达 到 80%85%以 上 的 值 对 应 的 主 成 分在 Total Variance Explained 表 可 以 看 出 , 前 三
14、 个 主 成 分 对 应 的 值 累 计 百 分 比 达 到89.584%, 这 暗 示 只 要 选 取 三 个 主 成 分 , 信 息 量 就 够 了 。3.根 据 特 征 根 变 化 的 突 变 点 决 定 主 成 分 的 数 量从 特 征 根 分 布 的 折 线 图 ( Scree Plot) 上 可 以 看 到 , 第 4 个 值 是 一 个 明 显 的 折 点 , 这 暗 示选 取 的 主 成 分 数 目 应 有 p 4。 那 么 , 究 竟 是 3 个 还 是 4 个 呢 ? 根 据 前 面 两 条 准 则 , 选 3 个 大 致 合适 ( 但 小 有 问 题 ) 。第 四 , 计
15、 算 特 征 向 量 矩 阵 ( 主 成 分 表 达 式 的 系 数 )【 1】 将初始因子载荷矩阵中的两列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为变量 V1、V2);F1=V1/SQR( 1)【 2】 然后利用“转换”|“计算变量”, 打开“计算变量”对话框,在“目标变量”文本框中输入“F 1”,然后在数字表达式中输入“V 1/SQR( 1)”注: 1=1.897, 即可得到特征向量 F1;【 3】 然后利用“转换”|“计算变量”, 打开“计算变量”对话框,在“目标变量”文本框中输入“F 2”,然后在数字表达式中输入“V 2/SQR( 2)”注: 1=1.550, 即可得到特征
16、向量 F2;【 4】 最 后 得 到 特 征 向 量 矩 阵 ( 主 成 分 表 达 式 的 系 数 ) 。所 做 工 作 :a. 成 分 矩 阵 或 者 初 始 因 子 载 荷 矩 阵 ( Component Matrix)初 始 因 子 载 荷 矩 阵 见 上 图 , 通 过 初 始 因 子 载 荷 矩 阵 还 不 能 得 出 主 成 分 的 表 达 式 , 还 需 要 把 初始 因 子 载 荷 矩 阵 中 的 每 列 的 系 数 ( 主 成 分 的 载 荷 ) 除 以 其 相 应 主 成 分 的 特 征 根 的 平 方 根 后 才 能 得到 主 成 分 系 数 向 量 ( 主 成 分 的
17、 得 出 系 数 ) ;所 的 结 论 :1.用 于 计 算 主 成 分 表 达 式 系 数 的 初 始 因 子 载 荷 矩 阵 中 每 个 指 标 的 载 荷 。2.计 算 后 , 得 到 的 主 成 分 表 达 式 的 系 数 矩 阵 。注 意 :1.主 成 分 表 达 式 的 系 数提 取 出 来 的 全 部 主 成 分 可 以 基 本 反 映 全 部 指 标 的 信 息 ,但 这 些 新 变 量 ( 主 成 分 ) 的 表 达 却 不 能从 输 出 窗 口 中 直 接 得 到 ,即 : 主 成 分 中 每 个 指 标 所 对 应 的 系 数 不 是 初 始 因 子 载 荷 矩 阵 中
18、的 对 应 指 标的 载 荷 , 因 为 “Component Matrix”是 指 初 始 因 子 载 荷 矩 阵 , 每 一 个 载 荷 量 表 示 主 成 分 与 对 应 变 量的 相 关 系 数 。2.主 成 分 表 达 式 系 数 的 计 算 方 法初 始 因 子 载 荷 矩 阵 或 主 成 分 载 荷 矩 阵 (Component Matrix)中 的 数 据 除 以 主 成 分 相 对 应 的 特 征根 ( 或 特 征 值 ) 开 平 方 根 便 得 到 两 个 主 成 分 中 每 个 指 标 所 对 应 的 系 数 。F1=V1/SQR( 1)3.主 成 分 的 指 标 划 分
19、 与 命 名初 始 因 子 载 荷 矩 阵 或 主 成 分 载 荷 矩 阵 (Component Matrix)中 每 列 表 示 相 应 主 成 分 与 对 应 变 量 的相 关 系 数 , 每 个 主 成 分 所 反 映 的 原 始 指 标 各 有 不 同 , 为 进 一 步 明 确 每 个 主 成 分 侧 重 反 应 的 具 体 原 始指 标 , 需 要 对 原 始 指 标 在 每 个 主 成 分 上 的 载 荷 进 行 比 较 , 其 中 载 荷 越 大 , 其 对 应 的 主 成 分 反 映 该 原始 指 标 的 信 息 量 越 大 , 反 之 亦 然 ; 如 果 某 一 原 始 指
20、 标 在 几 个 主 成 分 的 载 荷 绝 对 值 不 相 上 下 , 归 类比 较 含 混 , 导 致 主 成 分 的 原 始 指 标 划 分 不 清 。 说 明 有 必 要 作 进 一 步 的 因 子 分 析 。从 Component Matrix 即 主 成 分 载 荷 表 中 可 以 看 出 , 哪 一 原 始 指 标 在 哪 一 主 成 分 上 载 荷 绝 对 值较 大 , 亦 即 与 该 主 成 分 的 相 关 系 数 较 高 【 注 : 相 关 分 为 正 负 相 关 】 。第 五 , 计 算 主 成 分 得 分 矩 阵 ( 主 成 分 得 分 )【 1】 将得到的特征向量与标
21、准化后的数据相乘, 然后就可以得出主成分函 数 的 表 达 式 ;Z1= F11*zX1+ F12*zX2+ F13*zX3+ F14*zX4Z2= F21*zX1+ F22*zX2+ F23*zX3+ F24*zX4 ( 其 中 , zXi为 标 准 化 后 的 数 据 )【 2】 然后利用“转换”|“计算变量”, 打开“计算变量”对话框,在“目标变量”文本框中输入“Z 1”,然后在数字表达式中输入“0.531* Z (销售净利率) +0.594*Z (资产净利率 )+0.261*Z (净资产收益率 )+0.546*Z (销售毛利率)” 注:F1=0.531,0.594,0.261,0.54
22、6, 即可得到特征向量 Z1;【 3】 同理注:F 2=-0.412, 0.404, 0.720, -0.383, 可得到特征向量 Z2;【 4】 求 出 16 家 上 市 公 司 的 主 成 分 值 。所 做 工 作 :a. 对 原 始 数 据 标 准 化 后 的 数 据标 准 化 后 的 数 据 ;所 的 结 论 :1.用 于 计 算 主 成 分 表 达 式 系 数 的 初 始 因 子 载 荷 矩 阵 中 每 个 指 标 的 载 荷 。注 意 :1.特 征 向 量 矩 阵 载 荷 的 用 运Z1= F11*zX1+ F12*zX2+ F13*zX3+ F14*zX4Z2= F21*zX1+
23、 F22*zX2+ F23*zX3+ F24*zX4 ( 其 中 , zXi为 标 准 化 后 的 数 据 )第 六 , 最 后 利 用 主 成 分 函 数 、 综 合 主 成 分 公 式 :【 1】 将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分表 达 式 ;Z=r1*Z1+r2*Z2【 2】 然后利用“转换”|“计算变量”, 打开“计算变量”对话框,在“目标变量”文本框中输入“Z”,然后在数字表达式中输入“r 1*Z1+r2*Z2” 注:r 1=0.47429, r2=0.3874, 即可得到综合主成分;【 3】 综 合 主 成 分 ( 赢 利 能 力 ) 值 。所 做 工
24、作 :a. 对 原 始 数 据 标 准 化 后 的 数 据标 准 化 后 的 数 据 ;所 的 结 论 :1.用 于 计 算 主 成 分 表 达 式 系 数 的 初 始 因 子 载 荷 矩 阵 中 每 个 指 标 的 载 荷 。注 意 :1.综 合 主 成 分 得 分 的 计 算 方 法Z=r1*Z1+r2*Z2( Z:综 合 主 成 分 得 分 ; ri:主 成 分 贡 献 率 ; Zi:主 成 分 i 得 分 )表 5. 主 成 分 、 综 合 主 成 分 ( 赢 利 能 力 ) 值公司 Z1 Z2 Z烟台万华五粮液雅戈尔红星发展贵州茅台青岛海尔太太药业伊利股份浙江阳光歌华有线方正科技用友软件红河光明中铁二局福建南纸湖北宜化1.211.161.031.201.410.211.31-0.83-0.561.23-1.720.620.09-2.00-2.07-2.291.461.461.410.53-0.310.35-1.081.060.60-1.691.52-1.89-1.880.15-0.72-0.991.141.121.030.770.550.240.200.02-0.03-0.07-0.23-0.44-0.69-0.89-1.26-1.47