1、典 型 相 关 分 析 的 基 本 思 想 和 方 法 步 骤临 沂 师 范 学 院 王 发 友摘 要 典 型 性 相 关 分 析 在 相 关 分 析 中 有 其 独 特 的 作 用 , 在 实 际 应 用 中 十 分 广 泛 , 本 文 介 绍 了 典 型 相 关 分 析 的 基 本 思想 和 方 法 步 骤 。关 键 词 相 关 分 析 典 型 相 关 分 析 典 型 变 量1、 典 型 相 关 分 析 的 基 本 思 想典 型 相 关 分 析 是 主 成 分 分 析 和 因 子 分 析 的 进 一 步 发 展 , 是研 究 两 组 变 量 间 的 相 互 依 赖 关 系 , 把 两 组
2、变 量 之 间 的 相 互 关 系变 为 研 究 两 个 新 的 变 量 之 间 的 相 关 , 而 且 又 不 抛 弃 原 来 变 量 的信 息 , 这 两 个 新 的 变 量 分 别 由 第 一 组 变 量 和 第 二 组 变 量 的 线 性组 合 构 成 , 并 且 两 组 变 量 的 个 数 可 以 是 不 同 的 , 两 组 变 量 所 代 表的 内 容 也 可 以 是 不 同 的 。 因 此 , 典 型 相 关 分 析 在 实 际 问 题 中 应 用是 十 分 广 泛 的 。典 型 性 相 关 分 析 与 简 单 相 关 分 析 相 比 , 简 单 相 关 分 析 有 时可 能 受
3、 某 些 因 素 的 影 响 , 反 映 的 是 表 面 的 而 非 本 质 的 联 系 , 甚 至有 时 是 假 象 。 所 以 , 典 型 性 相 关 分 析 在 相 关 分 析 中 有 其 独 特 的 作用 。现 在 要 研 究 两 组 变 量 之 间 的 相 关 性 , 1936 年 , Ho telling 提出 了 典 型 相 关 分 析 。 基 于 复 相 关 系 数 的 定 义 方 法 , 这 里 自 然 考 虑到 两 组 变 量 的 线 性 组 合 , 并 研 究 它 们 之 间 的 相 关 系 数 p (u, v)。在 所 有 的 线 性 组 合 中 , 找 一 对 相 关
4、 系 数 最 大 的 线 性 组 合 , 用 这 个组 合 的 单 相 关 系 数 来 表 示 两 组 变 量 的 相 关 性 , 叫 做 两 组 变 量 的典 型 相 关 系 数 , 而 这 两 个 线 性 组 合 叫 做 一 对 典 型 变 量 。在 两 组 多 变 量 的 情 形 下 , 需 要 用 若 干 对 典 型 变 量 才 能 完 全反 映 出 它 们 之 间 的 相 关 性 。 下 一 步 , 再 在 两 组 变 量 的 与 u1, , v1不 相 关 的 线 性 组 合 中 , 找 一 对 相 关 系 数 最 大 的 线 性 组 合 , 它 就 是第 二 对 典 型 变 量
5、, 而 且 p (u2, v2) 就 是 第 二 个 典 型 相 关 系 数 。 这样 下 去 , 可 以 得 到 若 干 对 典 型 变 量 , 从 而 提 取 出 两 组 变 量 间 的 全部 信 息 。典 型 相 关 分 析 的 实 质 就 是 在 两 组 随 机 变 量 中 选 取 若 干 个 有代 表 性 的 综 合 指 标 , 用 这 些 指 标 的 相 关 关 系 来 表 示 原 来 的 两 组变 量 的 相 关 关 系 。 这 在 两 组 变 量 的 相 关 性 分 析 中 , 可 以 起 到 合 理的 简 化 变 量 的 作 用 ; 当 典 型 相 关 系 数 足 够 大 时
6、 , 可 以 像 回 归 分 析那 样 , 由 - 组 变 量 的 数 值 预 测 另 一 组 变 量 的 线 性 组 合 的 数 值 。2、 典 型 相 关 分 析 的 方 法 步 骤典 型 相 关 分 析 的 步 骤 有 : (1)确 定 典 型 相 关 分 析 的 目 标 ; (2)设 计 典 型 相 关 分 析 ; (3)检 验 典 型 相 关 分 析 的 基 本 假 设 ; (4) 估 计典 型 模 型 , 评 价 模 型 拟 合 程 度 ; (5)解 释 典 型 变 量 ; (6) 验 证 模 型 ,共 六 步 。2. 1 确 定 典 型 相 关 分 析 的 目 标典 型 相 关
7、分 析 所 适 用 的 数 据 是 两 组 变 量 。 假 定 每 组 变 量 都能 赋 予 一 定 的 理 论 意 义 , 通 常 一 组 可 以 定 义 为 自 变 量 , 另 一 组 可以 定 义 为 因 变 量 . 典 型 相 关 分 析 可 以 达 到 以 下 目 标 :(1) 确 定 两 组 变 量 相 互 独 立 , 或 者 相 反 , 确 定 两 组 变 量 间 存在 关 系 的 大 小 。(2)为 每 组 变 量 推 导 出 一 组 权 重 , 使 得 每 组 变 量 的 线 性 组 合达 到 最 大 程 度 相 关 。 最 大 化 余 下 的 相 关 关 系 的 其 他 的
8、 线 性 函 数是 与 前 面 的 线 性 函 数 独 立 的 。(3)解 释 自 变 量 与 因 变 量 组 中 存 在 的 相 关 关 系 , 通 常 是 通 过测 量 每 个 变 量 对 典 型 函 数 的 相 对 贡 献 来 衡 量 。2. 2 设 计 典 型 相 关 分 析典 型 相 关 分 析 作 为 一 种 多 元 分 析 方 法 , 与 其 他 的 多 元 分 析技 术 有 共 同 的 基 本 要 求 。 其 他 方 法 (尤 其 是 多 元 回 归 、 判 别 分 析和 方 差 分 析 )所 讨 论 的 测 量 误 差 的 影 响 、 变 量 类 型 及 变 换 也 与 典型
9、 相 关 分 析 有 很 大 关 系 。样 本 大 小 的 影 响 和 每 个 变 量 需 要 足 够 的 观 测 都 是 典 型 相 关分 析 经 常 遇 到 的 。 研 究 者 容 易 使 自 变 量 组 和 因 变 量 组 包 含 很 多的 变 量 , 而 没 有 认 识 到 样 本 量 的 含 义 。 小 的 样 本 不 能 很 好 地 代 表相 关 关 系 , 这 样 掩 盖 了 有 意 义 的 相 关 关 系 。 建 议 研 究 者 至 少 保 持每 个 变 量 10 个 观 测 , 以 避 免 数 据 的 “ 过 度 拟 合 ” 。2. 3 典 型 相 关 分 析 的 基 本 假
10、 定线 性 假 定 影 响 典 型 相 关 分 析 的 两 个 方 面 。 首 先 , 任 意 两 个 变量 间 的 相 关 系 数 是 基 于 线 性 关 系 的 。 如 果 这 个 关 系 不 是 线 性 的 ,一 个 或 者 两 个 变 量 需 要 变 换 。 其 次 , 典 型 相 关 是 变 量 间 的 相 关 。如 果 关 系 不 是 线 性 的 , 典 型 相 关 分 析 将 不 能 测 量 到 这 种 关 系 。2. 4 推 导 典 型 函 数 、 评 价 整 体 拟 合 程 度每 个 典 型 函 数 都 包 括 一 对 变 量 , 通 常 一 个 代 表 自 变 量 , 另
11、一个 代 表 因 变 量 。 可 从 变 量 组 中 提 取 的 典 型 变 量 (函 数 )的 最 大 数目 等 于 最 小 数 据 组 中 的 变 量 数 目 。 比 如 , 一 个 研 究 问 题 包 含 5 个自 变 量 和 3 个 因 变 量 、 可 提 取 的 典 型 函 数 的 最 大 数 目 是 3。2. 4. 1 推 导 典 型 函 数典 型 相 关 函 数 的 推 导 类 似 于 没 有 旋 转 的 因 子 分 析 的 过 程 。典 型 相 关 分 析 集 中 说 明 两 组 变 量 间 的 最 大 相 互 关 系 。 第 一 对 典型 变 量 在 两 组 变 量 中 有
12、最 大 的 相 互 关 系 。 第 二 对 典 型 变 量 得 到第 一 对 典 型 变 量 没 有 解 释 的 两 组 变 量 间 的 最 大 相 互 关 系 。 简 言之 , 随 着 典 型 变 量 的 提 取 , 接 下 来 的 典 型 变 量 是 基 于 剩 余 残 差 ,并 且 典 型 相 关 系 数 会 越 来 越 少 。 每 对 典 型 变 量 是 正 交 的 , 并 且 与其 它 变 量 是 独 立 的 。2. 4. 2 典 型 函 数 的 解 释一 般 来 讲 , 实 际 提 取 的 典 型 函 数 都 是 典 型 相 关 系 数 在 某 个水 平 (比 如 0. 05)上
13、显 著 的 函 数 。 对 显 著 的 典 型 变 量 的 解 释 是 基于 这 样 的 假 设 , 即 认 为 相 关 的 函 数 中 , 每 组 中 的 变 量 都 对 共 同 方差 有 较 大 贡 献 。 海 尔 (H air, 1984)等 人 推 荐 三 个 准 则 结 合 使 用 来解 释 典 型 函 数 。 这 三 个 准 则 是 : (1)函 数 的 统 计 显 著 性 水 平 ; (2)典 型 相 关 的 大 小 ; (3)两 个 数 据 集 中 方 差 解 释 的 冗 余 测 量 。2. 5 解 释 典 型 变 量即 使 典 型 相 关 系 数 在 统 计 上 是 显 著
14、的 , 典 型 根 和 冗 余 系 数大 小 也 是 可 接 受 的 , 研 究 者 仍 需 对 结 果 做 大 量 的 解 释 。 这 些 解 释包 括 研 究 典 型 函 数 中 原 始 变 量 的 相 对 重 要 性 。 主 要 使 用 以 下 三种 方 法 : (1) 典 型 权 重 (标 准 相 关 系 数 ); (2) 典 型 载 荷 (结 构 系数 ); (3)典 型 交 叉 载 荷 (交 叉 结 构 系 数 )。2. 5. 1 典 型 权 重传 统 的 解 释 典 型 函 数 的 方 法 包 括 观 察 每 个 原 始 变 量 在 它 的典 型 变 量 中 的 典 型 权 重
15、, 即 标 准 化 相 关 系 数 (StandardizedCanonical Coefficients)的 符 号 和 大 小 。 有 较 大 的 典 型 权 重 , 则 说明 原 始 变 量 对 它 的 典 型 变 量 贡 献 较 大 , 反 之 则 相 反 。 原 始 变 量 的典 型 权 重 有 相 反 的 符 号 说 明 变 量 之 间 存 在 一 种 反 面 关 系 , 反 之则 有 正 面 关 系 。 但 是 这 种 解 释 遭 到 了 很 多 批 评 。 这 些 问 题 说 明 在解 释 典 型 相 关 的 时 候 应 慎 用 典 型 权 重 。2. 5. 2 典 型 载 荷
16、由 于 典 型 权 重 的 缺 陷 , 典 型 载 荷 逐 步 成 为 解 释 典 型 相 关 分析 结 果 的 基 础 。 典 型 载 荷 分 析 , 即 典 型 结 构 分 析 ( (CanonicalStructure A nalysis) , 是 原 始 变 量 (自 变 量 或 者 因 变 量 ) 与 它 的 典型 变 量 间 的 简 单 线 性 相 关 系 数 。 典 型 载 荷 反 映 原 始 变 量 与 典 型变 量 的 共 同 方 差 , 它 的 解 释 类 似 于 因 子 载 荷 , 就 是 每 个 原 始 变 量对 典 型 函 数 的 相 对 贡 献 。2. 5. 3 典
17、 型 交 叉 载 荷它 的 提 出 是 作 为 典 型 载 荷 的 替 代 , 也 属 于 典 型 结 构 分 析 。 计算 典 型 交 叉 载 荷 包 括 使 每 个 原 始 因 变 量 与 自 变 量 典 型 变 量 直 接相 关 , 反 之 亦 然 。 交 叉 载 荷 提 供 了 一 个 更 直 接 地 测 量 因 变 量 组 与自 变 量 组 之 间 的 关 系 的 指 标 。2. 6 验 证 与 诊 断与 其 它 多 元 分 析 方 法 一 样 , 典 型 相 关 分 析 的 结 果 应 该 验 证 ,以 保 证 结 果 不 是 只 适 用 于 样 本 , 而 是 适 用 于 整 体
18、 。 最 直 接 的 办 法是 构 造 两 个 样 本 , 在 每 个 样 本 上 分 别 做 分 析 。 这 样 结 果 可 以 比 较典 型 函 数 的 相 似 性 、 典 型 载 荷 等 。 如 果 存 在 显 著 性 差 别 , 研 究 者应 该 深 入 分 析 , 保 证 结 果 是 总 体 的 代 表 , 而 不 只 是 单 个 样 本 的 反映 。另 一 种 方 法 是 测 量 结 果 对 于 剔 除 某 一 方 因 变 量 或 自 变 量 的灵 敏 度 , 保 证 典 型 权 重 和 典 型 载 荷 的 稳 定 性 。另 外 , 还 必 须 看 到 典 型 相 关 分 析 的 局 限 性 。参 考 文 献1 陆 璇 译 . 实 用 多 元 统 计 分 析 清 华 大 学 出 版 社 2003. 62 张 尧 庭 院 . 多 元 统 计 分 析 引 论 科 学 出 版 社 2003. 93 高 惠 璇 . 应 用 多 元 统 计 分 析 北 京 大 学 出 版 社 2005. 1274科 技 信 息 人 文 社 科