1、非 参 数 统 计 方 法 与 实 例在 统 计 学 中 , 最 基 本 的 概 念 是 总 体 、 样 本 、 随 机 变 量 、 分 布 、 估 计 和 假 设 检 验 等 , 其 中 很 大 一 部 分 食 与正 态 理 论 相 关 的 。 在 我 们 已 经 学 过 的 知 识 里 , 总 体 的 分 布 形 式 往 往 是 给 定 的 或 已 经 假 定 了 的 , 我 们 只 需 要 在总 体 分 布 已 知 的 基 础 上 对 参 数 进 行 估 值 或 者 进 行 检 验 。 但 是 实 际 上 , 对 总 体 的 分 布 的 假 定 并 不 是 能 随 便 做 出的 , 数
2、据 可 能 并 不 是 来 自 假 定 的 总 体 分 布 , 或 者 根 本 不 是 来 自 同 一 个 总 体 。 在 这 种 假 定 下 进 行 推 断 就 可 能 产生 错 误 的 结 论 。 于 是 , 人 们 希 望 能 在 不 假 定 总 体 分 布 的 情 况 下 , 尽 量 从 数 据 本 身 来 获 得 所 需 的 信 息 , 这 就是 非 参 数 统 计 的 宗 旨 。 在 统 计 学 的 方 法 中 , 参 数 方 法 与 非 参 数 方 法 没 有 谁 优 谁 劣 之 说 , 有 的 只 是 在 具 体 情 况下 , 谁 更 适 用 、 谁 更 准 确 完 整 表 示
3、 数 据 的 信 息 。 接 下 来 , 我 将 就 参 数 统 计 与 非 参 数 统 计 分 别 分 析 其 适 用 情形 与 优 缺 点 , 并 详 细 介 绍 几 种 非 参 数 统 计 的 方 法 并 有 案 例 分 析 。1、 参 数 统 计 与 非 参 数 统 计非 参 数 统 计 方 法 和 参 数 统 计 方 法 共 同 组 成 统 计 分 析 方 法 , 它 们 都 是 统 计 推 断 的 基 本 内 容 。 参 数 检 验 是在 总 体 分 布 形 式 已 知 的 情 况 下 , 对 总 体 分 布 的 参 数 如 均 值 、 方 差 等 进 行 推 断 的 方 法 。
4、但 是 , 在 数 据 分 析 过程 中 , 由 于 种 种 原 因 , 人 们 往 往 无 法 对 总 体 分 布 形 态 作 简 单 假 定 , 此 时 参 数 检 验 的 方 法 就 不 再 适 用 了 。 非参 数 检 验 正 是 一 类 基 于 这 种 考 虑 , 在 总 体 方 差 未 知 或 知 道 甚 少 的 情 况 下 , 利 用 样 本 数 据 对 总 体 分 布 形 态 等进 行 推 断 的 方 法 。 由 于 非 参 数 检 验 方 法 在 推 断 过 程 中 不 涉 及 有 关 总 体 分 布 的 参 数 , 因 而 得 名 为 “非 参 数 ”检 验 。就 上 文
5、我 们 可 以 看 出 , 参 数 统 计 和 非 参 数 统 计 分 别 针 对 不 同 的 数 据 来 使 用 。 参 数 统 计 方 法的 适 用 范 围 是 很 好 确 定 的 , 它 适 用 于 数 据 分 布 已 知 或 者 可 以 做 出 比 较 正 确 的 假 定 的 数 据 , 对 这些 数 据 进 行 检 验 、 估 计 , 得 出 数 据 总 体 的 均 值 、 方 差 等 参 数 来 描 述 数 据 特 征 。 这 样 的 数 据 一般 都 有 这 三 个 要 求 :1、 抽 样 总 体 为 正 态 分 布 或 近 似 正 态 分 布 ; 2、 各 抽 样 总 体 为
6、等 方 差 或 方 差齐 性 ; 3、 各 变 量 值 间 是 相 互 独 立 的 。而 非 参 数 统 计 , 顾 名 思 义 , 是 不 用 估 计 参 数 来 描 述 数 据 特 征 的 方 法 , 只 通 过 对 数 据 作 一些 诸 如 分 布 连 续 、 有 密 度 、 具 有 某 阶 矩 等 一 般 性 的 假 定 来 揭 示 数 据 特 征 , 这 也 就 赋 予 了 非 参数 统 计 方 法 特 别 的 适 用 数 据 范 围 , 一 般 总 结 为 以 下 四 种 : 1、 待 分 析 数 据 不 满 足 参 数 检 验 所 要求 的 假 定 , 因 而 无 法 应 用 参
7、 数 检 验 ; 2、 仅 由 一 些 等 级 构 成 的 数 据 , 不 能 应 用 参 数 检 验 。 例 如 ,在 一 些 经 济 数 据 中 , 通 常 是 将 一 个 特 征 数 据 分 级 而 不 是 采 用 具 体 数 据 , 这 样 的 数 据 时 没 办 法 做参 数 检 验 和 估 计 的 , 因 此 非 参 数 统 计 也 就 适 用 了 ; 3、 所 提 的 问 题 的 数 据 中 并 不 包 含 的 参 数 ,也 不 能 用 参 数 检 验 ; 4、 当 我 们 需 要 迅 速 得 出 结 果 时 , 也 可 以 不 用 参 数 统 计 方 法 而 用 非 参 数 统
8、计 方 法 来 达 到 目 的 。 因 为 一 般 说 来 , 非 参 数 统 计 方 法 所 要 求 的 计 算 与 参 数 统 计 方 法 相 比 , 完成 起 来 更 为 方 便 快 捷 , 因 此 这 种 情 况 下 采 用 非 参 数 统 计 是 一 个 正 确 的 选 择 。接 下 来 , 将 分 析 参 数 统 计 方 法 与 非 参 数 统 计 的 优 缺 点 并 进 行 比 较 。 一 般 来 说 , 它 们 两 者 的优 缺 点 是 相 对 的 。 非 参 数 统 计 与 参 数 统 计 相 比 具 有 很 多 优 点 , 比 如 说 : 1、 非 参 数 统 计 方 法
9、要求 的 假 定 条 件 比 较 少 , 因 而 它 的 适 用 范 围 比 较 广 泛 。 那 么 这 一 点 相 对 的 也 就 是 参 数 统 计 的 缺点 , 参 数 统 计 可 以 适 用 的 数 据 一 定 是 总 体 已 知 或 可 以 知 道 的 , 并 且 一 旦 需 要 计 算 统 计 量 就 意 味着 数 据 时 需 要 精 确 测 量 的 , 因 此 , 参 数 统 计 适 用 的 范 围 是 很 窄 的 ; 2、 多 数 非 参 数 统 计 方 法 要求 的 运 算 比 较 简 单 , 可 以 迅 速 完 成 计 算 取 得 结 果 , 因 而 比 较 节 约 时 间
10、 。 3、 大 多 数 非 参 数 统 计方 法 在 直 观 上 比 较 容 易 理 解 , 不 需 要 太 多 的 数 学 基 础 知 识 和 统 计 学 知 识 。 4、 大 多 数 非 参 数 统计 方 法 可 用 来 分 析 如 象 由 等 级 构 成 的 数 据 资 料 , 而 对 计 量 水 准 较 低 的 数 据 资 料 , 参 数 统 计 方 法却 不 适 用 。 当 然 , 非 参 数 统 计 方 法 也 有 缺 点 。 首 先 , 由 于 方 法 简 单 , 用 的 计 量 水 准 较 低 , 使用 非 参 数 统 计 方 法 时 就 不 如 参 数 统 计 方 法 敏 感
11、 , 可 能 准 确 度 上 会 有 偏 差 , 因 为 毕 竟 非 参 数 统计 方 法 只 使 用 了 样 本 的 信 息 , 而 未 使 用 总 体 信 息 。 这 就 是 说 , 在 给 定 的 显 著 性 水 平 下 进 行 检验 时 , 非 参 数 统 计 方 法 与 参 数 统 计 方 法 相 比 , 第 类 错 误 的 概 率 要 大 些 。 这 也 相 对 的 是 参数 统 计 方 法 的 优 点 , 一 旦 数 据 可 以 使 用 参 数 统 计 , 那 么 相 比 非 参 数 统 计 得 出 的 结 果 更 精 确 , 更有 效 。2、 非 参 数 统 计 方 法下 面
12、, 我 将 介 绍 非 参 数 统 计 方 法 , 主 要 是 介 绍 非 参 数 检 验 的 方 法 。 非 参 数 检 验 的 方 法 是非 常 多 的 , 有 针 对 独 立 样 本 的 检 验 , 也 有 针 对 配 对 样 本 的 检 验 ; 有 针 对 单 样 本 的 检 验 , 有 针 对两 个 样 本 的 检 验 , 也 有 针 对 多 样 本 的 检 验 。 我 选 取 了 两 种 比 较 常 用 的 检 验 方 法 , 即 针 对 两 配对 样 本 的 Wilcoxon 检 验 和 针 对 两 独 立 样 本 的 曼 -惠 特 尼 U 检 验 。2.1 两 配 对 样 本
13、的 Wilcoxon 检 验在 处 理 两 配 对 样 本 的 检 验 中 , 还 有 一 种 检 验 是 符 号 检 验 , 但 因 为 在 符 号 检 验 中 , 只 考 虑到 了 差 异 的 符 号 , 而 没 有 考 虑 到 数 据 包 含 的 信 息 , 因 此 在 符 号 检 验 的 基 础 上 选 取 考 虑 到 数 据 大小 的 Wilcoxon 秩 检 验 。 在 Wilcoxon 秩 检 验 中 , 它 把 观 测 值 和 零 假 设 的 中 心 位 置 之 差 的 绝 对 值的 秩 分 别 按 照 不 同 的 符 号 相 加 作 为 其 检 验 统 计 量 。 它 适 用
14、 于 t 检 验 中 的 成 对 比 较 , 但 并 不 要 求成 对 数 据 之 差 di 服 从 正 态 分 布 , 只 要 求 对 称 分 布 即 可 。 检 验 成 对 观 测 数 据 之 差 是 否 来 自 均 值为 0 的 总 体 ( 即 产 生 数 据 的 总 体 是 否 具 有 相 同 的 均 值 ) 。Wilcoxon 秩 检 验 与 符 号 检 验 相 比 优 点 更 多 , 它 在 符 号 检 验 利 用 了 观 测 值 和 零 假 设 的 中 心位 置 之 差 的 符 号 进 行 检 验 的 基 础 上 , 利 用 这 些 差 的 大 小 ( 体 现 于 差 的 绝 对
15、 值 大 小 ) 所 包 含 的信 息 来 进 行 检 验 。 这 样 在 符 号 检 验 中 利 用 每 个 观 测 值 点 相 应 的 正 号 或 负 号 仅 仅 代 表 了 该 点 在 中心 位 置 的 哪 一 边 的 基 础 上 , 用 绝 对 值 差 的 大 小 来 表 示 该 点 距 离 中 心 的 远 近 。 这 样 加 入 了 各 观测 值 距 离 中 心 远 近 的 信 息 的 Wilcoxon 秩 检 验 自 然 比 仅 仅 利 用 符 号 要 更 有 效 。 这 也 是 wilcoxon秩 检 验 的 中 心 思 想 。2.2 两 独 立 样 本 的 曼 -惠 特 尼 U
16、 检 验两 独 立 样 本 的 非 参 数 检 验 是 在 对 总 体 分 布 不 甚 了 解 的 情 况 下 , 通 过 对 两 组 独 立 样 本 的 分 析来 推 断 样 本 来 自 的 两 个 总 体 的 分 布 等 是 否 存 在 显 著 差 异 的 方 法 。曼 -惠 特 尼 U 检 验 又 称 “曼 -惠 特 尼 秩 和 检 验 ”, 是 由 H.B.Mann 和 D.R.Whitney 于 1947年 提 出 的 。 它 假 设 两 个 样 本 分 别 来 自 除 了 总 体 均 值 以 外 完 全 相 同 的 两 个 总 体 , 目 的 是 检 验 这两 个 总 体 的 均
17、值 是 否 有 显 著 的 差 别 。 曼 -惠 特 尼 秩 和 检 验 可 以 看 作 是 对 两 均 值 之 差 的 参 数 检 验方 式 的 t 检 验 或 相 应 的 大 样 本 正 态 检 验 的 代 用 品 。 由 于 曼 -惠 特 尼 秩 和 检 验 明 确 地 考 虑 了 每 一个 样 本 中 各 测 定 值 所 排 的 秩 , 它 比 符 号 检 验 法 使 用 了 更 多 的 信 息 。它 的 主 要 思 想 是 假 定 要 检 验 两 组 数 据 之 间 有 没 有 差 异 。 首 先 , 不 管 分 组 把 所 有 数 据 排 序 。按 照 数 值 大 小 给 定 一
18、个 值 叫 做 秩 。 最 小 的 值 秩 为 1, 最 大 的 为 N( 假 定 两 个 样 本 总 共 有 N 个观 察 值 ) 。 如 果 有 相 同 的 值 , 就 得 到 相 同 的 秩 。 相 同 的 值 的 秩 是 他 们 的 秩 的 平 均 值 。 如 果 两组 的 秩 的 和 差 距 比 较 大 , 就 会 得 出 较 小 的 p 值 , 认 为 这 两 组 间 有 显 著 差 异 。 根 据 曼 -惠 特 尼U 检 验 的 公 式 可 以 看 出 它 比 较 的 是 两 个 样 本 中 位 数 , 并 且 曼 -惠 特 尼 U 检 验 只 用 于 两 组 数 据 的比 较
19、。 如 果 要 比 较 多 组 数 据 , 可 以 用 Kruskal-Wallis 检 验 。 用 几 次 Mann-Whitney 检 验 来 比较 多 个 组 间 的 差 异 是 不 适 合 的 , 就 如 同 ANOVA 不 能 用 多 次 t 检 验 代 替 一 样 。 因 此 , 曼 -惠 特尼 U 检 验 只 适 用 于 两 独 立 样 本 的 检 验 。3、 实 例3.1 目 的 及 意 义在 进 行 实 例 分 析 时 , 我 选 取 了 股 票 市 场 的 数 据 。 选 取 了 40 个 st 上 市 公 司 的 每 股 收 益 和40 个 非 st 上 市 公 司 的
20、每 股 收 益 指 标 , 对 它 们 进 行 分 析 , 看 每 股 收 益 指 标 是 否 存 在 显 著 性 的 差异 。我 们 都 知 道 st 表 示 被 特 别 处 理 的 上 市 公 司 , 由 于 其 财 务 状 况 出 现 问 题 , 交 易 所 要 对 投 资 者的 投 资 进 行 提 醒 , 因 此 会 在 公 司 前 加 上 st 表 示 警 惕 。 但 是 企 业 出 现 st 并 不 是 意 味 着 企 业 的 财务 状 况 永 久 出 现 问 题 , 它 可 能 在 st 之 后 变 好 , 也 可 能 在 st 之 后 变 坏 。 而 未 被 st 的 企 业
21、也 不 是不 可 能 出 现 问 题 。 那 么 在 这 种 情 况 下 , 综 合 全 盘 的 对 st 企 业 和 非 st 企 业 财 务 状 况 进 行 分 析 ,看 它 们 是 否 存 在 显 著 差 异 是 有 意 义 的 。基 于 此 , 我 在 中 国 经 济 与 发 展 统 计 数 据 库 中 中 国 证 券 业 年 鉴 中 找 到 2012 年 深 圳 主 板年 度 财 务 指 标 , 其 中 有 净 利 润 、 每 股 净 收 益 和 每 股 净 资 产 等 财 务 指 标 。 由 于 每 股 净 收 益 是 测定 股 票 投 资 价 值 的 重 要 指 标 之 一 ,
22、也 是 分 析 每 股 价 值 的 一 个 基 础 性 指 标 , 它 综 合 反 映 公 司 的 获利 能 力 。 因 此 , 我 选 取 了 每 股 净 收 益 作 为 进 行 分 析 的 财 务 指 标 。 在 报 表 中 我 选 取 了 40 个 st上 市 公 司 的 数 据 , 由 于 st 企 业 数 明 显 比 非 st 企 业 数 量 少 , 因 此 我 从 中 随 机 抽 取 了 40 个 非 st企 业 进 行 分 析 。 希 望 分 析 结 果 能 够 对 投 资 者 的 投 资 决 策 有 一 定 的 参 考 价 值 。3.2 选 取 的 方 法 及 该 方 法 的
23、优 缺 点由 于 st 企 业 和 非 st 企 业 本 质 上 来 说 没 什 么 联 系 , 因 此 可 以 将 它 们 看 成 两 独 立 样 本 的 参 数检 验 , 因 此 选 取 了 曼 -惠 特 尼 U 检 验 。 曼 -惠 特 尼 U 检 验 的 目 的 是 检 验 这 两 个 总 体 的 均 值 是 否有 显 著 的 差 别 。 曼 -惠 特 尼 秩 和 检 验 可 以 看 作 是 对 两 均 值 之 差 的 参 数 检 验 方 式 的 t 检 验 或 相 应的 大 样 本 正 态 检 验 的 代 用 品 。 由 于 曼 -惠 特 尼 秩 和 检 验 明 确 地 考 虑 了
24、每 一 个 样 本 中 各 测 定 值 所排 的 秩 , 所 以 该 检 验 具 有 比 符 号 检 验 更 优 的 特 性 , 并 且 其 计 算 比 较 简 便 , 能 够 很 快 的 得 出 检 验结 果 。但 它 也 有 不 足 , 因 为 曼 -惠 特 尼 U 检 验 比 较 的 是 两 样 本 的 中 位 数 , 所 以 它 其 实 漏 掉 了 一 些信 息 , 这 可 能 导 致 检 验 的 不 准 确 , 可 能 会 得 出 错 误 的 结 论 。3.3 SPSS 分 析 过 程数 据 :曼 -惠 特 尼 U 检 验 :可 以 看 出 , st 企 业 每 股 收 益 的 秩
25、均 值 为 36.34, 秩 和 为 1453.5; 非 st 企 业 每 股 收 益 的 秩均 值 为 44.66, 秩 和 为 1786.5。 这 样 看 来 , st 和 非 st 的 每 股 收 益 似 乎 是 有 明 显 差 异 , 下 面 用 检验 表 来 确 定 是 否 存 在 差 异 。可 以 看 出 渐 进 显 著 性 和 精 确 显 著 性 差 距 并 不 大 , 这 里 的 80 个 数 据 可 以 将 它 看 成 大 样 本 ,这 样 我 们 就 可 以 得 出 结 论 。 由 于 渐 进 显 著 性 ( 双 侧 ) 值 为 0.1100.05, 所 以 不 能 拒 绝
26、 原 假 设 ,而 原 假 设 为 st 和 非 st 上 市 公 司 的 每 股 净 收 益 无 差 异 , 因 此 得 出 结 论 , st 和 非 st 的 每 股 收 益 可以 看 做 无 差 异 的 。3.4 结 论在 对 st 和 非 st 上 市 企 业 的 每 股 收 益 做 曼 -惠 特 尼 检 验 后 , 我 们 得 出 了 一 个 出 人 意 料 的 结 果 ,即 这 两 种 企 业 的 每 股 净 收 益 是 无 差 别 的 。 这 样 的 结 果 确 实 好 像 是 难 以 接 受 , 一 个 财 务 出 现 过状 况 的 企 业 和 一 个 正 常 健 康 的 企
27、业 的 怎 么 可 能 是 一 样 的 呢 ? 但 现 实 是 , 这 里 我 们 只 使 用 了 曼 -惠 特 尼 U 检 验 来 进 行 检 验 , 根 据 曼 -惠 特 尼 检 验 的 缺 点 , 很 有 可 能 出 现 了 偏 差 。 另 一 方 面 , 衡量 一 个 企 业 营 运 状 况 的 财 务 指 标 是 很 多 的 , 这 里 选 取 的 每 股 净 收 益 很 可 能 没 有 反 映 出 st 与 非st 企 业 的 差 别 。 这 告 诉 我 们 , 经 济 问 题 是 非 常 复 杂 的 , 做 出 结 论 也 非 常 的 困 难 , 应 当 尽 可 能 多的 分 析 以 便 做 出 准 确 的 结 论 。