1、中 国 计 算 机 学 会 学 术 著 作 丛 书基 于 解 释 的 机 器 学 习 方 法石 纯 一 等 著清 华 大 学 出 版 社 广 西 科 学 技 术 出 版 社( 京 ) 新 登 字 158 号内 容 简 介基 于 解 释 的 机 器 学 习 是 一 种 分 析 式 学 习 方 法 , 是 人 工 智 能 学 科 的 一 个 重要 分 支 。 它 的 特 点 是 依 知 识 库 和 少 量 例 子 通 过 演 绎 过 程 进 行 学 习 。本书 介 绍 基 于 解 释 机 器 学 习的 研 究 现 状 和 基 本 方 法 。 全 书 共 7 章 , 依 次 介 绍 基 于 解 释
2、的 机 器 学 习 模 型 、 可 操 作 性 、 领 域 理 论 和 效 用 分析 等 内 容 。本 书 可 作 为 大 学 本 科 生 、 研 究 生 学 习 人 工 智 能 课 程 的 参 考 书 , 也 可 供 从 事 计 算 机 科 学 、 人 工 智 能 等 方 面 的科 技 人 员 参 考 。版 权 所 有 , 翻 印 必 究 。 本 书 封 面 贴 有 清 华 大 学 出 版 社 激 光 防 伪 标 签 , 无 标 签 者 不 得 销 售 。书 名 : 基 于 解 释 的 机 器 学 习 方 法 作 者 : 石 纯 一 等出 版 者 : 清 华 大 学 出 版 社 ( 北 京
3、清 华 大 学 校 内 , 邮 编 100084)广 西 科 学 技 术 出 版 社 ( 南 宁 市 河 堤 路 14 号 , 邮 编 530021)印 刷 者 : 人 民 文 学 印 刷 厂发 行 者 : 新 华 书 店 总 店 北 京 科 技 发 行 所开 本 : 787 1092 1/ 16 印 张 : 11. 25 字 数 : 267 千 字版 次 : 1997 年 4 月 第 1 版 1997 年 4 月 第 1 次 印 刷书 号 : ISBN 7-302-02432-4/ T P1230印 数 : 00013000定 价 : 16.00 元 序 言计 算 机 是 当 代 发 展 最
4、 为 迅 猛 的 科 学 技 术 , 其 应 用 几 乎 已 深 入 到 人 类 社 会 活 动 和 生 活的 一 切 领 域 , 大 大 提 高 了 社 会 生 产 力 , 引 起 了 经 济 结 构 、 社 会 结 构 和 生 活 方 式 的 深 刻 变 化 和 变 革 , 是 最 为 活 跃 的 生 产 力 之 一 。 计 算 机 本 身 在 国 际 范 围 内 已 成 为 年 产 值 达 2500 亿 美 元 的 巨 大 产 业 , 国 际 竞 争 异 常 剧 烈 , 预 计 到 本 世 纪 末 将 发 展 为 世 界 第 一 大 产 业 。 计 算 机 科 技 具 有 极 大 的 综
5、 合 性 质 , 与 众 多 科 学 技 术 相 交 叉 而 反 过 来 又 渗 入 更 多 的 科 学 技 术 , 促 进 它 们 的 发 展 。 计 算 机 科 技 内 容 十 分 丰 富 , 学 科 分 支 生 长 尤 为 迅 速 , 日 新 月 异 , 层 出 不 穷 。 因 此 在 我 国 计 算 机 科 技 尚 比 较 落 后 的 情 况 下 , 加 强 计 算 机 科 技 的 传 播 实 为 当 务 之 急 。中 国 计 算 机 学 会 一 直 把 出 版 图 书 刊 物 作 为 学 术 活 动 的 重 要 内 容 之 一 。 我 国 计 算 机 专 家 学 者 通 过 科 学
6、实 践 , 做 出 了 大 量 成 果 , 积 累 了 丰 富 经 验 与 学 识 。 他 们 有 撰 写 著 作 的 很 大 积 极 性 , 但 相 当 时 期 以 来 计 算 机 学 术 著 作 由 于 印 数 不 多 , 出 版 往 往 遇 到 不 少 困 难 , 专 业 性越 强 越 有 深 度 的 著 作 , 出 版 难 度 越 大 。 最 近 清 华 大 学 出 版 社 与 广 西 科 学 技 术 出 版 社 为 促 进 我 国 计 算 机 科 学 技 术 及 产 业 的 发 展 , 推 动 计 算 机 科 技 著 作 的 出 版 工 作 , 特 设 立 “计 算 机 学 术 著
7、作 出 版 基 金 ”, 以 支 持 我 国 计 算 机 科 技 工 作 者 撰 写 高 水 平 的 学 术 著 作 , 并 将 资 助 出 版 的 著 作 列 为 中 国 计 算 机 学 会 的 学 术 著 作 丛 书 。 我 们 十 分 重 视 这 件 事 , 并 已 把 它 列 为 学 会 本 届 理 事 会 的 工 作 要 点 之 一 。 我 们 希 望 这 一 系 列 丛 书 能 对 传 播 学 术 成 果 、 交 流 学 术 思 想 、 促 进 科 技 转 化 为 生 产 力 起 到 良 好 作 用 , 能 对 我 国 计 算 机 科 技 发 展 具 有 有 益 的 导 向 意 义
8、 , 也 希 望 我 国 广 大 学 会 会 员 和 计 算 机 科 技 工 作 者 , 包 括 海 外 工 作 和 学 习 的 神 州 学 人 们 能 积 极 投稿 , 出 好 这 一 系 列 丛 书 。中 国 计 算 机 学 会1992 年 4 月 20 日 出 版 说 明近 年 来 , 随 着 微 电 子 和 计 算 机 技 术 渗 透 到 各 个 技 术 领 域 , 人 类 正 在 步 入 一 个 技 术 迅 猛 发 展 的 新 时 期 。 这 个 新 时 期 的 主 要 标 志 是 计 算 机 和 信 息 处 理 的 广 泛 应 用 。 计 算 机 在 改 造 传 统 产 业 , 实
9、 现 管 理 自 动 化 , 促 进 新 兴 产 业 的 发 展 等 方 面 都 起 着 重 要 作 用 , 它 在 现 代 化 建设 中 的 战 略 地 位 愈 来 愈 明 显 。 计 算 机 科 学 与 其 它 学 科 的 交 叉 又 产 生 了 许 多 新 学 科 , 推 动 着 科 学 技 术 向 更 广 阔 的 领 域 发 展 , 正 在 对 人 类 社 会 产 生 深 远 的 影 响 。科 学 技 术 是 第 一 生 产 力 。 计 算 机 科 学 技 术 是 我 国 高 科 技 领 域 的 一 个 重 要 方 面 。 为 了 推 动 我 国 计 算 机 科 学 及 产 生 的 发
10、 展 , 促 进 学 术 交 流 , 使 科 研 成 果 尽 快 转 化 为 生 产 力 , 清 华 大 学 出 版 社 与 广 西 科 学 技 术 出 版 社 联 合 设 立 了 “计 算 机 学 术 著 作 基 金 ”, 旨 在 支 持 和 鼓 励 科 技 人 员 , 撰 写 高 水 平 的 学 术 著 作 , 以 反 映 和 推 广 我 国 在 这 一 领 域 的 最 新 成 果 。计 算 机 学 术 著 作 出 版 基 金 资 助 出 版 的 著 作 范 围 包 括 : 有 重 要 理 论 价 值 或 重 要 应 用 价 值 的 学 术 专 著 ; 计 算 机 学 科 前 沿 探 索
11、的 论 著 ; 推 动 计 算 机 技 术 及 产 业 发 展 的 专 著 ; 与 计 算机 有 关 的 交 叉 学 科 的 论 著 ; 有 较 大 应 用 价 值 的 工 具 书 ; 世 界 名 著 的 优 秀 翻 译 作 品 。 凡 经 作 者 本 人 申 请 , 计 算 机 学 术 著 作 出 版 基 金 评 审 委 员 会 评 审 通 过 的 著 作 , 将 由 该 基 金 资 助 出版 , 出 版 社 将 努 力 做 好 出 版 工 作 。基 金 还 支 持 两 社 列 选 的 国 家 高 科 技 重 点 图 书 和 国 家 教 委 重 点 图 书 规 划 中 计 算 机 学 科 领
12、 域 的 学 术 著 作 的 出 版 。 为 了 做 好 选 题 工 作 , 出 版 社 特 邀 请 中 国 计 算 机 学 会 、 中 国 中 文 信 息 学 会 帮 助 做 好 组 织 有 关 学 术 著 作 丛 书 的 列 选 工 作 。热 诚 希 望 得 到 广 大 计 算 机 界 同 仁 的 支 持 和 帮 助 。清 华 大 学 出 版 社计 算 机 学 术 著 作 出 版 基 金 办 公 室 广 西 科 学 技 术 出 版 社1992 年 4 月 清 华 大 学 出 版 社 广 西 科 学 技 术 出 版 社计 算 机 学 术 著 作 出 版 基 金 评 审 委 员 会主 任 委
13、员 张 效 祥副 主 任 委 员 汪 成 为 唐 泽 圣委 员 王 鼎 兴 杨 芙 清 李 三 立 施 伯 乐 徐 家 福 夏 培 肃 董 韫 美 黄 健 焦 金 生 前 言基 于 解 释 的 机 器 学 习 ( E xplanat ion-Based L ear n ing, 简 称 E BL ) 是 一 种 分 析 式 学 习方 法 , 特 点 是 从 少 数 例 子 出 发 , 依 领 域 理 论 ( 知 识 库 ) 通 过 演 绎 获 得 知 识 。 自 20 世 纪 80 年 代 中 E BL 形 成 一 种 机 器 学 习 方 法 以 来 , 国 内 外 已 开 展 了 一 系 列
14、 的 研 究 , 并 已 有 初 步 应 用 。清 华 大 学 计 算 机 系 机 器 学 习 课 题 组 , 自 1985 年 以 来 已 进 行 了 10 年 的 E BL 研 究 , 先 后 完 成 了 国 家 自 然 科 学 基 金 2 项 , 国 家 高 技 术 863-306 基 础 性 研 究 课 题 2 项 , 共 发 表 论 文 20 余 篇 , 所 做 研 究 成 果 经 鉴 定 达 到 国 际 先 进 水 平 。这 本 书 涉 及 解 释 学 习 的 主 要 内 容 , 包 括 E BL 的 可 操 作 性 、 领 域 理 论 和 效 用 问 题 等 。 有 些 内 容
15、除 在 我 们 的 讨 论 班 上 报 告 过 外 , 还 在 国 家 智 能 研 究 开 发 中 心 报 告 过 , 也 得 到 不 少 国 内 人 工 智 能 学 术 界 年 轻 学 者 的 帮 助 。 这 本 书 是 集 体 研 究 成 果 的 汇 集 , 是 我 们 研 究 工 作 的 总 结 , 包 括 张 旗 博 士 , 郝 继 刚 博 士 , 王 建 伟 博 士 , 以 及 陈 红 、 龚 义 涛 、 郭 晨 东 、 黄 毅 青 、 杨 宇 、 于 津 、 王 彤 等 硕 士 的 研 究 工 作 。本 书 最 后 由 郝 继 刚 、 王 建 伟 整 理 完 成 。 在 课 题 组
16、 的 讨 论 班 上 得 到 了 陆 玉 昌 教 授 、 李 膺 春 教 授 的 指 导 , 周 远 晖 、 张 朝 辉 博 士 生 也 参 加 了 讨 论 , 一 并 表 示 感 谢 。在 我 国 计 算 机 界 的 著 名 学 者 张 效 祥 先 生 、 董 韫 美 先 生 、 陆 汝 钤 先 生 的 支 持 下 , 本 书 获 得 了 清 华 大 学 出 版 社 、 广 西 科 技 出 版 社 的 计 算 机 学 术 著 作 出 版 基 金 的 资 助 , 在 此 也 向 这 几 位 先 生 和 出 版 社 深 表 谢 意 。书 中 一 些 观 点 和 见 解 定 会 有 不 少 不 准
17、 确 甚 至 不 当 之 处 , 请 读 者 批 评 指 正 。石 纯 一1996 年 8 月 于 清 华 园目 录第 1 章 解 释 学 习 概 述 11. 1 机 器 学 习 11. 2 解 释 学 习 101. 3 我 们 的 工 作 28第 2 章 可 操 作 性 302. 1 可 操 作 性 的 提 出 302. 2 可 操 作 性 的 研 究 312. 3 可 操 作 性 的 讨 论 362. 4 E BL 可 操 作 性 的 模 糊 集 描 述 及 计 算 372. 5 讨 论 41第 3 章 数 字 概 括 423. 1 数 字 概 括 的 目 标 分 解 法 423. 2 数
18、 字 概 括 的 效 用 分 析 47第 4 章 领 域 理 论 544. 1 不 完 善 领 域 理 论 问 题 的 分 类 与 表 示 ( 一 ) 544. 2 不 完 善 领 域 理 论 问 题 的 分 类 与 表 示 ( 二 ) 614. 3 不 完 善 领 域 理 论 的 知 识 求 精 664. 4 基 于 多 例 多 概 念 的 领 域 理 论 修 正 方 法 734. 5 克 服 领 域 理 论 不 完 全 问 题 的 学 习 方 法 CE 774. 6 多 策 略 、 交 互 式 的 知 识 求 精 系 统 M S/ I -KR S 86第 5 章 效 用 问 题 1005.
19、 1 效 用 分 析 1005. 2 效 用 提 高 策 略 1045. 3 进 一 步 研 究 的 课 题 122第 6 章 解 释 学 习 算 法 的 扩 充 1236. 1 模 糊 概 念 的 学 习 1236. 2 概 念 层 次 中 的 多 策 略 学 习 1286. 3 增 量 式 的 解 释 学 习 1306. 4 算 法 分 析 与 改 进 1366. 5 有 噪 声 的 学 习 算 法 141第 7 章 专 家 判 断 规 则 的 获 取 方 法 146 7. 1 引 言 1467. 2 专 家 决 策 认 知 模 型 M BH 1467. 3 Polynome 系 统 14
20、87. 4 IA M BH 系 统 149参 考 文 献 1569第 1 章 解 释 学 习 概 述1. 1 机 器 学 习1. 1. 1 机 器 学 习 的 研 究 内 容1. 1. 1. 1 何 谓 机 器 学 习获 得 新 认 识 和 适 应 新 环 境 是 智 能 体 的 本 质 特 征 之 一 。 同 智 能 体 一 样 , 学 习 能 力 目 前 只 能 从 人 类 和 高 等 生 物 那 里 得 到 “存 在 性 ”验 证 , 尚 未 形 成 一 致 的 形 式 化 的 定 义 和 理 论 。 机 器 学 习 ( M achine L ear ning, M L ) 是 人 工
21、智 能 ( A I ) 的 基 本 问 题 之 一 。关 于 学 习 的 定 义 , 主 要 有 :( 1) 学 习 是 系 统 内 部 的 适 应 性 变 化 , 使 系 统 在 以 后 从 事 同 一 任 务 或 同 一 问 题 范 围 中类 似 的 任 务 时 , 效 率 更 高 Simon , 1983 ;( 2) 学 习 是 我 们 心 智 内 部 有 用 的 变 化 M ins ky, 1985 ;( 3) 学 习 是 对 正 在 被 经 历 的 事 物 , 构 造 或 修 改 其 表 示 M ichalski, 1986 ;( 4) 经 由 学 习 活 动 而 使 系 统 获 得
22、 的 能 力 , 能 够 完 成 学 习 之 前 无 法 完 成 的 新 任 务 , 或 将 老 任 务 做 得 更 好 Car bonell, 1990 ;( 5) 机 器 学 习 是 计 算 机 系 统 有 目 的 地 增 进 其 性 能 的 过 程 卢 美 律 等 , 1995 。 综 上 所 述 , 可 以 归 纳 出 关 于 学 习 活 动 的 几 个 特 征 :( 1) 目 的 性 : 学 习 活 动 是 一 种 有 目 的 的 变 化 , 目 标 是 改 善 智 能 体 的 问 题 求 解 能 力 和性 能 。( 2) 信 息 来 源 : 学 习 活 动 的 输 入 信 息 包
23、括 外 部 环 境 信 息 和 系 统 从 前 的 经 验 两 大 类 。( 3) 记 忆 能 力 : 学 习 活 动 的 结 果 体 现 和 保 存 于 智 能 体 中 , 不 随 学 习 活 动 的 完 成 而 消失 。( 4) 表 示 形 式 : 一 般 包 括 显 式 知 识 获 得 、 知 识 重 组 与 重 构 、 系 统 结 构 变 化 、 系 统 参 数调 整 、 运 行 机 制 变 化 等 。1. 1. 1. 2 机 器 学 习 的 研 究 内 容 和 理 论 模 型通 常 根 据 学 习 目 的 的 不 同 , 可 以 把 机 器 学 习 系 统 分 为 两 类 : 一 类
24、 是 综 合 性 的 , 主 要 目标 是 获 取 新 知 识 ( Knowledge A cquisit ion ) ; 另 一 类 是 分 析 性 的 , 目 标 是 对 知 识 进 行 重 组 和 形 式 变 换 , 使 之 效 率 更 高 , 称 为 技 能 改 进 ( Skill R efinement ) , 如 图 1. 1 所 示 。Simon 给 出 一 个 抽 象 的 学 习 模 型 , 有 四 个 构 成 要 素 : 环 境 、 学 习 单 元 、 知 识 库 和 执 行 单 元 , 见 图 1. 2 Simon, 1983 。 环 境 为 学 习 单 元 提 供 某 些
25、 信 息 , 学 习 单 元 利 用 这 些 信 息 对 知 识 库 进 行 某 种 改 进 , 执 行 单 元 利 用 这 些 信 息 去 执 行 任 务 , 其 间 获 得 的 信 息 可 以 反 馈 给 学 习 单 元 , 也 可 以 对 环 境 做 出 响 应 。20 世 纪 90 年 代 初 M ichals ki 等 人 提 出 学 习 推 理 理 论 , 用 抽 象 的 知 识 变 形 算 子 分 析 、 解 释 不 同 的 学 习 方 法 和 学 习 系 统 。 主 要 观 点 有 :2图 1. 1 基 本 的 学 习 形 式 和 所 学 的 知 识 或 技 能( 1) 从 推
26、 理 中 学 习 , 学 习 = 推 理 + 记 忆 。( 2) 变 形 作 为 学 习 算 子 , 将 学 习 过 程 定 义 为 :Input : 外 界 输 入 信 息 ( I ) ; 学 习 目 标 ( G ) ; 系 统 已 具 备 的 基 础 知 识 ( BK ) ; 变 换( T ) 。Out pu t: 输 出 满 足 G 的 知 识 ( O ) , 依 BK 将 T 作 用 于 I 来 实 现 。( 3) 对 学 习 过 程 的 不 同 分 类 标 准 中 , 最 关 键 的 是 学 习 目 的 。图 1. 2 学 习 模 型1. 1. 2 机 器 学 习 的 发 展 历 史
27、机 器 学 习 的 研 究 历 史 , 几 乎 与 人 工 智 能 一 样 长 , 大 致 经 历 了 三 个 阶 段 :第 一 个 阶 段 , 是 20 世 纪 50 年 代 的 神 经 模 拟 和 决 策 理 论 技 术 , 学 习 系 统 在 运 行 时 还 很 少 具 有 结 构 或 知 识 。 主 要 方 法 是 建 造 神 经 网 络 和 自 组 织 系 统 , 学 习 表 现 为 阈 值 逻 辑 单 元 传 送 信 号 的 反 馈 调 整 。 著 名 系 统 有 感 知 机 ( Per ceptr on ) ( R osenblat t, 1958 ) 和 西 洋 跳 棋 程 序
28、 ( check er ) ( Cohen et al, 1982 ) 等 。 随 后 的 理 论 研 究 揭 示 , 这 种 不 要 知 识 的 感 知 器 类 型 的 学 习 系 统 有 很 大 的 局 限 性 。第 二 阶 段 , 是 20 世 纪 60 年 代 早 期 开 始 研 究 面 向 概 念 的 学 习 , 即 符 号 学 习 。 使 用 的 工 具 是 语 义 网 络 或 谓 词 逻 辑 , 不 再 是 数 值 或 统 计 方 法 。 在 概 念 获 取 中 , 学 习 系 统 通 过 分 析 相 关 概 念 的 大 量 正 例 和 反 例 来 构 造 概 念 的 符 号 表
29、 示 。 在 这 一 阶 段 , 人 们 认 识 到 学 习 是 个 复 杂 而 循 序 渐 进 的 过 程 ; 如 果 不 要 任 何 初 始 知 识 , 则 学 习 系 统 无 法 学 到 高 层 次 的 概 念 。 关 于 积 木 世 界 的 学 习 系 统 是 较 有 影 响 的 工 作 Wins ton, 1975 。第 三 个 阶 段 , 开 始 于 20 世 纪 70 年 代 中 期 , 研 究 活 动 日 趋 兴 旺 , 各 种 学 习 方 法 不 断 推 出 , 实 验 系 统 大 量 涌 现 , 1980 年 在 卡 内 基 梅 隆 大 学 ( CM U ) 召 开 第 一
30、 届 机 器 学 习 专 题 研讨 会 , 标 志 着 机 器 学 习 正 式 成 为 人 工 智 能 的 一 个 独 立 研 究 领 域 。 伴 随 专 家 系 统 和 知 识 工 程 的 热 潮 , 人 们 普 遍 认 识 到 , 为 了 学 到 新 知 识 , 学 习 系 统 必 须 拥 有 大 量 的 知 识 。 较 为 成 功 的 学 习 系 统 和 算 法 有 A Q 系 列 ( M ich alski, 1980; M ichalski et al, 1983 ) , ID3 ( Quin lan,31986a , 1986b ) , L E X( M itchell, 1982
31、; M itch ell et al, 1983 ) , A CT 系 统 ( A nder son, 1983, 1986 ) , AM 和 E U R ISK O ( Lenat , 1982, 1983a, 1983b, 1983c ) , BA CON 系 统( L angley et al, 1983, 1986 ) , SO AR ( R osenbloom et al, 1986; Lair d et al, 1986, 1987 ) 等 。 还 创 办 了 国 际 学 术 刊 物 机 器 学 习 ( M achine L ear ning) , 每 年 举 行 国 际 机 器
32、学 习 会 议 及 各 种 专 题 性 、 地 域 性 会 议 。从 20 世 纪 80 年 代 中 后 期 到 现 在 , 可 以 认 为 机 器 学 习 研 究 进 入 一 个 新 阶 段 , 已 经 趋 向 成 熟 。 首 先 是 神 经 网 络 的 复 苏 , 带 动 着 各 种 非 符 号 学 习 方 法 与 符 号 学 习 并 驾 齐 驱 , 并 且 已 超 越 AI 研 究 范 围 , 进 入 到 自 动 化 及 模 式 识 别 等 领 域 , 掀 起 一 场 联 结 主 义 的 热 潮 ; 其 次 在已 有 学 习 方 法 的 研 究 基 础 上 , 开 始 考 虑 对 多 种
33、 方 法 加 以 集 成 , 多 策 略 学 习 得 到 迅 速 发 展 ; 多 种 学 习 方 法 和 系 统 已 经 走 出 学 术 杂 志 和 实 验 室 , 进 入 实 际 应 用 领 域 。 学 习 的 计 算 理 论 开 始 对 机 器 的 学 习 能 力 进 行 形 式 化 的 分 析 和 总 结 , 得 到 一 系 列 理 论 成 果 , 如 PAC L ear ning 等 。 在 各 种 重 要 的 AI 会 议 中 , 关 于 机 器 学 习 的 文 章 已 占 有 较 多 数 量 和 篇 幅 , 成 为 AI 的 主 流 研 究 领 域 之 一 。1. 1. 3 机 器
34、 学 习 方 法学 习 系 统 有 各 种 分 类 标 准 , 如 按 基 本 策 略 , 或 知 识 表 示 , 或 应 用 领 域 , 或 学 习 方 法 或 结 果 层 次 等 。 这 里 介 绍 从 学 习 推 理 理 论 来 对 学 习 过 程 分 类 , 见 图 1. 3 卢 美 律 等 , 1995 。1. 1. 3. 1 归 纳 学 习综 合 性 的 归 纳 学 习 ( Induct ive lear ning) 亦 可 称 作 经 验 学 习 ( E mpir ical lear ning) 、 基 于 相 似 性 的 学 习 ( Similar it y-based lea
35、r ning 简 记 SBL ) 、 例 子 学 习 ( Lear ning fr om examples ) 等 。在 例 子 空 间 中 , 给 出 关 于 某 个 概 念 的 正 例 和 反 例 集 合 , 归 纳 学 习 系 统 使 用 一 般 化 ( gener alization) 和 特 殊 化 ( Specializat ion ) 操 作 在 空 间 中 进 行 搜 索 , 并 根 据 学 习 倾 向 ( Bias ) 进 行 抉 择 , 获 得 该 概 念 的 一 般 化 描 述 , 这 是 一 个 从 特 殊 实 例 到 一 般 规 律 的 推 理 过 程 , 其 哲 学
36、 和 数 学 基 础 是 源 自 Bacon 归 纳 法 以 来 的 归 纳 理 论 。归 纳 学 习 是 发 展 最 成 熟 的 学 习 方 法 之 一 , 拥 有 形 式 化 理 论 模 型 , 应 用 已 达 到 商 品 化 。 代 表 性 的 方 法 和 系 统 有 版 本 空 间 法 ( Ver sion Space ) ( M it chell, 1982 ) , 决 策 树 ( ID3)( Quinlan, 1986a, 1986b ) , AQ 算 法 ( M ichalski, 1980 ) , BA CON 系 统 ( L angley et al, 1983 ) , 概
37、念 聚 类 ( M ich alsk i et al, 1983; St epp et al, 1986; Gennar i et al, 1989 ) 等 。 1. 1. 3. 2 分 析 式 学 习分 析 式 学 习 ( An alytical lear ning) 的 特 点 是 运 用 大 量 领 域 知 识 来 驱 动 学 习 进 程 。 实 例 不 再 单 纯 是 无 关 特 征 集 合 , 而 是 在 已 有 背 景 知 识 环 境 下 得 到 考 察 , 学 习 结 果 也 消 除 了 倾 向 的 影 响 。 主 要 方 法 有 类 比 学 习 ( L ear ning by
38、Analogy) 、 示 例 学 习 ( Case-b as ed lear ning) 和解 释 学 习 等 。类 比 是 在 具 有 相 似 性 质 的 领 域 间 发 现 知 识 的 对 应 关 系 , 对 于 未 知 或 不 熟 悉 的 领 域 中的 概 念 , 运 用 类 比 , 借 助 于 相 似 的 、 熟 悉 的 领 域 中 的 概 念 进 行 学 习 , 称 为 类 比 学 习 。 由 于 环 境 提 供 的 信 息 仅 和 一 个 类 似 的 问 题 有 关 , 学 习 单 元 必 须 发 现 其 中 的 相 似 性 , 并 形 成 类 似 的 规 则 和 假 设 以 解
39、决 当 前 问 题 。 类 比 学 习 需 要 归 纳 和 演 绎 推 理 : 寻 找 共 同 的 子 结 构 需 要 归 纳4推 理 , 而 进 行 类 比 映 射 则 是 一 演 绎 过 程 。 典 型 类 比 系 统 模 型 有 转 换 类 比 ( T r ans for mat ional Analogy ) ( Car bonell, 1983 ) / 派 生 类 比 ( Der ivational Analogy ) ( Car bonell, 1986 ) / N L AG 系 统 ( Gr einer , 1989 ) 等 。 类 比 包 含 形 象 思 维 和 创 造 性 成
40、 分 , 增 大 了 实 用 系 统 的 研 究 难 度 , 同 时 也 蕴 含 着 推 动 机 器 学 习 和 人 工 智 能 研 究 进 展 的 潜力 。图 1. 3 学 习 推 理 理 论 对 于 学 习 过 程 的 分 类示 例 学 习 选 择 先 前 有 用 的 经 验 片 断 作 为 示 例 , 加 以 记 忆 和 索 引 , 建 立 示 例 库 ; 在 解 决新 问 题 时 , 在 示 例 库 中 查 询 与 当 前 任 务 比 较 类 似 的 示 例 来 加 以 匹 配 , 借 助 它 们 所 提 供 的 信 息 进 行 任 务 求 解 ; 任 务 求 解 成 功 后 , 若
41、认 为 该 经 验 ( 任 务 目 标 及 解 法 ) 有 助 于 未 来 其 它 任 务 的解 决 , 则 将 其 作 为 新 的 示 例 加 以 保 存 Bar eiss et al, 1987; Por t er et al, 1990 。 示 例 学 习 系 统 的 运 行 流 程 如 图 1. 4 所 示 。图 1. 4 示 例 学 习 系 统 的 运 行 流 程 Barlett a, 1993Schank 首 先 提 出 示 例 学 习 的 思 想 Schank , 1982 。 1983 年 K olonder 的 Cyr us 是 第5一 个 可 在 计 算 机 上 运 行 的
42、 示 例 学 习 系 统 ; 随 后 在 不 同 领 域 中 又 研 制 出 许 多 系 统 李 宝 东 , 1992; 卢 美 律 等 , 1995 。 示 例 学 习 方 法 的 技 术 关 键 是 , 如 何 有 效 地 选 择 和 存 储 新 的 有 用 示 例 , 为 示 例 库 建 立 便 于 查 询 的 索 引 机 制 和 恰 当 的 匹 配 标 准 , 以 使 相 似 示 例 的 查 找 快 速 、 方 便 和 准 确 。1. 1. 3. 3 人 工 神 经 网 络 和 遗 传 算 法神 经 网 络 和 遗 传 算 法 ( Genetic Algor ith m) 属 于 非
43、符 号 学 习 范 畴 , 不 是 在 形 式 符 号 层次 , 而 主 要 是 在 数 值 层 次 体 现 学 习 行 为 。人 工 神 经 网 络 又 称 为 联 结 学 习 ( Connectionist lear ning ) 机 制 , 是 由 大 量 简 单 处 理 单元 组 成 的 非 线 性 动 力 系 统 , 它 是 借 助 动 物 神 经 生 理 科 学 的 研 究 成 果 , 假 定 人 脑 神 经 元 网 络 加 工 、 记 忆 信 息 的 机 理 , 利 用 计 算 机 系 统 加 以 模 拟 。 具 体 讲 , 人 工 神 经 元 网 络 是 一 组 相 互 关 联
44、 的 神 经 元 结 点 , 每 个 结 点 都 有 其 输 入 端 、 内 部 记 忆 状 态 和 输 出 端 , 输 出 和 内 部 状 态 由 输入 决 定 , 而 输 入 则 由 与 之 相 连 的 若 干 结 点 的 输 出 及 其 联 结 权 值 决 定 。 神 经 网 络 的 行 为 就 取 决 于 这 些 权 值 和 输 入 -输 出 函 数 。 给 定 网 络 的 初 始 状 态 , 系 统 经 过 计 算 最 终 达 到 平 衡 状 态 , 完 成 一 次 问 题 求 解 。 学 习 过 程 即 调 整 结 点 间 联 结 的 权 值 , 以 期 得 到 规 定 的 输 出
45、 。神 经 网 络 的 主 要 特 点 有 : 大 规 模 并 行 处 理 ; 强 健 的 分 布 式 存 储 ; 自 适 应 、 自 组 织 的 学 习 过 程 杨 行 竣 等 , 1992 。主 要 研 究 成 果 有 M P 模 型 、 感 知 机 ( P er cept r on ) 、 Hebb 假 设 、 自 适 应 线 性 网 络 A daline、 连 接 网 络 模 型 、 Bolt zmann 机 和 多 层 网 络 学 习 算 法 、 P DP 理 论 和 多 层 网 络 误 差 反 向 传 播 算 法 ( BP 算 法 ) 等 。遗 传 算 法 或 称 基 因 算 法
46、, 源 于 对 生 物 繁 殖 中 的 诱 变 原 理 和 达 尔 文 自 然 选 择 原 理 的 计算 机 模 拟 , 是 由 Holland 于 1975 年 首 次 提 出 H olland, 1986; Goldber g, 1989 。 它 根 据 解 决 问 题 的 规 则 在 应 用 中 效 果 的 好 坏 和 大 小 , 进 行 优 胜 劣 汰 的 繁 殖 : 把 参 加 每 一 轮 竞 争 的 规 则 群 体 ( Popu lation) 看 作 一 代 , 在 同 一 代 中 选 择 表 现 优 异 者 进 行 杂 交 , 形 成 新 一 代 规 则 ; 如 此 一 代 代
47、 地 更 新 , 以 期 获 得 一 组 高 质 量 的 规 则 。 规 则 为 适 应 应 用 环 境 而 作 的 一 代 代 更新 , 犹 如 生 物 为 适 应 自 然 而 更 新 后 代 。 其 运 行 流 程 为 : 吴 轶 华 , 1991a ( 1) 建 立 初 始 群 体 ;( 2) 评 价 群 体 中 的 个 体 ;( 3) 利 用 一 组 遗 传 算 子 : 复 制 ( R epr odu ction ) 、 杂 交 ( Cr os sover ) 、 变 异 ( Mut ation ) 或 倒 向 ( Inver sion ) , 创 建 新 一 代 群 体 , 保 持
48、个 体 总 数 不 变 ;( 4) 评 价 新 的 个 体 ;( 5) 如 果 超 过 时 间 界 限 , 或 个 体 产 生 的 迭 代 次 数 超 过 预 设 常 数 n, 则 输 出 评 价 值 最 高的 个 体 , 否 则 转 ( 3) 。分 类 器 系 统 ( Class ifier Syst em ) 是 发 展 较 为 成 熟 的 基 于 遗 传 的 学 习 方 法 之 一 。 一 般 结 构 如 图 1. 5 所 示 。 有 三 个 主 要 部 分 :( 1) 规 则 发 现 使 用 基 因 算 法 进 行 变 形 , 生 成 新 的 行 为 规 则 ;( 2) 信 度 调 整
49、 利 用 桶 队 算 法 ( Bucket Algor ith m) 调 整 规 则 的 可 信 度 , 为 规 则 评 定 级 别 和 加 ( 减 ) 权 值 ;( 3) 执 行 部 分 即 规 则 和 信 息 系 统 , 具 体 负 责 问 题 求 解 。 由 外 界 给 出 一 组 消 息 , 其 形6式 为 01# ( # 代 表 0 或 1 构 成 的 串 ) , 系 统 检 查 输 入 消 息 是 否 与 输 入 前 提 匹 配 , 若 匹 配 则输 出 规 则 的 结 论 消 息 。图 1. 5 分 类 器 系 统 的 一 般 结 构 吴 轶 华 , 1991b1. 1. 4 学 习 方 法 和 系 统 的 评 价1. 1. 4. 1 衡 量 学 习 系 统 的 标 准虽 然 还 没 有