1、情 报 学 报第 卷 第 期 , 年 月, 收 稿 日 期 : 年 月 日作 者 简 介 : 王 雪 华 , 女 , 年 生 , 大 连 理 工 大 学 , 博 士 , 信 息 与 决 策 技 术 研 究 所 副 所 长 , 教 授 , 主 要 研 究 领 域 : 电 子 政 务 、 复杂 性 系 统 等 。 张 旭 娟 , 女 , 年 生 , 大 连 理 工 大 学 硕 士 研 究 生 , 主 要 研 究 领 域 : 电 子 政 务 、 数 据 挖 掘 。 : 。 王 春 雨 , 男 , 年 生 , 大 连 理 工 大 学 在 职 博 士 生 , 主 要 研 究 领 域 : 电 子 政 务
2、。) 大 连 市 科 技 项 目 ( ) : 城 市 公 安 信 息 资 源 开 发 与 管 理 。刑 事 案 件 的 多 维 关 联 分 析 模 型 研 究)王 雪 华 张 旭 娟 王 春 雨( 大 连 理 工 大 学 管 理 学 院 , 大 连 )摘 要 为 了 发 现 刑 事 案 件 中 犯 罪 的 特 点 与 规 律 , 本 文 建 立 了 刑 事 案 件 的 多 维 关 联 分 析 模 型 。 首 先 , 进 行 刑 事 案件 的 数 据 清 理 ; 然 后 , 建 立 刑 事 案 件 多 维 数 据 模 型 , 其 中 包 括 概 念 分 层 与 建 立 数 据 立 方 体 ; 在
3、 此 基 础 上 , 利 用 改 进 的频 繁 谓 词 集 算 法 寻 找 频 繁 谓 词 集 , 根 据 最 小 支 持 度 与 最 小 置 信 度 要 求 , 产 生 强 关 联 规 则 ; 最 后 , 对 结 果 进 行 解 释 与评 价 。 建 立 模 型 后 , 本 文 利 用 刑 事 案 件 的 样 本 数 据 , 详 细 地 描 述 了 整 个 模 型 的 建 立 过 程 , 并 且 利 用 大 连 市 公 安 局 提供 的 真 实 数 据 验 证 了 模 型 的 可 用 性 与 正 确 性 并 对 结 果 进 行 了 详 细 分 析 。 本 文 建 立 的 刑 事 案 件 多
4、维 关 联 分 析 模 型为 今 后 城 市 公 安 数 据 挖 掘 应 用 研 究 提 供 了 参 考 。关 键 词 数 据 挖 掘 刑 事 案 件 多 维 关 联 规 则, ( , ), , , , , , , 引 言多 年 来 , 城 市 公 安 信 息 化 基 础 工 作 建 设 取 得 了巨 大 成 绩 , 但 也 存 在 不 少 问 题 。 其 中 之 一 是 各 类 信息 资 源 没 有 得 到 充 分 挖 掘 和 合 理 有 效 利 用 , 不 能 以简 便 、 灵 活 的 应 用 手 段 为 领 导 和 一 线 民 警 开 展 工 作提 供 全 天 候 、 全 方 位 、 全
5、 过 程 的 综 合 信 息 支 持 和 科 学决 策 支 持 。刑 事 案 件 预 防 与 破 获 是 城 市 公 安 工 作 的 重 点 部分 , 如 何 利 用 大 量 的 历 史 案 件 信 息 也 成 为 关 键 问 题 ,因 此 , 利 用 数 据 挖 掘 技 术 来 发 现 犯 罪 的 特 点 与 规 律 ,为 案 件 决 策 者 提 供 辅 助 决 策 支 持 , 这 是 必 要 和 现 实的 。 关 联 分 析 是 数 据 挖 掘 中 的 一 个 重 点 模 式 类 型 ,可 以 发 现 关 联 规 则 , 这 些 规 则 展 示 了 属 性 值 频繁 地 在 给 定 数 据
6、 集 中 同 时 出 现 的 条 件 。 如 果 可 以 在刑 事 案 件 中 进 行 关 联 分 析 找 到 犯 罪 的 关 联 规 则 , 比如 什 么 样 的 情 况 下 容 易 出 现 什 么 类 型 的 刑 事 案 件 , !就 可 以 为 刑 事 案 件 的 决 策 者 提 供 有 效 的 信 息 , 辅 助案 件 的 预 防 与 破 获 。 刑 事 案 件 的 关 联 分 析 在 同 一 犯罪 人 涉 嫌 不 同 类 型 案 件 的 问 题 上 有 一 定 的 研 究 ,但 是 这 是 属 于 单 维 关 联 分 析 。 在 现 实 中 , 很 多 情 况下 刑 事 案 件 数
7、据 库 是 关 系 数 据 库 , 要 提 取 的 关 联 规则 是 有 多 个 谓 词 , 属 于 多 个 维 度 和 多 个 层 次 , 这 就 要建 立 多 维 关 联 规 则 模 型 , 来 找 到 犯 罪 的 特 点 和 规 律 。本 文 建 立 了 刑 事 案 件 多 维 关 联 分 析 模 型 , 利 用样 本 数 据 , 详 细 地 描 述 了 整 个 模 型 建 立 过 程 。 首 先 ,进 行 刑 事 案 件 数 据 预 处 理 , 然 后 建 立 案 件 多 维 数 据模 型 概 念 分 层 , 数 据 立 方 体 , 在 此 基 础 上 , 改 进频 繁 谓 词 集 算
8、 法 来 寻 找 频 繁 谓 词 集 , 产 生 强 关 联 规则 , 找 到 犯 罪 的 特 点 与 规 律 。 最 后 , 利 用 大 连 市 公 安局 真 实 数 据 验 证 了 模 型 的 可 用 性 以 及 对 结 果 进 行 了详 细 分 析 。关 联 规 则关 联 规 则 挖 掘 用 于 寻 找 给 定 数 据 集 中 项 之 间 的有 趣 联 系 。 关 联 规 则 的 基 本 问 题 描 述 : 设 , , 是 项 的 集 合 。 定 义 交 易 ( ) 为项 的 集 合 , 并 且 C, 定 义 为 交 易 的 集 合 。 设是 中 若 干 项 的 集 合 , 如 果 C,
9、 那 么 称 交 易 包 含 。 在 项 目 集 中 所 包 含 的 项 的 个 数 成 为 项 目 集的 长 度 。 关 联 规 则 是 形 如 的 蕴 涵 式 , 这 里 C, C, 并 且 0。 规 则 在 交 易 数据 库 中 的 支 持 度 ( ) 是 交 易 集 中 包 含 和 的 交 易 数 与 所 有 交 易 数 之 比 , 记 为 ( ( ) , 即( ) : UC, 6 。 规则 在 交 易 集 中 的 置 信 度 ( ) 是 指 包 含和 的 交 易 数 与 包 含 的 交 易 数 之 比 , 记 为( ) , 即 ( ) : U, 6 : C, 6 。 给 定 一 个交
10、 易 集 , 挖 掘 关 联 规 则 就 是 找 出 支 持 度 和 置 信 度分 别 大 于 用 户 给 定 的 最 小 支 持 度 ( ) 和 最 小 置信 度 ( ) 的 关 联 规 则 。关 联 规 则 的 挖 掘 分 为 两 个 步 骤 。( ) 找 出 所 有 频 繁 项 集 : 根 据 定 义 , 这 些 项 集 出现 的 频 率 至 少 和 预 定 义 的 最 小 支 持 计 数 一 样 。( ) 由 频 繁 项 集 产 生 强 关 联 规 则 : 根 据 定 义 , 这些 规 则 必 须 满 足 最 小 支 持 度 和 最 小 置 信 度 。关 联 规 则 也 有 不 同 的
11、 分 类 , 基 于 规 则 中 处 理 的变 量 的 类 别 , 关 联 规 则 可 以 分 为 布 尔 型 关 联 规 则 和数 值 型 关 联 规 则 。 布 尔 型 关 联 规 则 处 理 的 值 都 是 离散 的 、 种 类 化 的 , 它 显 示 了 这 些 变 量 之 间 的 关 系 , 而数 值 型 关 联 规 则 可 以 和 多 维 关 联 或 多 层 关 联 规 则 结合 起 来 , 对 数 值 型 字 段 进 行 处 理 , 将 其 进 行 动 态 的 分割 , 或 者 直 接 对 原 始 的 数 据 进 行 处 理 , 当 然 数 值 型 关联 规 则 中 也 可 以
12、包 含 种 类 变 量 ; 基 于 规 则 中 数 据 的抽 象 层 次 , 可 以 分 为 单 层 关 联 规 则 和 多 层 关 联 规 则 。在 单 层 的 关 联 规 则 中 , 所 有 的 变 量 都 没 有 考 虑 到 现实 的 数 据 是 具 有 多 个 不 同 的 层 次 的 , 而 在 多 层 的 关联 规 则 中 , 对 数 据 的 多 层 性 已 经 进 行 了 充 分 的 考 虑 ;基 于 规 则 中 涉 及 到 的 数 据 的 维 数 , 关 联 规 则 可 以 分为 单 维 的 和 多 维 的 。 在 单 维 的 关 联 规 则 中 , 只 涉 及到 数 据 的 一
13、 个 维 , 如 用 户 购 买 的 物 品 , 而 在 多 维 的 关联 规 则 中 , 要 处 理 的 数 据 将 会 涉 及 多 个 维 。 换 成 另一 句 话 , 单 维 关 联 规 则 是 处 理 单 个 属 性 中 的 一 些 关系 ; 多 维 关 联 规 则 是 处 理 各 个 属 性 之 间 的 某 些 关 系 。刑 事 案 件 关 联 规 则 模 型!“# 刑 事 案 件 多 维 关 联 规 则 模 型刑 事 案 件 多 维 关 联 规 则 模 型 的 总 体 设 计 , 如 图所 示 :图 # 刑 事 案 件 多 维 关 联 分 析 模 型 的 总 体 框 架( ) 数
14、据 清 理 : 在 进 行 数 据 分 析 挖 掘 之 前 , 只 有保 证 数 据 的 准 确 规 范 , 才 能 得 到 较 好 的 分 析 效 果 。 情 报 学 报 第 卷 第 期 年 月在 公 安 刑 事 案 件 原 数 据 库 中 , 很 多 记 录 不 完 整 , 不 一致 , 还 有 一 些 错 误 的 信 息 , 因 此 这 一 阶 段 要 清 理 所 要关 联 分 析 的 相 关 属 性 值 。 对 于 空 值 和 不 一 致 数 据 ,可 以 采 取 忽 略 元 组 、 人 工 填 写 及 填 充 均 值 等 方 法 进行 处 理 。 在 数 据 大 体 完 整 后 ,
15、需 要 将 要 进 行 关 联 分析 的 属 性 值 转 化 为 规 范 或 者 可 用 的 形 式 , 为 下 个 阶段 建 立 多 维 数 据 模 型 打 下 基 础 。( ) 建 立 多 维 数 据 模 型 : 多 维 关 联 规 则 挖 掘 需 要建 立 多 维 数 据 模 型 。 我 们 首 先 设 计 多 维 数 据 模 式 ,然 后 进 行 概 念 分 层 并 建 立 案 件 多 维 数 据 立 方 体 。建 立 刑 事 案 件 多 维 数 据 模 型 , 这 里 我 们 采 用 的是 星 型 模 式 , 一 个 事 实 表 , 多 个 维 度 表 , 具 体 表 示 形式 如
16、图 所 示 。图 ! 刑 事 案 件 多 维 数 据 模 型 的 星 型 模 式概 念 分 层 是 属 性 的 原 始 值 用 区 间 值 或 较 高 层 的概 念 替 换 。 概 念 分 层 允 许 挖 掘 多 个 抽 象 层 上 的 数据 , 是 数 据 挖 掘 的 一 种 强 有 力 的 工 具 。 在 刑 事 案 件中 , 每 起 案 件 损 失 总 价 值 这 样 的 数 值 属 性 , 我 们 可 以将 其 离 散 化 进 行 概 念 分 层 。 在 总 损 失 数 值 离 散 化时 , 我 们 利 用 概 念 分 层 生 成 的 分 箱 方 法 , 数 据 按 序排 列 , 按
17、照 箱 的 深 度 存 入 箱 中 , 再 进 行 平 滑 处 理 。 对于 时 间 这 样 的 分 类 数 据 , 采 用 自 然 的 年 、 季 度 、 月 、 日等 分 层 的 方 式 , 在 每 一 天 里 面 , 可 以 按 照 小 时 , 上 下午 时 间 段 来 分 层 。 对 于 年 龄 这 样 的 数 据 , 采 取 分 组分 层 的 方 式 , 比 如 为 青 年 , 为 中年 , 为 老 年 等 。数 据 立 方 体 ( ) 是 指 含 有 多 维 属 性 的统 计 实 体 , 允 许 以 多 维 对 数 据 建 模 和 观 察 。 维 是 关于 一 个 组 织 想 要
18、的 记 录 的 透 视 或 实 体 , 事 实 是 数 据的 度 量 。 给 定 一 个 关 联 规 则 挖 掘 任 务 , 其 内 容 涉 及, , 个 维 , 并 根 据 用 户 挖 掘 需 求 确 定 各 维 的维 层 次 。 其 中 每 一 维 包 含 个 数 值 , 是第 维 包 含 的 互 不 相 同 的 维 成 员 个 数 。 前 行 各代 表 中 一 个 互 不 相 同 的 维 成 员 。 最 后 一 行 存 储了 一 个 称 之 为 “ ” 的 维 成 员 , 其 中 记 录 了 它 所 对应 的 维 的 合 计 值 , 这 种 合 计 值 极 大 地 方 便 了 关 联 规
19、则 的 挖 掘 中 支 持 度 的 计 算 。 立 方 体 的 方 格 中 记 录 的是 对 应 维 成 员 的 频 繁 度 量 值 , 记 为 。 这 样 涉 及, , 维 数 据 的 一 个 关 联 规 则 挖 掘 任 务 就 对 应一 个 维 的 数 据 立 方 体 ( , , ) ,其 中 , , 是 立 方 体 的 维 , 是 立 方 体 的 事实 度 量 。( ) 产 生 频 繁 谓 词 集 : 模 型 中 改 进 经 典 算 法 作 为 产 生 频 繁 谓 词 集 的 算 法 , 即 将 扫 描 原 始 事务 表 改 为 扫 描 建 立 好 的 案 件 数 据 立 方 体 。经
20、典 算 法 的 基 本 思 想 是 使 用 一 种 称作 逐 层 搜 索 的 迭 代 方 法 , 使 用 频 繁 项 集 ( 集 合 中含 有 个 项 , 并 且 这 个 项 的 组 合 出 现 的 频 率 高 于预 先 给 定 概 率 值 ) 去 寻 找 频 繁 ( ) 项 集 。 首 先 ,找 出 频 繁 项 集 的 集 合 。 该 集 合 记 作 , 用 于找 频 繁 项 集 的 集 合 , 而 用 于 找 出 , 如 此下 去 , 直 到 不 能 找 到 , 即 频 繁 项 集 。 找 每 个都 需 要 一 次 事 务 表 的 扫 描 。结 合 刑 事 案 件 数 据 的 特 点 ,
21、修 改 后 的 算法 思 想 如 下 :原 始 的 购 物 篮 形 式 只 有 购 买 这 一 个 谓 词 , 可 以把 它 看 成 为 单 个 维 度 , 如 果 出 现 多 个 谓 词 , 比 如 案 件类 型 , 作 案 动 机 , 作 案 手 段 等 , 就 涉 及 到 多 个 维 度 , 这里 我 们 就 可 以 把 谓 词 等 价 于 维 度 , 如 果 进 行 三 个 维度 的 关 联 分 析 , 就 需 要 寻 找 三 个 谓 词 频 繁 地 同 时 出现 在 一 个 规 则 中 , 每 个 谓 词 ( 即 维 度 ) 都 有 不 同 的 值 ,所 有 不 同 谓 词 的 各
22、种 值 的 集 合 可 以 当 作 是 原 始 的 布尔 集 合 , 这 样 , 原 始 寻 找 的 频 繁 项 集 就 改 为 寻 找 频繁 谓 词 集 。 原 始 扫 描 事 务 数 据 库 找 到 项 集 计 数 现 在就 改 为 扫 描 多 维 数 据 立 方 体 找 到 谓 词 集 聚 集 的计 数 。按 照 上 述 思 想 , 经 过 改 进 的 频 繁 谓 词 集 算 法 具体 描 述 如 下 :算 法 : 多 维 频 繁 谓 词 集 算 法 ( 数 据 立 方 体 中 的)输 入 : 维 数 据 立 方 体 ( , , 刑 事 案 件 的 多 维 关 联 分 析 模 型 研 究
23、) , 最 小 支 持 度 输 出 : 频 繁 谓 词 集方 法 : ( ) : !; : !;( ) 维 ( , , ) 的 每 个 维 成 员 组 成 候 选 谓 词 集 记 为 ( ) 生 成 频 繁 谓 词 集 ( )( ) !;( ) ( ; ; ) ) 由 频 繁 ( ) 谓 词 集 经 连 接 剪 枝 生 成 候选 谓 词 集 ( ) 由 候 选 谓 词 集 生 成 频 繁 谓 词 集 ( ) !( ) 输 出 函 数 ( ) 是 指 从 候 选 谓 词 集 中生 成 频 繁 谓 词 集 , 具 体 过 程 :( ) !( ) ( 候 选 谓 词 集 中 每 一 个 候 选 谓
24、词 集( , , ) )“表 示 第 维 上 一 个 维 成 员 ) 支 持 计 数 维 立 方 体 中 ( , , , , , ) 对 应 方 格 中 的 “对 于 候选 谓 词 集 中 不 包 含 的 维 的 维 成 员 用 代 替) ) #!( ) 输 出 函 数 ( ) 是 指 由 频 繁 ( )谓 词 集 经 过 连 接 、 剪 枝 生 成 候 选 谓 词 集 ,具 体 过 程 :( ) !( ) ( 中 任 意 两 个 频 繁 谓 词 集 和) ) ( 和 有 个 项 相 同 ) ( 第项 分 别 是 来 自 不 同 维 的 维 成 员 ) “判 断连 接 条 件“( “连 接#的
25、 所 有 子 集 都 属 于 !) “剪 枝 ( ) 输 出 ( ) 产 生 强 关 联 规 则 : 从 数 据 立 方 体 中 找 到 频 繁谓 词 集 , 由 它 们 产 生 强 关 联 规 则 非 常 方 便 , 因 为 强 关联 规 则 需 要 满 足 最 小 支 持 度 和 最 小 置 信 度 , 现 在 找到 的 频 繁 谓 词 集 已 经 满 足 最 小 支 持 度 , 现 在 要 产 生强 关 联 规 则 就 要 看 它 们 的 置 信 度 。 置 信 度 可 以 用 下式 , 其 中 条 件 概 率 用 谓 词 集 持 度 计 数 表 示 。( $) ( ) ( !) ( )
26、其 中 , ( !) 是 包 含 项 集 !的 事 务 数 , ( ) 是 包 含 项 集 的 事 务数 。 根 据 该 式 , 关 联 规 则 可 以 产 生 如 下 : 对 于 每 个 频繁 项 集 , 产 生 的 所 有 非 空 子 集 。 对 于 的 每 个 非空 子 集 , 如 果 ( ) ( )#, 则 输 出 规 则 “ $( ) ” 。 其 中 , 是 最 小 置 信 度 阈 值 。( ) 模 型 结 果 评 价 : 根 据 实 际 情 况 , 具 体 解 释 模型 得 出 的 结 果 及 专 家 对 结 果 的 评 价 。!“# 具 体 实 例 分 析下 面 我 们 根 据
27、样 本 数 据 ( 因 为 公 安 数 据 并 非 公开 数 据 , 这 样 的 样 本 数 据 与 公 安 刑 事 案 件 相 似 , 但 并非 实 际 数 据 , 只 作 为 演 示 使 用 ) , 具 体 描 述 刑 事 案 件多 维 关 联 规 则 模 型 的 建 立 过 程 见 表 。表 $ 案 件 样 本 数 据 表案 件案 件 类型 ( )作 案 时 间 ( )作 案 区域 ( )教 育 程度 ( )社 会 地位 ( )家 庭 情况 ( )杀 人 : 第 一 区 域 小 学 下 差盗 窃 : 第 三 区 域 初 中 中 下 中抢 劫 : 第 三 区 域 高 中 中 下 中杀 人
28、: 第 一 区 域 初 中 下 差抢 劫 : 第 五 区 域 高 中 中 中 中盗 窃 : 第 三 区 域 小 学 中 下 中强 奸 : 第 四 区 域 高 中 下 差盗 窃 : 第 五 区 域 高 中 中 中 中杀 人 : 第 一 区 域 初 中 下 差盗 窃 : 第 五 区 域 高 中 中 中 中( ) 数 据 清 理 : 样 本 数 据 中 , 取 条 记 录 , 设 定记 录 完 整 , 不 需 要 进 行 其 他 清 理 。 但 是 这 个 例 子 中我 们 涉 及 作 案 时 间 , 需 要 具 体 的 时 间 值 , 因 此 需 要 去除 年 月 日 。( ) 概 念 分 层 :
29、 通 过 样 本 数 据 分 析 , 案 件 类 型 为分 类 属 性 , 即 分 为 杀 人 , 盗 窃 , 抢 劫 , 强 奸 ; 作 案 区 域 情 报 学 报 第 卷 第 期 年 月为分类属性,包括第一、二、三、四、五区域;作案时间按照模式分层,分为年,季,月,日,小时概念分层,为了方便演示,这里我们只取小时段这个概念层。具体概念分层和标号替代如下:作案时间每 小时为一个时间段(如 : : ; : : ,: : , : : , : : , : : );案件类型(如杀人 ;盗窃 ;抢劫 ;强奸 );作案区域(第一区域 ,第二区域 ,第三区域 ,第四区域 ,第五区域 )( )数据立方体的产
30、生:我们选取样本数据中的案件类型,作案时间,作案区域为立方体的三个维度,根据我们已经进行的概念分层,可以建立如图 所示的数据立方体。图 ! 案件数据立方体给定一个维的集合,我们可以构造方体格,每个在不同的汇总级或根据维的不同子集显示数据。方体格称作数据立方体。图 给出了定义维案件类型、作案时间、作案区域的数据立方体的方体格。图 “ 案件数据立方体的方格体每个以 ! 方体都有一个数据表,最后一个字段属性为 ,可以得到 方体数据表 。表 # 案件数据立方体的数据表案件类型维 作案时间维 作案区域维 ( )频繁谓词集的产生:我们利用样本数据,解释模型中设计的多维频繁谓词集算法如何寻找频繁谓词集。样本
31、数据集:(假定最小支持计数为 ) , , , , , , , , , , , , , , , , , , , 刑事案件的多维关联分析模型研究 情 报 学 报 第 卷 第 期 年 月( ) 由 频 繁 谓 词 集 产 生 案 件 关 联 规 则 : 根 据 前 面模 型 中 的 产 生 强 关 联 规 则 方 法 , 我 们 看 一 下 是 如 何从 样 本 数 据 中 产 生 强 关 联 规 则 , 具 体 描 述 如 下 :根 据 上 面 样 本 数 据 的 找 到 的 频 繁 谓 词 集 , , , , , 的 非 空 子 集 有 , , , 的 非 空 子 集 有 , , , 因 为 ,
32、 我 们 只 要 找 到 作 案 时 间 、 作 案 区 域 推 导 案件 类 型 的 关 联 规 则 , 所 以 选 取 部 分 子 集 提 取 关 联 规则 如 下 , 每 个 都 列 出 置 信 度 。!“!“如 果 最 小 置 信 度 阈 值 为 , 这 两 条 规 则 都 可以 输 出 , 都 为 强 关 联 规 则 。( ) 产 生 结 果 评 价 : 根 据 样 本 数 据 输 出 的 强 关 联规 则 可 以 得 出 : : : , 第 一 区 域“杀 人 ( , ) : : , 第 三 区 域“盗 窃 ( , ) 即 在 : : , 第 一 区 域 经 常 发 生 杀 人 案
33、件 , 在 : : , 第 三 区 域 经 常 发 生 盗 窃 , 对 这两 段 时 间 , 两 个 区 域 应 该 加 强 防 范 。试 验 结 果我 们 以 大 连 市 公 安 局 提 供 的 数 据 , 选 取 甘 井 子区 从 年 的 条 记 录 , 按 照 本 文 所 建立 的 关 联 分 析 模 型 , 选 择 案 件 类 型 、 手 段 、 处 所 、 动 机这 四 个 维 度 进 行 关 联 分 析 , , , 得 到 的 结 果 如 下 :频 繁 谓 词 集 :入 室 盗 窃 案 , 窗 口 钻 入 , 居 民 住 宅 , 图 财 ( 支 持度 )入 室 盗 窃 案 , 事
34、先 踩 点 , 居 民 住 宅 , 图 财 ( 支 持度 )入 室 盗 窃 案 , 物 色 对 象 , 居 民 住 宅 , 图 财 ( 支 持度 )强 关 联 规 则 :入 室 盗 窃 案 , 图 财 , 事 先 踩 点 ( )#居 民 住 宅入 室 盗 窃 案 , 图 财 , 物 色 对 象 ( )#居 民 住 宅入 室 盗 窃 案 , 居 民 住 宅 , 物 色 对 象 ( )#图 财入 室 盗 窃 案 , 居 民 住 宅 , 窗 口 钻 入 ( )#图 财入 室 盗 窃 案 , 居 民 住 宅 , 事 先 踩 点 ( )#图 财那 么 大 体 上 可 以 看 出 , 入 室 盗 窃 案
35、, 动 机 是 图财 , 手 段 选 择 事 先 踩 点 的 有 发 生 在 居 民 住 宅 ,入 室 盗 窃 案 , 动 机 是 图 财 , 手 段 选 择 物 色 对 象 的 有发 生 在 居 民 住 宅 , 入 室 盗 窃 案 , 发 生 在 居 民 住宅 , 手 段 是 物 色 对 象 , 那 么 就 是 为 了 图 财 , 入 室盗 窃 案 , 发 生 在 居 民 住 宅 , 手 段 是 窗 口 钻 入 , 就是 为 了 图 财 , 入 室 盗 窃 案 , 发 生 在 居 民 住 宅 , 手 段 是事 先 踩 点 , 就 是 为 了 图 财 。也 就 是 说 入 室 盗 窃 案 多
36、数 为 了 图 财 , 会 选 择 居民 住 宅 , 手 段 经 常 是 物 色 对 象 , 事 先 踩 点 , 窗 口 钻 入 。那 么 知 道 哪 个 月 份 经 常 发 生 什 么 类 型 的 案 件 ,动 机 都 是 什 么 , 作 案 的 处 所 都 选 择 哪 里 , 可 能 对 公 安工 作 有 一 定 的 帮 助 。 所 以 , 我 们 选 择 时 间 维 度 , 具 体的 实 验 结 果 :频 繁 谓 词 集 : 入 室 盗 窃 案 , 居 民 住 宅 , 物 色 对 象 ,第 二 季 度强 关 联 规 则 : 入 室 盗 窃 案 , 居 民 住 宅 , 第 二 季 度#物
37、色 对 象 因 为 涉 及 时 间 , 我 们 可 以 利 用 频 繁 谓 词 集 找 到犯 罪 的 规 律 , 入 室 盗 窃 案 , 居 民 住 宅 , 物 色 对 象 , 第 二季 度 这 几 个 总 是 同 时 出 现 , 也 就 是 说 甘 井 子 区 , 每 年在 第 二 季 度 经 常 在 居 民 住 宅 发 生 入 室 盗 窃 案 , 手 段一 般 都 是 物 色 对 象 , 再 看 这 个 强 关 联 规 则 的 置 信 度为 高 达 , 也 证 明 规 律 的 可 靠 程 度 。总 结试 验 中 , 我 们 要 挖 掘 作 案 规 律 , 所 以 选 择 的 时 间和 案
38、件 类 型 、 手 段 、 处 所 、 动 机 等 维 度 。 在 以 后 的 应用 中 , 如 果 从 不 同 的 角 度 出 发 , 选 择 合 适 的 维 度 , 多次 挖 掘 比 较 结 果 , 这 样 可 能 会 发 现 更 多 的 潜 在 规 律 。比 如 选 择 案 件 类 型 和 损 失 值 , 可 能 会 发 现 作 案 者 作案 心 理 方 面 的 特 点 ; 选 择 损 失 值 与 年 龄 这 个 两 个 维度 , 可 能 发 现 受 害 人 的 防 范 意 识 如 何 ; 如 果 选 择 年 龄与 案 件 类 型 等 维 度 , 有 可 能 会 发 现 犯 罪 是 否
39、趋 于 低龄 化 。另 外 , 最 小 支 持 度 与 最 小 置 信 度 是 关 联 规 则 挖 刑 事 案 件 的 多 维 关 联 分 析 模 型 研 究掘 的 关 键 参 数 , 会 直 接 影 响 挖 掘 结 果 的 质 量 , 因 此 需要 公 安 刑 事 案 件 的 一 线 人 员 或 者 很 有 经 验 的 人 员 与技 术 人 员 或 者 领 域 专 家 共 同 来 确 定 。试 验 中 得 到 的 挖 掘 结 果 不 仅 有 一 般 意 义 的 规律 , 也 有 一 些 比 较 有 价 值 的 规 律 , 这 些 结 果 验 证 了 本文 建 立 的 刑 事 案 件 多 维
40、关 联 模 型 的 正 确 性 与 有 效性 。 将 数 据 挖 掘 关 联 分 析 应 用 在 公 安 工 作 中 , 可 以改 变 公 安 系 统 信 息 只 入 不 出 的 现 状 , 会 对 公 安 部 门起 到 了 一 定 的 预 警 作 用 , 也 会 起 到 一 定 的 辅 助 决 策作 用 。参 考 文 献 金 光 , 刘 士 荣 , 李 荣 茜 , 张 新 峰 数 据 挖 掘 技 术 在 犯 罪行 为 分 析 中 的 应 用 宁 波 大 学 学 报 ( 理 工 版 ) , ( ) : , , , : , 方 旺 盛 , 郑 剑 , 邵 利 平 基 于 多 维 关 联 规 则
41、的 算 法 研究 及 系 统 实 现 计 算 机 与 数 字 工 程 , , ( ) : , , , : , , , , : 高 学 东 , 王 文 贤 , 武 森 基 于 数 据 立 方 体 的 多 维 关 联 规则 的 挖 掘 方 法 计 算 机 工 程 , , ( ) : , , ( 责 任 编 辑 王 建 平 ) 情 报 学 报 第 卷 第 期 年 月刑事案件的多维关联分析模型研究作者: 王雪华, 张旭娟, 王春雨, Wang Xuehua, Zhang Xujuan, Wang Chunyu作者单位: 大连理工大学管理学院,大连,116024刊名: 情报学报英文刊名: JOURNAL
42、 OF THE CHINA SOCIETY FOR SCIENTIFIC ANDTECHNICAL INFORMATION年,卷(期): 2008,27(3)被引用次数: 3次参考文献(7条)1.金光;刘士荣;李荣茜;张新峰 数据挖掘技术在犯罪行为分析中的应用期刊论文-宁波大学学报(理工版)2002(03)2.Agrawal R;Imielinski T Mining association rules between sets of items in large databases 19933.Jiawei Han;Micheline Kamber Data mining concepts
43、and techniques 20014.方旺盛;郑剑;邵利平 基于多维关联规则的算法研究及系统实现期刊论文-计算机与数字工程 2004(04)5.Gray J;Bosworth A;Layman A Data cube:A relational aggregation operator generalizing group-by,cross-tab,and sub-totala 19966.高学东;王文贤;武森 基于数据立方体的多维关联规则的挖掘方法期刊论文-计算机工程 2003(14)7.Agrawal R;Srikant R Fast algorithms for mining asso
44、ciation rules 1994本文读者也读过(4条)1. 冯璐 基于数据挖掘技术的犯罪规律分析研究学位论文20092. 王春雨.王雪华.张旭娟.王延章.Wang Chunyu.Wang Xuehua.Zhang Xujuan.Wang Yanzhang 刑事案件的多层关联分析模型研究期刊论文-情报学报2011,30(1)3. 许兆霞.王磊.林勇.李树彬.张晓波.XU Zhao-xia.WANG Lei.LIN Yong.LI Shu-bin.ZHANG Xiao-bo 基于数据挖掘技术的交通流数据分析研究期刊论文-淮海工学院学报(自然科学版)2009,18(1)4. 夏颖.王哲.王胜和.程琳.XIA Ying.WANG Zhe.WANG Sheng-he.CHENG Lin 刑事案件信息数据库中的关联规则分析期刊论文-电脑知识与技术2009,5(35)引证文献(3条)1.王春雨.王雪华.张旭娟.王延章 刑事案件的多层关联分析模型研究期刊论文-情报学报 2011(1)2.王春雨.王延章.叶鑫.王雪华.王娜 基于数据仓库的刑事案件决策支持系统设计期刊论文-计算机工程与设计2010(4)3.朱恒民.施琴芬.黄卫东.苏新宁 面向案例的隐性知识挖掘方法研究期刊论文-情报学报 2010(6)本文链接:http:/