1、F. Liu数据挖掘技 术 Chp.4第 4章 信息分析的基本技 术Dept. of E-Commerce, School of Information, Xian University of Finance and Economics, Xian, ChinaData Mining躇坎停林坛挨金鄂卡录燎遏傲器虑腕何餐性铝札天苔紫豹盔碱拎舷纺乱辰数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 4章 信息分析的基本技 术v 理解智能代理、群体智能、小波分析、分形技 术 分析的基本思想,了解 联 机分析 OLAP的基本概念、体系 结 构和 处 理的特性;掌握 OLAP多 维 数据 结
2、构与 OLAP的分类 ;掌握 OLAP的多 维 数据分析方法;了解 OLAP的 发展与流行的 OLAP工具 选择 ;理解粗糙集理 论 的基本概念;了解粗糙集理 论 理 论 基 础 以及粗糙集在信息分析中的特征表示。v4学 时v 本 讲 主要内容 1、信息分析技 术 的基本技 术 有哪些? 2、什么是智能代理,有何 应 用? 3、 OLAP及其 应 用是怎 样 的? 4、 Rough的信息分析技 术 的特点是什么?卢务厢愁痊舅寺幅兢幽彪剖蹦丝惊悠忧截划塘罢疾漫浊挤吧射亨评腥扮卵数据挖掘技术2009Chp4数据挖掘技术2009Chp4Contents联 机分析自 动 信息分析的基本技 术1Roug
3、h的信息分析技 术32裹苹柏实荚就门驻扛碍彩伪颠柄浇焦踌胀菱厘琼穿倦钒鹃拌涂领概得柒英数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 信息分析技 术 的不同方面与 层 次分 类 v 基本技 术v 智能代理v 群体智能v 小波分析v 分形技 术釜苦列茹鸦殴洁辛买日蛔拈井害匹遏元庸姥甜毒运喜略庆俞忱蛙琴季乖峨数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 智能代理( Agent) v 信息 过载 与 资 源迷向 v 面 对 众多网上信息大量的可用信息与用 户对 信息的 驾驭 能力形成 强 烈的反差:
4、v 主 动 送上 门 的或已 经 下 载 的信息 难 以消化 ,即所 谓 的 “信 息 过载 “; v 用 户 不知道如何确切表达 (目前技 术 也并没有提供合适 的表达手段 )对 真正想要的网上 资 源的需求 ,也不知道如 何更准确、有效地 寻 找 资 源 ,即所 谓 的 “资 源迷向 ”。v 最 终 用 户 盼望出 现v 一些能 够协 助其消化、 寻 找所 需信息的 软 件 “助手 “v 一些以向最 终 用 户 提供信息服 务为 目的的商家自然也 希望手握 “利器 ”,把信息 过载 和 资 源迷向 问题 消除在他 们 的服 务 体系之中 ,使其用 户 不再 产 生上面所 说 的困惑 , 从
5、而在同行 业 的 竞 争中占据有利地位。崔蕉显扎剁奎师妆输苗段县抗祟盖熔董浆逊危御帕骤盅痊梢财绍益岩要玩数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 智能代理( Agent) v 是一种在 计 算机网 络 上无疲 劳 工作、 执 行重复性、可 预 料任 务的 为 人 们 建立知 识 的 软 件包。v 定 义 : Agent的 设计 是用来完成某 类 任 务 的,能在一定 环 境中自主 发挥 作用、有生命周期的 计 算 实 体。 Agent 是一种抽象 实体,它能作用于自身和 环 境,并能 对环 境做出反映,具有知 识、目 标 和能力。vAge
6、nt,它是代表用 户 或其他程序 ,以主 动 服 务 的方 式完成一 组操作的机 动计 算 实 体。v 主 动 服 务v 主 动 适 应 ,即在完成操作的 过 程中 ,它可以 获 得、表示 并在以后的操作中利用关于操作 对 象的知 识 以及关于 用 户 意 图 和偏好的知 识 ; v 主 动 代理 ,即 对 一些任 务 无 须 用 户发 出具体指令 ,只要 当前状 态符合某种条件 ,就可代表用 户 或其他程序完成 相 应 的操作。v 机 动 :在所 处 的 计 算 环 境中灵活的 访问 和迁移机制 ,以及同其它智能 Agent通信和 协 作的机制。v 广 义 的智能 Agent :包括人 类
7、、物理世界中的移 动 机器人和信息世界中的 软 件机器人。v 狭 义 的智能 Agent : 则专 指信息世界中的 软 件机器人。它是代表用 户 或其 他程序 ,以主 动 服 务 的方式完成一 组 操作的机 动计算 实 体。电幸恬缴炙掖帐邵话俯惟畦免邯慷蛾鸽赋账翔系期派松炊光愚抓伐保确卞数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 智能代理( Agent) v 智能代理具有 长 期性、半自 动 化、参与活 动 ,且具有适 应 性,技 术 的特性有:v 代理性 (Agent)v 它是 “代表用 户 “工作的 ; v 可以把其他 资 源包装起来
8、,引 导 并代替用 户对这 些 资 源 进 行 访问 ,成 为 便于通达 这 些 资 源的枢 纽 和中介。 v 智能性 (Intelligence) 在 这 方面 ,智能 Agent可以做很多有高技 术 含量的工作。 例如 ,理解用 户 用自然 语 言表达的 对 信息 资 源和 计 算 资 源的需求 ;帮助用 户 在一定程度上克服信息内容的 语 言 障碍 ;捕捉用 户 的偏好和 兴 趣 ;推 测 用 户 的意 图 并 为 其代 劳 ;等等。v 自主性 (Autonomy): 一个智能 Agent应该 是一个独立自主的计 算 实 体。它 应 能在无法事先建模的、 动态变 化的信息 环 境中 ,独
9、立 规 划复 杂 的操作步 骤 ,解决 实际问题 ,在用 户 不参与的情 况下 ,独立 发现 和索取符合用 户 需求的可利用 资 源与服 务 。最近J.McCarthy等人正在探 讨 如何构造能 对 自身 状 态 有所感知的智能 Agent。v 机 动 性 (Mobility) :在网 络计 算 环 境下 ,一个 Agent可以看成是代表用 户驻 网 络 的常 设 机构 ,它可以在网 络 上灵活机 动 地 访问 各种 资 源和服 务 ,还 可以就完成特定任 务 同其他智能 Agent 进 行协 商和合作 ,甚至把自己 “迁移 “到网 络 中的其他主 机上去 执 行任务 。 这样 的 “精灵 “
10、在网 络 上游弋 ,是 对 网 络 安全性、个人 隐 私性和管理方面的巨大挑 战 。哗爱故曙舅徽您甫帮庄资诱携磅篱对佛妓猎愤魄剿救欧邀伴跪皖甘僵灵蕾数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 智能代理( Agent) v 智能 Agent战 略:智能 Agent战 略的 发 展 ,据分析将会遵循 “增 值竞 争力提高生存必需 ”这样 一个 “三 部曲 ”式的 发 展 历 程。v 最初是 给 一些常 规 Agent注入一些高附加 值 的 人工智能技 术 ,以此来提高同 业竞 争力 ;v 然后是集成化地 应 用智能技 术 的智能 Agent产
11、品的大规 模普及 ; v 最后是在相 应领 域不采用智能 Agent技 术 的 产 品将会在生存上受到威 胁 。vAgent Vs AIv传统 的人工智能系 统 如 专 家系 统 等 ,具有一 定的智能性,但其他方面同智能 Agent差距 较 大。v 常 规 的 Agent可以代替用 户 完成 简单 的操作 , 具有一定的代理性 ,有的也具 备 一定的机 动 性 ,但缺乏起 码 的智能性和自主性 ,都不属于 我 们 所 讨论 的智能 Agent。只有代理性、智 能性、自主性和机 动 性均达到相当水准的 系 统 才有条件称 为 智能 Agent。荤距砷伤衫茸瞪概乳蔡团季葱过釜戈板顿别去秸吊函髓郭
12、锣塌姻力片呸褂数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 智能代理( Agent) v 智能 Agent在信息服 务 中的 应 用v 信息服 务 是最广大的用 户 群接触网 络环 境的首要渠道。v对 于信息内容已 经 相当丰富的英 语 文化圈 来 说 ,进 一步提高信息服 务 的 质 量 ,改 变 目前信息服 务 中存在的 “信息 过载 ”和 “资 源迷向 ” 的状况 ,是信息服 务业 所面 临 的最 紧 迫的任 务 。v 用于信息服 务 的智能 Agent主要完成以下功能v导 航 ,即告 诉 用 户 所需要的 资 源在哪里 ; v 解惑
13、,即根据网上 资 源回答用 户 关于特定主 题 的 问题 ; v过滤 ,即按照用 户 指定的条件 ,从流向用 户 的大量信息中 筛选 符合条件的信息 ,并以不同 级别 (全文、 详细 摘要、 简单 摘要、 标题 )呈 现给 用 户 ; v 整理 ,即 为 用 户 把已 经 下 载 的 资 源 进 行分 门别类 的 组织 ;5发现 ,即从大量的公共原始数据 (比如股票行情等 )中 筛选 和提 炼 有价值 的 信息 ,向有关用 户发 布。 v这 些都是使信息服 务 走向个性化主 动 服 务 不可缺少的功能。目前在此方面已 经 有了一些能 够 使用的系 统 ,但智能化的 程度 还远远 不 够 ,且主
14、 动 有余 过滤 不足已 经 造成了一些 负 面的影响 ,亟待尽快 发 展更先 进 的人工智能技 术 予以解决。搭破毁介叮挡呵产形突稍肠痈洱晃泥截鲜羌幂氢泥羞剩佰讥扎又脱模谅绵数据挖掘技术2009Chp4数据挖掘技术2009Chp4第 1节 自 动 信息分析的基本技 术v 智能代理( Agent) v 智能 Agent在系 统 与网 络 管理中的 应 用v计 算机系 统 本身的 资 源量就非常巨大。尽管目前那些精通系 统资 源的系 统 管理 员 仍 然受到尊敬 ,但系 统 管理的整个 趋势 正在朝 着 “傻瓜化 ”的方向 发 展 ,其中很大一部分原 来由系 统 管理 员手工干的事情 ,现 在已
15、 经 由 计 算机代管了。v 系 统 管理的界面 变 得更加友好 ,在系 统 本身 的复 杂 性不断提高的情况下 ,驾驭 系 统资 源 的复 杂 性反而在不断降低 ,代管系 统 的自主 性也在逐步提高。v 在网 络 管理方面 ,随着 Client/Server计 算成 为 主流 , 完成固定功能的 Agent的存在和 应 用已 经 成 为 事 实 ,分布在不同 设备 上 “监视 ”设备 状况 ,并随 时 向主 机 报 告数据的 Agent,已 经 是当今网管系 统 中很平 常的一部分了。v 但是 , 这 些从事部分系 统 /网 络 管理的 Agent目前 还 不能称 为 “智能 Agent”,它 们 的智能化程度仍然有待提高。即使作 为 非系 统/网 络 管理 员 和操作 员 的用 户 ,也会有 为 系 统 和网 络设 定常 规 服务 、向系 统 和网 络预约 特殊服 务 的需要 ,智能 Agent是 满 足 用户这 种需要的最合适的帮手。盟疫融狙砖所鼻沟黔洲段文说栓嗡阜葛访玄榔红表胡爬航良筐蘑宋智曰斡数据挖掘技术2009Chp4数据挖掘技术2009Chp4