收藏 分享(赏)

离散数学ch7[e1]概念格.ppt

上传人:无敌 文档编号:24870 上传时间:2018-03-04 格式:PPT 页数:27 大小:274KB
下载 相关 举报
离散数学ch7[e1]概念格.ppt_第1页
第1页 / 共27页
离散数学ch7[e1]概念格.ppt_第2页
第2页 / 共27页
离散数学ch7[e1]概念格.ppt_第3页
第3页 / 共27页
离散数学ch7[e1]概念格.ppt_第4页
第4页 / 共27页
离散数学ch7[e1]概念格.ppt_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、离 散 数 学 第 二 部分 集 合论 关系论 概念格 主要内容 一 形式概念分析的基本概念 和特点 二 概念格的基本概念和特点 三 建格基 本算法 简介( 流程和 策略层 面) 四 概念格 和模糊 聚类之 间的关 系(简 介) 一 形式概念分析的基本概念和特点 1. 形式概念分析简介 R. Wille 教授于1982年首先提出了形式概念分 析(Formal Concept Analysis) 。 FCA 以序论(Order Theory) 尤其是以完全格理论 (the Theory of Complete Lattice) 为基础 概念 被理解为由 外延 和 内涵 两个部分 所组成 的 思想

2、单元。 FCA 中的一种重要关系: 超概念 和 子 概念 形式概念间通过 泛化/ 例化 关系相互关联 构成了 一种层次结构,就是概念格。 概念格通过Hasse图生动和简洁地体现了这些概 念之间的泛化和特化关系。 在机器学习、信息检索、数字图书馆 、软件 工程 和知识发现等方面得到了广泛应用。 2. 形式背景基本概念 定义1: 形式背景定义为一个三元组 K = (G, M, I) ,其中, G 是对象集合(Objects) ,M 是属性集合 (Attributes) ,I G M 是 G 与 M 之间的一个 二元关系。若(g, m) I ,读作“对象 g 具有属 性 m” 。 二 概念格的基本概

3、念和特点 定义2 : 对对象集合的每个子集 A G ,定义导出算子 (A) 求出集合 A 中所有对象的共有属性: 对称地,对属性集合的每个子集 B M ,定义导 出算子 (B) 求出具有集合 B 中所有属性的对象 的集合: 通常,为书写方便,这两个导出算子 小加区 分地 写为A 和B 。 定义3 : 形式背景 K = (G, M, I) 上的一个 形式概念(Formal Concept) (简称概念Concept )定义为一个二元组 (A, B) ,满足:A G, B M, A = B, B = A 其中,A 称为概念(A, B)的外延,B 称为概念(A, B) 的内涵。 偏序集合 定义偏序集

4、合 全部概念构成一个集合 定义集合上的偏序关系 (L,) 构成一个偏序集合 定义4 : 对某形式背景的任何两个形式概念(A1, B1) 和(A2, B2) , 定义(A1, B1) 和(A2, B2) 的最大公共子概念 : (A1, B1) (A2, B2): = (A1 A2, (B1 B2) 定义(A1, B1) 和(A2, B2) 的最小公共超概念 : (A1, B1) (A2, B2): = (A1 A2), B1 B2) 通常,将 “最小公共超概念 ”称为上确界,将 “ 最大公 共子概念 ”称为下确界。 每个概念集合都有一个上确界和一个下确界。因此, 概 念格是一个完备格 。 2.

5、Hasse 图 Hasse 图既是通过描述概念之间的泛化/ 例 化关系,形象表示出概念格,是概念 格的一 种可视化。 一个形式背景的例子 三 建格基本算法简介 生成概念格的算法可以被 分两类: 批处理算法(Batch Algorithm) 渐进式生成算法(Incremental Algorithm ) 1. 批处理算法(Batch Algorithm) 批处理概念格生成算法大多都是先生 成出形 式背景所对应的所有概念,然后再决 定概念 之间的子概念 超概念连接关系。 目前主要的批处理算法有:Chein 算法Che69, Ganter 算法Gan84 ,Alaoui 算法A1a92. Titan

6、ic 算法Stu00 , Nourine 算法Nou99 以 及Bordat 算法Bor86 和Lindig 算法Lin00 等。 一般概念格的批生成算法: 对于形式背景K= (G, M, I): (1) 初始化格L=(G),f(G); (2) 队列F=(G ,f(G) ; (3) 对于队列F 中的一个概念C , 产生出 它的每 个 子概念Cc; (4) 如果某个子概念Cc 以前没有产生过, 则加入 到L 中; (5) 增加概念C 和其子概念Cc 的链接 关系; (6) 反复(3)(5) ,直至队列F 为空; (7)输出概念格L 。 渐进式生成算法(Incremental Algorithm

7、) 概念格的渐进式生成算法,从空格开 始,通 过不断的渐增形式背景中的对象来实 现对概 念格的渐进式构造。 目前主要的渐进式算法有:Godin 算 法, Capinato 算法 一般概念格的渐进式生成 算法: 对于形式背景K= (G, M, I): (1) 初始化格L 为一个空格; (2) 从G 中取一个对象g: (3) 对于格L 中的每个概念C1=(A1, B1) ,如果B1 f(g) ,则把g 并到A1 中; (4) 如果同时满足:B1f(g); B1f(g) B1 和不存在 (A1, B1) 的某个父节点(A2, B2) 满足B1f(g) B2 ,则要产生一个 新节点; (5) 对新产生

8、的节点加入到L中,同时调整节点之间的链接关系; (6) 反复(2)(5) ,直至形式背景中的对象处理结束; (7) 输出概念格L 。 部分建格算法 考虑到在实际运用中,建立一个全局的概念格,在时 间和空间上都有巨大的开销,因此,对某一个 核心概 念(Focus Concept )为核心,构建其周围的与之相 关的概念节点,成为目前很多系统运用概念格的主流 思路。 部分建格的算法与上面所介绍的算法类似,也是先生 成概念,但构建Hasse 图时,仅仅与有限的几个概念 连接即可。 典型的NearestNeighbours 算法 四 概念格和模糊聚类之间的关系 1. 主要运用场合 传统的聚类方法主要运用在对抽象数 据之间 的数学划分; 概念格主 要运用到 用户兴趣 建模,推 荐系统, 软件工程等等;上述领域是传统聚类 方法很 难运用。 2. 概念格的优点和局限 优点: 传统的聚类方法无法解释类之间的概 念区 别与联系,对聚类结果的有意义的内 涵描 述较差; 概念格具有完整地表达数据库中知识 的特 点,而且知识表达形式清晰,易于求 解。 局限: 概念格庞大的结构,需要 建格算 法的更 高 效; 概念格的运用模式,与自 然语言 处理的 结 合。 常食用 羽毛 飞翔 鱼类 鸭 鸟类 一个概念格的例子 鱼,鸭,鸟 鱼,鸭 鸭,鸟 鸟 鸭 羽,飞 食,羽,飞 食,羽 羽 食

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 职业教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报