收藏 分享(赏)

DBpedia说明文档.doc

上传人:精品资料 文档编号:10049423 上传时间:2019-10-01 格式:DOC 页数:10 大小:181.25KB
下载 相关 举报
DBpedia说明文档.doc_第1页
第1页 / 共10页
DBpedia说明文档.doc_第2页
第2页 / 共10页
DBpedia说明文档.doc_第3页
第3页 / 共10页
DBpedia说明文档.doc_第4页
第4页 / 共10页
DBpedia说明文档.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、DBpedia 知识库说明文档摘要 在现有的语义网项目架构中,基于关联数据形式的知识库项目往往处于整个语义网络的核心,如何对于这些知识库的知识内容进行组织、储存和查找就成为了决定整个语义网络运行效率的关键因素。在目前的关联数据知识库项目中,DBpedia 是较为典型且成熟的一个,DBpedia 网站使用本体的方法来对其条目内容进行组织和存储。一、DBpedia 本体的类和条目属性分析根据斯坦福大学医学院发本体的构建七步法,构建本体有如下七个步骤:(1 ) 确定本体的专业领域与范畴(2 ) 考察复用现有本体的可能性(3 ) 列出本体中的重要术语(4 ) 定义类和类的等级关系(5 ) 定义类的属性

2、(6 ) 定义属性的分面(7 ) 创建实例但以上所述的七步法仅适用于某一专业或学科领域本体的构建。在 DBpedia 知识库一例中,由于所需要构建本体的是维基百科条目,因此其专业领域与范畴无法简单确定,因此在 DBpedia 的本体构建中,采用了类似于以叙词表为基础的自动化本体转换的方式。但同样的,维基百科的词条表并非规范的叙词表,其类目划分也无法简单归于某一专业分类之下,词语的专指度不可避免的出现不足,因此,在 DBpedia 的本体构建中,类目划分和定义基本是人工完成,之后的条目转换才使用了自动转换的方式。1.1 DBpedia 类共有属性分析本体的体系结构主要包括 3 个要素:核心元素集

3、、元素间的交互作用以及这些元素到规范语义间的映射关系。对于本体的一般构造过程,可以用以下公式进行表示:本体 = 概念( Concept) + 属性( Property) + 公理( Axiom) + 取值( Value) + 名义( Nominal)从以上的一般公式中,我们还可以归纳出本体当中的基本关系类型,共有四类:(1 ) part-of 关系,表达概念之间部分和整体的关系(2 ) kind-of 关系,表达概念之间的集成关系(3 ) instance-of 关系,表达概念的实例和概念之间的关系(4 ) attribute-of 关系,表达某个概念是另一个概念的属性由于 DBpedia 知

4、识库的本体从分类上属于知识本体,因此在类和条目的属性设置上需要体现以上四种关系。如图 1 所示,DBpedia 的类除了名称这一唯一标示之外,还有如下共有属性:图 1 DBpedia 类属性实例(1 ) Type 属性,类型是类与条目的根本性区分,以图中Film这个类为例,它的类型属性值是Class ,而该类下属的具体电影条目的属性则是Film 。(2 ) Istypeof 属性,这一属性列出了该类下属的所有条目(3 ) SubclassOf 属性,这一属性表明该类的上级类(4 ) IsSubclassOf 属性,这一属性表明该类的下级类(5 ) Sameas 属性,这一属性值指向一个 URI

5、,其中说明了所有跟该类同义的词语以上是 DBpedia 本体类的五个共有属性,从该属性定义中可以看出,由于条目数量多,类目归属复杂,DBpedia 类的属性定义较为简单。但仍能体现概念之间的关系。此外,由于名称的复用可能存在,因此 DBpedia 类和条目的属性命名匹配规则都较为严苛。仍以图中 Film 类为例,当以 film 为索引词查找该类时,无法直接得到反馈结果。由于 DBpedia 的使用用户生成内容较为随意,在创建本体时为类和条目添加了 Sameas 属性,以反映不同名称的同一事物。1.2 DBpedia 条目属性分析在 DBpedia 本体体系当中,条目与类是两种不同属性的概念。简

6、单的区分而言,DBpedia 本体体系中的条目相当于一般本体体系中的概念、属性和取值的集合,三者共同描述某种客观事物,而类则相当于一般意义上的分类概念,并不指代某种具体事物,而是一类事物的共有概念。因此,DBpedia 本体的条目属性除了表明其与类和其他概念的关系和联系之外,还根据其所属的类拥有各自独特的属性。图 2 DBpedia 条目属性实例从实例条目中,DBpedia 条目所共有的关系属性仅有一条,即:(1 ) Type,如类属性,在不同的本体语言下其 Type 定义不同。在 DBpedia 本体语言下,条目的 Type 属性是其所有上级类。如例所示,该条目所描述的运动员从属于“运动员”

7、 、 “花样滑冰运动员”和“人”三个类,因此其 Type 属性在DBpedia 本体语言下有三个值。而根据其从属类的不同,DBpedia 本体体系中的条目拥有独特的用以说明其概念的属性,如上例的运动员有“出生年月” 、 “性别”等属性。1.3 DBpedia 本体属性设置的评析从实例分析中,不难看出,DBpedia 的本体设计和构建符合以上本体构建原则。尽管由于原维基百科的条目存在重名,以及单个概念在不同领域的不同含义等问题,但在DBpedia 本体的构建过程中,以名称为区分条目和类的最根本区别。使用了添加后缀等命名规则来区分在原维基百科条目中重名条目。同时,针对不同类或条目所涉及的不同概念,

8、合理的添加了能够反映其概念特质的属性。同时,针对不同本体语言,DBpedia 还对同一属性做了不同取值,这样在使用和查询的过程中,能够用多种本体语言对 DBpedia 知识库的数据内容进行查找。2. DBpedia 本体结构分析基于 DBpedia 类和条目的属性,DBpedia 本体的结构较为简明,规则大致如下:(1 ) 以“事物(Thing) ”这一概念来总括描述 DBpedia 本体中所涉及到的所有客观事物。(2 ) 事物(Thing)类下分有不同的子类,每一个子类都可以有它自己的子类(3 ) 条目用以描述具体的事物,从属于某个类和它的全部上级类2.1 DBpedia 本体结构表游戏 活

9、动运动 动脉 骨骼 脑 胚胎 淋巴 肌肉 神经 解剖结构静脉 奖杯 化学物质 化合物 颜色 货币 数据库 生物数据库 汽车引擎 装置武器 疾病 药物 民族 协约 选举 电影节 武装冲突 音乐节 太空任务 足球赛 国际长途汽车大奖赛武术混合项目 奥林匹克 赛跑 女子网球联合会赛事体育项目摔跤 事件太空航行年份 食物 饮料 假日 事物语言 案件 美国最高法院案件 飞机 汽车 火车 火箭 轮船 太空舱 空间站 交通方式航天飞行器 音乐流派 姓名 名 奥林匹克成绩乐团 广播网络公司 广播台 广播电视台电视台 航空公司 公司唱片公司 学院 学校 教育组织大学 政府机构 立法机关 军事单位 非营利性组织

10、政党 美式橄榄球联赛 澳式足球联赛 高速赛车联赛 篮球联赛 棒球联赛 加拿大式橄榄球联赛板球联赛 曲棍球联赛 高尔夫球联赛 冰球联赛 手球联赛 轮滑曲棍球联赛 长曲棍球联赛 武术混合联赛 摩托赛车联赛 组织运动联赛马球联赛 英式橄榄球联赛 足球联赛 垒球联赛 速滑联赛 机车联赛 网球联赛 电子游戏联赛 排球联赛 美式橄榄球队 篮球队 加拿大式橄榄球队 曲棍球队 足球俱乐部 运动队伍摩托车队 公会 大使 建筑师 演员 成人演员 喜剧演员 动漫画家 音乐人 艺术家作家 宇航员 澳式足球运动员 羽毛球运动员 棒球运动员 篮球运动员 拳击手 板球手 自行车手 花样滑冰运动员 一级方程式赛车手 盖尔运动

11、员 高尔夫球手 美式橄榄球运动员 美国橄榄球运动员 冰球运动员 武术家 全美汽车比赛选手 大学生运动会运动员英式橄榄球运动员 斯诺克运动员 斯诺克冠军 足球运动员 人物运动员网球运动员 摔跤手 英国皇室 红衣主教 基督主教 牧师圣徒 足球教练 罪犯 虚构人物 动漫人物 记者 法官 军事人员 模特 君主 官员 哲学家 花花公子玩伴女郎牌手 大法官 国会议员 州长 市长 议会议员 总统 首相 政客参议员 科学家 足球经理 历史建筑 医院 旅店 灯塔 博物馆 餐厅 超市 体育场 建筑剧院 机场 火箭发射台 发电厂 桥梁公交中转系统地点 建筑结构基础设施道路交通铁路公路三岔路口隧道车站 公园 历史名胜

12、 纪念碑 湖泊 运河水体流动水体河流山洞 环形山 山 山脉 自然景点峡谷 行政区划 大陆 国家 岛屿 城市 城镇 人类居住地定居地村庄 保护区 滑雪区 产酒区 世界文化遗产保护地 星球 编程语言 计划 研究计划 蛋白质 单曲 斯诺克世界排名 古细菌 细菌 两栖类 蛛型类 鸟类 甲克类 鱼类 昆虫 哺乳类 软体类 动物爬行类 种群真核生物真菌 石松类 针叶类 苏铁类 蕨类 有花植物 葡萄银杏类 苞果类 绿藻类 植物苔类 电影 音乐 专辑 乐曲单曲 欧洲歌唱大赛参赛曲软件 电子游戏 电视剧 真人秀 网站 书 学术期刊 杂志 期刊文献报纸 劳动成果书面成果戏剧 其他类 2.2 DBpedia 本体结

13、构的优点和存在的问题从上表可以看出,DBpedia 的本体结构从整体上仍借鉴和使用了维基百科的类目分类方法。由于其本体结构较为简单,类之间只有不同层之间的从属关系而没有同层之间的其他关系,因此在维护和添加数据时较为方便,可扩展性良好。对于数据扩充极为迅速的DBpedia 项目而言,这种结构有利于它的数据扩充和维护。但 DBpedia 的本体结构也存在问题,主要是本体类的设置较为随意,同层次之间的类概念语义联系极弱。在某些领域的类划分过于详细,其他则比较粗糙。这就造成在目前的阶段,DBpedia 在线知识库的搜索和查询效率不高,在线查询的稳定性差等问题。参考文献(1 ) Mike Uschold

14、, Michael Gruninger. Ontologies: Principles, Methods and Applications. Knowledge Engi neering Review , 1996 , 11( 2) : 5- 33.(2 ) Bizer, Christian; Lehmann, Jens; Kobilarov, Georgi; Auer, Soren; Becker, Christian; Cyganiak, Richard; Hellmann, Sebastian (September 2009). “DBpedia - A crystallization point for the Web of Data“. Web Semantics: Science, Services and Agents on the World Wide Web 7 (3): 154165.(3 ) 邓志鸿, 唐世渭, 张铭等. Ontology 研究综述. 北京大学学报(自然科学版). 2002,38(5):730-738.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报