1、 本体论文:基于自然语言理解的本体语义信息检索【中文摘要】传统信息查询技术都是基于关键字的语法匹配和全文查询技术,但是存在很多问题,例如“忠实表达”问题,机械匹配问题,“词汇孤岛”问题,无法准确揭示信息的实质内容等。语义检索是一种基于知识的、语义上的检索,以语义理解为基础,将用户的检索请求、检索对象资源和检索结果都赋予一定的语义,能够有效地提高查准率。本文在现有语义检索的基础上,结合各种词典和自然语言处理技术,提出了基于自然语言理解的本体语义信息检索。本文首先利用同义词定义模式定义相应的抽取规则,从相关资料(例如百度百科)中获取领域本体的同义词。其次采用 Jena 推理机,结合领域知识自定义推
2、理规则得到了隐含的知识。在同义词词林的基础上,提出了词语相似度算法,对用户输入的自然语言查询进行语法分析、语义分析、构建 SPARQL 查询语句实现了自然语言查询。在衡量排序算法的合理性上提出了准确度偏差公式,并对用户交互的内容进行了分析。最后在查询结果中返回丰富的信息,有助于用户了解查询的内容以及实现二次查询。本文实现了以计算机本体为例的语义信息检索,实验表明本文的方法能够获取语义信息,有效地提高了系统的查准率。【英文摘要】Traditional information search techniques are based on keyword matching and full-t-ex
3、t query syntax technology, but there are many problems, for example:faithfully expr-ess, mechanical matching problem, vocabulary island problem, cant accurately reveal the essential contents of information etc. Semantic search is a knowledge-based, semantic search, semantic understanding, based on t
4、he users search request, search and retrieve th-e results of the object resources are given a certain semantic, can effective.【关键词】本体 本体查询扩展 语义网 语义检索 自然语言理解 SPARQL【英文关键词】Ontology Query expansion Semantic web Semantic retrieval Natural language understanding SPARQL【索购全文】联系 Q1:138113721 Q2:139938848【目
5、录】基于自然语言理解的本体语义信息检索 摘要 4-5 Abstract 5 目录 6-8 1 绪论 8-14 1.1 研究背景与意义 8-9 1.2 国内外研究现状 9-12 1.3 论文内容与结构安排 12-14 2 相关理论介绍 14-26 2.1 语义网与语义检索 14-16 2.2 本体概述 16-19 2.3 自然语言处理 19-24 2.4 查询扩展 24-26 3 基于 Jena 的本体推理 26-32 3.1 本体推理的作用 26-28 3.2 推理规则的构造语法 28-29 3.3 基于 Jena 的本体推理实验 29-32 4 领域同义词的获取 32-40 4.1 词汇定义
6、模式及同义词获取方法 32-35 4.2 同义词提取模式 35-39 4.3 获取领域同义词的实验 39-40 5 基于自然语言理解的本体查询 40-52 5.1 词语相似度算法 40-43 5.2 本体查询方式及处理 43-45 5.3 语义分析处理 45-49 5.4 结果处理及用户交互 49-52 6 实验及结果分析 52-67 6.1 实验环境与开发工具 52-57 6.2 系统架构及功能模块 57-58 6.3 实验步骤 58-65 6.4 实验结果分析 65-67 7 总结与展望 67-69 7.1 总结 67 7.2 展望 67-69 参考文献 69-72 在读期间发表的论文 72-73 致谢 73