1、图书馆学专业优秀论文 汉语框架语义知识库信息组织与表示方法研究关键词:现代汉语 框架语义知识库 XML 语言 RDF OWL 语言 Web 信息检索摘要:本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以 Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识
2、表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶
3、层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有
4、的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例
5、,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。正文内容本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 W
6、eb 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的
7、误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用
8、到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章
9、提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词
10、检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种
11、新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好
12、的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一
13、部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意
14、义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义
15、知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利
16、用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确
17、的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则
18、进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文
19、信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。
20、从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标
21、记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本
22、体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索
23、性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机
24、语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定
25、领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,
26、它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特
27、征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行
28、有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它
29、将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习
30、及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征
31、聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及
32、其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识
33、表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶
34、层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有
35、的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例
36、,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中
37、的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。
38、本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇
39、,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词
40、典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而
41、是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于
42、 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进
43、行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括
44、第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,
45、本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。本文面向中文信息处理的实际需要,以现代汉语框架语义知识库(CFN)为处理对象,研究如何对这部词典进行有效的信息组织,使之成为一部计算机可读、可理解的语义词典,为新一代万维网语义 Web 中的语义知识共享以及智能化、个性化的 Web 服务提供基础资源。 现代汉语框架语义知识库是
46、一个以Fillmore 的框架语义学为理论基础、以真实语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。如何有效地对 CFN 的各种资源进行知识表示,是最大限度地实现其应用价值的关键问题。 知识本体(Ontology)是一种新的基于 WEB 的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。 本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表示方法,即利用知识本
47、体的组织方法将语义词典的信息组织起来,将概念按不同抽象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的词汇(术语),通过节点的方法一一对应的放入顶层概念(框架)内,来构建专门针对 CFN 的本体模型。 本文通过对几个已经构建好的框架进行描述,成功的使用了 XML 标记语言对其结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用 RDF+RDFS 对框架的内部信息进行资源描述,充分学习及实践了资源描述联系词汇的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确的得到必
48、要的信息,但是仅仅用RDF+RDFS 对框架进行描述,除了其自身没有推理机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用 OWL 对框架进行描述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。 文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识库的组合规则进行全面
49、的描写,详细阐述语义 Web 信息标记语言XML、RDF、OWL 的发展历程、特征及文档结构,研究一种基于 OWL 语言的知识表示方法,并针对 CFN 中三个子库的实例,分别给出具体的 OWL 表示样本,以证明这种表示方法的可行性和有效性。就研究意义来说,本文用语义 Web 标记语言对构建现代汉语框架语义知识库的形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义信息,从而提高 Web 信息检索的查全率和查准率。特别提醒 :正文内容由 PDF 文件转码生成,如您电脑未有相应转换码,则无法显示正文内容,请您下载相应软件,下载地址为 http:/ 。如还不能显示,可以联系我 q q 1627550258 ,提供原格式文档。我们还可提供代笔服务,价格优惠,服务周到,包您通过。“垐垯櫃 换烫梯葺铑?endstreamendobj2x 滌甸?*U 躆 跦?l, 墀 VGi?o 嫅#