1、1基于主题网格分布式知识管理系统探析基于主题网格分布式知识管理系统探析赵金海(聊城大学图书馆, 山东聊城,252059)摘要:探讨基于主题网格分布式知识管理系统基础设施的结构、原型计划、网 络分布式“ 主题网格”和影响系统 的结构层。分析基于主 题网格网络语义知识表述方法,建造知识结构模式本体功能,以及知识结构与文件所存非结构数据、外部文献链接等基本理论。 最后论述如何通过整合多种异构分布式信息资源查询网络节点传输的主题图。关键词:知识管理;分布式知识管理;主题图;主题网格分类号:TP393, G27RESEARCH ON TOPIC GRID-BASED DISTRIBUTED KNOWLE
2、DGE MANAGEMENT SYSTEMZhao Jinhai(Library of Liaocheng University, Liaocheng in China)Abstract: This paper is researched that the architecture, the prototypical implementation, the network distributed “topic grid” and the layers of the affected system of the Topic Grid-based Distributed Knowledge Man
3、agement System Infrastructure. It analyises the Topic Grid-based semantic net-like knowledge representation means and the possibility to use ontology for modeling knowledge structures, and concepts to link these knowledge structures with unstructured data stored in files, external documents etc. Fin
4、al, it discusses how to integrate various heterogeneous distributed information resources and inquire the topic map transferred on the network nodes.Keywords: Knowledge Management; Distributed Knowledge Management; Topic Maps;Topic Grid信息社会的到来,企业知识竞争的重要性已被人们普遍重视。加强企业知识管理,营造现代企业知识竞争氛围,重视多种异构的信息资源分布式研
5、究和整合,努力构建一个基础主题网格的分布式知识管理系统已成为人们追求的重要目标之一。但现阶段只有主题图才具有网络样的语义知识表述方法,建造知识结构模式的本体,与存储文件的非结构数据和外部文献链接等功能。该文旨在探析基于主题网格分布式知识管理系统基础设施,及其结构、原型实施计划、影响系统运行的结构层等,以期达到抛砖引玉之目的。1. 分布式知识管理系统(Distributed Knowledge Management System)目前,大多数团体机构都希望建成一个容纳本单位全部知识的基于网格的分布式知识管理系统。这种系统能够检索现存知识,支持单位本地知识独立管理,允许未确定语义单位间的合作,同时
6、保证每个节点间交换知识。因此,知识库检索主要依靠公司企业知识内联网。目前,许多公司存储知识总以分布的方式出现。集中化知识管理系统的出现却迫使所有地方机构构成一个共享本体。分布式知识管理系统由中央服务器(CSV)和动态的个人服务器(ISV)构成:SIv 侧重于个人或成员单位的知识存储和管理,相当于个人(或成员单位)的知识网页,具有版块创立和删除,知识存储与交流,以及系统设定等功能。CSV 负责组织公有知识和小组成员提交知识的存储、管理,为成员提供主题图搜索、知识专家、文件管理、知识社区、知识评价、知识推送和知识个性定制等服务。Sigel强调“不同的情报要满足不同内容概念需求” 1。分布式知识管理
7、系统也必须满足这种需求。大多数知识管理系统的最基本的目的之一,试图使现存知识都得到完全检索。所有捕获知识系统的成败取决于现存节点的知识联盟。因此,Bonifacio 等强调两点:自治权与协调2。2分布式知识管理系统必须支持某一单位知识的本地管理,同时允许没有集中定义语义单位间的合作。图 1所示分布式知识管理系统的自动节点能独立和相互独立自治。每个节点可以从本地创建和存储知识,尤其能根据单个本体要求组织知识,进一步强调语义自治权。同时保证在每个节点间交换知识。图 1 集中式知识管理系统的结构 3 这种结构适用于不同类型的硬件、操作系统和程序语言。为了整合和获得系统基于知识的咨询,就要使这种系统成
8、为一种不需改变文献编码的现存非入侵式情报源。也就是说,要选择合适的知识陈述技术把它 “叠加”到现存情报源。为方便地方处理,还需为客户整合分结果和最终结果发送语义咨询到一组不同知识节点上的一种机制。利用它,可把检索分布式知识节点隐藏于客户端,查询知识时给人造成一种咨询大型知识库的错觉。为此,还必须设计一种带密封模块的、关注点分离的层次结构,构建一个适用于地方管理和分布式知识管理系统的主题图网格。2. 主题网格(Topic Grid)目前,语义技术应用程序是 IT领域重点关注之一,它不仅呈现出朝语义网络、语义网络服务和语义社会软件的方向,而且也呈现出朝知识管理应用程序的方向发展的趋势。与 RDF和
9、 OWL相比,主题图已经发展成为最新语义技术之一,它能严格地把所存知识和非结构情报源分离开。用编制本体知识结构层的方法,使主题图达到链接多种结构的和不改变语义结构的情报源。情报源语义查询的成功,使主题图技术比传统上基于索引或全文的检索更具优越性。主题图标准具有特别复杂的性质和合并机制,可为全程整合地方本体过程提供基本理论支持。依赖该标准构建机制定义方法时,可使地方自治最大化。在合作组建地方知识库时能满足各种需求,有时就称此为“知识整合”或“无缝知识” 。为满足基于主题图的分布式知识管理系统结构的需求和为多种应用程序交换,推荐出一种知识结构 “主题网格 ”。 Korthaus和 Hildenbr
10、and针对一个或多个主题图提供自己知识库网络节点的主题网格进行论述(见图 2)4。图 3展示出一种允许单一协议或技术层知识结构更换的层结构。建基于普通分布通讯中间件的基础层上,a 1 :N :1-则要求建基于通讯层,在基础通讯层构建处理知识碎片的检索管理层。图 2 主题网格 图 3 主题图协议栈为采用普通知识结构交换协议,中间层使用了语义网络 API(SNAPI,http:/sourceforge. net/projects/snapi) 。下层使用主题图碎片远程交换协议(TMFREP) ,可获取网上咨询主题图所需内容。TMFREP 为实现主题网格提供核心内容。至于最上层,根据模型观察控制器(
11、MVC:Model-3View-Controller)模型研发而成的客户端应用程序,以简单方式阅读主题网格数据。它不象下面的层主要靠记忆存储完成的咨询,而是具有取代未影响上层基础通讯层的功能。如要求主题网格必须接受真实网格计算扩充的影响,那么,SNAPI 层发生的变化就非常重要了。由于上面各层使用SNAPI提供的界面没有发生变化,所以保留了原来的性能。2.1 主题分组服务器(OGS)结构中最低两层不受知识结构交换和面向授权的基本分布式和分组通讯功能服务的制约。主题分组服务器可以用以实现基于 CORBA并行应用发展协议的技术基础。该结构由如下元素构成:主题分组服务器(OGS) ;联合服务器(JS
12、) ;一个或多个主人;一个或多个工人5。CORBA 分组服务器建基在一个主人和 N工人之间的 a 1 : N : 1 通讯之上:主人代表客户端,工人代表链接服务。主人与工人之间的通讯如图 4所示:主人向分组服务器发送需求信息。后者分开发送那些与需要分开处理要求和向联合服务器发送回答内容的工人连接的要求。这种联合服务器分别搜集工人的答案,然后反馈到成组的主人那里。图 4 分组服务器和 SNAPI如图 4 所示,除使用分组或联合服务器外,主人和工人不直接通讯。OGS 结构通讯主要依赖分组和异步通讯技术。要求分组通讯分别发送给不同的工人处理。为能够接受主人咨询,工人必须在同一小组注册。注册是动态的,
13、即在程序运转或非运转时都可注册,分组服务器具有高度灵活性。分组服务器采用与主人和工人非配偶式异步通讯。根据需求,由一个工人长期解决出现的问题。通过异步传送把咨询转交给工人,然后再把答案异步反馈回来,这样不会使主人的咨询发生阻塞。分组服务器一般支持几种数据分布政策,既可以分别处理链接工人的所有咨询,也可以利用某一标准处理子集的问题。2.2 语义网络 API(SNAPI:Semantic Network API)SNAPI由一个允许较高层检索 SNAPI检索框架和多个传输协议链接组成。利用它可定义或使用主题图类知识技术协议,也可定义检索远程知识库重复利用协议。它的 Java检索界面不要求知识库技术
14、带有语义功能。中间界面使用阅读检索和书写检索等方法。客户端可查询知识库知识碎片。为实现主题网格增加分组服务链接。与以前的命名协议相反,分组服务器允许多路传送通讯。调用(客户端)最终服务不仅包括单一服务,而且包括并行 N服务。在多目的互联网邮件扩充框架(MIME)使用多部分/相关内容中,SNAPI 具有支持发送服务器所有应答的功能。因此,回答信息不仅包含一个知识库,而且包括分组知识库所有内容。图 4咨询和合并结果分布处理采用 query句法进行概述。先限定隔离的信息分别包含服务器应答。为保持SNAPI使用该框架交换格式的独立性,把合并应答的部分工作留给较高协议层做。为使 SNAPI具有基本框架应
15、用的可行性,使用制造商等级 SNAPIFactory编制客户端存根和服务端框架。getStub 和 getSkeleton用于 SNAPI实施传输协议,要求 connectionString包含当前特定传输协议建立链接所需的信息论据。connectionString 的合成品与 URL基本一致,这里主要依靠所用传输协议决定组件的具体含义。在 SNAPI上,TMFREP 构建的协议可封装到把 SNAPI基本界面作为工具类的单独类。当初始化 SNAPI框架时把它作为反馈主题进行传递。针对这一目,从传输协议到 SNAPI的咨询都在此提交和处理。2.3主题图碎片远程交换协议(TMFREP:Topic
16、Maps Fragment Remote Exchange Protocol)4TMFREP是一种远程检索主题图协议,可用于处理主题图的数据和碎片。在客户端与服务器间交换的数据中,几乎所有主题图引擎都支持 XTM格式,能在 Java界面从事 TMFREP检索,查询整个主题图数据。所以,不论使用什么方法,最后都须借用主题图碎片返还结果和支持 TMAPI的主题图引擎处理返还碎片和信息。findByName可用于搜索网格全文。通过图中所示用户界面向终端用户提供快捷的主题网格导航功能。因返还的碎片包含与搜索条款一致的主题目录,所以用该方法可搜到有关一个主题的所有“基本名称”和主题图所存数据(不包括外部
17、信息源的事件) ,然后把所有主题作为副本存于碎片中。getFragment用于定位带有完整数据的主题含有两个参数:其一,专指用于创建碎片主题的参数。通常用 id、主题地址和主题标识符定位主题。其二,设定碎片半径的参数。为了搜集检索相关碎片元素,指定半径需要几个步骤才能从初始主题开始。检索的所有主题都属于该结果碎片。由于个别主题作为整个副本增加到碎片,所以客户端包含当前主题的全部数据。executeQuery允许利用 TMFREP发送复杂的 tolog咨询6。它只有一个参数,即咨询内容本身,须用 tolog传递。返还的碎片,由 Ahmed推荐的技术构建7。除了咨询结果外,其他结果关系的语义模式全
18、部用返还碎片组建。在计算机系统间,该技术可用于 tolog结果的互换。TMFREP可直接建基于 SNAPI之上,并可使用其功能。这样的操作必定映射到 SNAPI操作中。针对这一目的的通讯,TMFREP 客户端和服务器必须遵循双射映射规则。SNAPI 参数的knowledgeFormat用于制定 SNAPI查询发送协议。一旦 SNAPI查询到达服务器,服务器必须测评knowledgeFormat(知识格式)参数。TMFREP 1.0的版本通知服务器该查询来自于 TMFREP。因此,就会把该查询传输到遵守该协议的回收主题,然后再处理。2.3.1 分布式 tolog查询(Distributed To
19、log Requests)executeQuery可把 tolog查询发送到主题网格是 TMFREP的核心功能8。它能把 tolog查询发送到图 5所示服务器,最后合成不同结果集。为确定分布式 tolog查询结果集,TMFREP 须执行三项任务:垂直合并、水平合并和映射。根据主题图合并规则,TMFREP 能创建一个单程主题网格答复内容的、符合主题图标准的 XTM碎片。这种把网格答复内容放在一起的做法称为垂直合并。在 tolog查询中,AND 和 OR两种连接类型都可能出现。AND 链接与相关代数的连接点相一致。相反,OR链接只能引导两个结果集的联合体。由于两种预测改变了结果集结构,所以,该论文
20、把单程预测链接称作水平合并。在链接节点后的结果集含有两种个别预测变量的联合体。查询评价利用删除所有变量的映射结果,结果集的数据并不是查询 select的组成部分。总之,为了确定分布式tolog查询的结果集,TMFREP 执行的顺序:垂直合并、水平合并和映射。2.3.2 分布式碎片抽取(Distributed fragments extraction)主题网格碎片的抽取不同于地方主题图碎片的抽取,这在图 5所示主题网格碎片中已做说明。如查询一个具有 Smith主题和两个半径的碎片,其结果至少包含 Smith主题、book2 和 Potter。然而,如果只是简单地把查询发送到所有网络节点,接着组合
21、部分结果,这还得不到期望的结果。因为返还节点 2的结果是空的(没有主题 Smith) ,主题 Potter在组合结果碎片中会消失。由于实现分布式 tolog查询任务是相似的,所以,确定的逻辑表达式只能把部分碎片转移到客户端。2.4 模式观察控制器(MVC: Model-View-Controller)TMFREP遵循无国界远程查询主题图协议。通过分布式碎片抽取文摘,分布式查询处理功能等概念,TMFREP 可拥有构建主题网格的所需功能。因它不涉及国家主权,所以在某种状态下并不提供查询数据或自动装载主题网格碎片的逻辑式。原因是提供该功能的框架由上层协议栈实施完成。所以,客户端就可以直截了当检索主题
22、网格的数据。由于该框架直接建基于 TMFREP之上,它的功能又用 TMFREP封装,所以不必考虑分布式主题图的问题。因面向客户端的结构合理,并具扩展性,所以上层实现了 MVC设计模型。MVC 设计模式与数据管理、陈述和控制逻辑相分离。利用这种方法能分享不同叙述观点之间的普通数据模式。主题网格5MVC层包含主题网格、实现该模式的类和提供类界面。MVC 框架主要包括四个构成界面:其一,topicsGridModel 界面,具有类似控制器的模式。根据用户的习惯,模式本身负责修订自己的数据,观察查询模式的数据,为描述数据做好准备。其二,RemoteAccessProtocol 界面,可把该模式放在 T
23、MFREP存根参照类示图中作为TopicGridImpl类来陈述。这就是说,该模式具有利用 TMFREP装载主题网格数据功能。除了用其获取主题网格数据外,绝不允许用 MVC层应用程序链接 TMFREP。其三,TopicGridActionListener 界面,对信息管理中现有的两种监听器来说,可用于通知观察用户行动主题和修订该模式的观察器。在观察器使用 addTopicGridActionListener和removerTopicGridActionListener可注册和解除 TopicGridActionListener界面。其四,TopicGrid 界面模式可直接用于扩充 TopicG
24、ridActionListener界面,注册该模式后,可直接了解用户行动。从地方索取观察器所述主题网格数据,尤其陈述主题网格缓存内容或必要时连续重装的数据。同样,如该模式缓存数据发生变化,该模式会自动通知TopicGridModelListener观察器。这种情况下,观察器必须核实是否因数据变化更新了陈述内容。利用 addTopicGrideModelListener和 TopicGridModel界面的 remove TopicGridModelListener句法注册和解除这类事件。2.5 结构整合(Architectural integration)实际环境下主题网格应用要采用主题图格式
25、把自动查询的信息内容存储于应用程序。为达到此目的,每个应用程序必须通过主题网格整合 TMFREP界面,这样如同用主题图碎片格式提供自己信息的 TMFREPF服务器(参见图 5) 。这使主题网格上不同应用程序的链接和跨越式搜索成为可能。对于应用程序来讲,可把 TMFREP界面作为插件或附加模式进行研究。利用主题网格的方法创建的知识结构层服务于来自于具有极大不同应用程序数据的均化作用。不论完整的手工操作,还是完全的自动处理,每个应用程序提交的任务都可以采用不同的方式解决。一方面讲,知识引擎只面对主题图数据的创建和管理,以及与手工提供链接信息源的一致性负责。另方面,主题图结构将根据应用程序或信息源的
26、数据的专用软件模式自动产生。图 5 带有 TMFREP界面的主题网格结构3. 影响系统运行的结构层在系统运行时,必须考虑每个层对整个系统运行产生的影响。3.1 中间件与 1:N:1-通讯层(The middleware and 1:N:1-communication layers)原则上讲,可使用不同的中间件技术来实现普通分布式通讯功能。使用 SOAP时,测量返还值约超过 250%,服务器端编码值约达 700%,服务器端解码值约 500%。在布拉格的查理斯大学分布式系统研究小组研究中(1998) ,其目的就是确定现存的 CORBA产品的不同执行行为,开源执行全方位的 ORB 脱颖而出的成为胜利
27、者,它要比现存的商业产品快四倍。3.2 主题图专指层(The Topic Map-specific layers)在该结构较高层上,开始展示主题图专指面。当 SNAPI层仍是独立的主题图交换格式时,唯一需要是保证下层一致语义网络 API有效实施和上层涉及主题图数据的处理。通过具体主题图引擎产6品论证哪一个是与其他所需特性一致的最佳交换产品。在处理过程中,不仅查询步骤重要,而且查询组服务器的数量也很重要。另外,还必须考虑到服务器上地方主题图的规模对运行的影响。查询后端是一个显而易见的因素,使用的查询处理器(实例中使用的是 TM4J tolog查询处理器)也是非常重要的。4. 结论综上所述,基于主
28、题网格的分布式知识管理系统不仅拥有如同网络一样的语义知识表述方法和建造知识结构模式的本体功能,而且还能提供此类知识结构与文件中存储的非结构数据、外部文献等进行链接的基本理论。企业内部知识管理系统大多数都采用了分布式组织的方法。为了充分利用现实世界范围的主题网格技术设施,知识管理系统也可用来支持聚集在不同地方实施分布式软件工程活动的联合工作的软件研发人员。虽然,在显性知识组织和针对基于语义网络结构信息源所采用的搜索方法或导航方法相当新。传统上基于索引或基于全文的搜索仍然占有一定的优势。为了实现分布式知识管理系统的基础设施,该文提出结构和原型实施目标,在传输状态下利用客户端查询网络节点上的主题图。
29、基于主题网格的分布式知识管理系统是实施网络上多种异构信息资源和知识管理的最佳系统,在国内只是刚刚引起人们的重视,还缺乏较深层次的研究,此文中在于抛砖引玉,推动国内有关基于主题网格分布式知识管理的研究。参考文献:1 Sigel, A. Was Leisten Topic Maps?,in Schmidt, R. (Ed.): Information Research and Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt, 53. Jahrestagung der Deutschen Gesel
30、lschat fur Informationswissenschaft und Inforamtionspraxis e.V., DGI, 8. Mai, Frankfurt/Main, Germany, 2001 pp. S.440-448.2 Bonifacio, M., Bouquet, P. and Cuel, R. Knowledge nodes: the building blocks of a distributed to knowledge management, Journal of Universal Computer Science, 2002 Vol. 8, No. 6
31、, pp.652-6613 Bonifacio, M., Cuel, R., Mameli, G. and Nori, M. A peer-to-peer architecture for distributed knowledge management, Proc. 3rd Int. 2002 Symp. Multi-Agent Systems, Large Complex Systems, and E-Businesses (MALCEB2002) ol. 2011-04-06.http:/www.dit.unitn.it/bonifaci/paper/MALCEB02_Bonifacio
32、.doc4 Korthaus, A. and Hildenbrand, T. (2003) Creating a Java- and CORBA-based enterprise knowledge grid using Topic Maps, in Cheung, W. K. and Ye, Y. (Eds.): Proc. Workshop on knowledge Grid and Grid Intelligence, 13 October, Halifax, Canada, pp.207-2185 Aleksy, M. and Korthaus,A. A CORBA-based obj
33、ect group service and a join service providing a transparent solution for parallel programming, Proc. Int. Symp. Software Engineering for Parallel and Distributed Systems (PDSE 2000), 10-11 June, Limerick, Ireland, IEEE, 2000 pp.123-1346 Garshol, L. M. Living with Topic Maps and RDF, Ontopia, 2003 o
34、l. 2011-04-05. http:/ topicmaps/materials/tmrdf.html7 Ahmed, K. TMShare Topic Map fragment exchange in a peer-to-peer application, Procs. XML Europe 2003, 5-8 May, IDEAlliance, London, England, Available from: http:/www.idealliance.org/papers/dx_xmle03/papers/ 02-03-03/02-03-03.pdf8 Garsho, L. M. tolog 1.0, Ontopia, 2003 ol. 2011-03-05. http:/ tolog-spec.html作者简介:赵金海,男,1956 年生。山东聊城人,聊城大学图书馆副研究馆员。出版 专著 2 部,发表论文 40 余篇。发稿时间:2011-07-06