1、基于 Agent 技术的网络信息资源检索王慧娟(安徽工程科技学院 ,安徽 芜湖 241000)文摘 通过分析现有网络信息资源检索的现状,揭示其局限性。提出构建基于 Agent 技术的网络信息资源检索模式,为用户提供智能化的检索与服务。关键词 移动 Agent 网络信息资源 信息检索Research on the System of Web Information Retrieval based on AgentWANG Hui-juan( Anhui University of Technology and Science,Wuhu 241000 ,China)【Abstract】By ana
2、lyzing the existing Web Information Retrieval, this paper uncovers its unavoidable limitations。The paper presents a mode of Web Information Retrieval based on Agent, which provides the intelligent retrieval and service for users。【keyword】mobile agent web information resources information retrieval随着
3、计算机的迅速普及和网络技术的发展,网上的信息资源呈指数增长态势。信息用户从浩如烟海的网上信息资源中快速准确的查找到自己所需的信息则显得尤为重要。传统的网络信息检索模式缺乏其灵活性,适应不了新的技术需求,将移动 Agent 技术应用于网络信息资源检索即成为一热点问题。1.网络信息检索的现状及其局限性Internet 的迅猛发展,已成为最大的信息资源库,其主要的信息资源是 WWW 信息资源。现阶段,人们为提高检索信息的准确性和效率性而使用搜索引擎技术。实践证明,Web 搜索引擎是一个非常有效的网络信息检索工具。但是由于 Web 信息资源是异构的,且是动态变化的,用户在使用搜索引擎进行信息检索时,依
4、然会出现很多的问题,如:(1)下载的网页中很多无用的信息,影响了检索的速度,浪费了网络带宽;(2)Internet 上的站点和网页的内容是动态的,时常更新的,搜索引擎检索的结果很难保证是实时的;(3)由于搜索引擎是基于消息传递和远程调用,在搜索的过程中,必须保持客户端和服务器端的稳定连接,一旦断开,又要重新开始。2.移动 Agent 技术及其技术优势2.1 移动 Agent 的简介“移动 Agent”的概念是由 90 年代初的 General Magic 公司在商业系统 Teleseript 中提出的,定义为:移动 Agent 是一个独立运行的计算机程序,它可自主地在异构的网络中按照一定的规程
5、移动,寻找合适的计算资源、信息资源或软件资源。利用与这些资源处于同一主机或网络的优势,就近处理或使用这些资源,代表用户完成特定的任务。2.2 移动 Agent 技术优势Agent 技术给分布式系统的设计、实现和维护带来了新的活力,在技术方面有许多优点:1)空间节约:移动 Agent 运行时,不需要持久占用主机的内存2)减轻网络负载::移动 Agent 能大大减轻网络上的原始数据流量。3)异步自主性:网络计算平台往往是异构的,由于移动 Agent 通常独立于计算机和传输层,而仅仅依赖于其运行环境,所以移动 Agent 提供了系统无缝集成的最优条件。4)实时交互:Agent 可以从中央控制器被传送
6、到各局部点激活,并在当地直接执行控制器的指令。5)坚定性和容错性:移动 Agent 具有对非预测状态和事件的应变能力,这样更易创建坚定和容错性好的分布式系统。6)延时服务:通常情况下,移动设备的计算依赖于网络连接,它要求移动设备和固定网络间的持久性的连接,这种要求从现有的技术和经济上考虑都是不容易达到的。如果利用移动 Agent 技术,将任务嵌入移动 Agent 中去,通过网络派遣,移动设备即可断开。7)客户定制服务:客户可以根据需要定制服务。3.基于移动 Agent 技术的网络信息检索3.1 主要内容:传统的 Web 信息检索模式的弊端主要在于它们都是基于客户机 /服务器模式的,Robot
7、不能在网络中移动,每次都需要下载所有涉及到的 Web 文档。在基于移动 Agent 技术的网络信息检索系统中,Robot 被具有检索功能的移动 Agent 代替,移动 Agent 被发送到远方 Web 服务器执行检索任务,只返回少量文档,这样不仅避免了大量的中间结果的传递,而且确保检索结果与真实 Web 内容的一致性。为了进一步提高效率,还可以同时发送多个 Agent 线程,使其分工协作,在不同的 Web 子空间进行并行检索。基于移动 Agent 的 Web 信息检索系统一般由移动Agent、移动 Agent 的服务设施(MAF-Mobile Agent Facilitator)查询服务、黄页
8、服务器组成。移动 Agent 取代了以前的静态 Robot,它负责移动到 Web 站点进行信息检索,并返回检索结果。移动 Agent 服务器是移动 Agent 的服务设施的具体体现,它为移动 Agent 提供基本服务( 包括创建、传输、执行等),所有在黄页服务器上注册的 Web 站点也必须安装移动 Agent 服务器,移动 Agent 通过移动 Agent 服务器提供的访问接口才能访问 Web 站点的资源。黄页服务器记载着各个 Web 站点提供的服务。移动 Agent 的服务设施(MAF-Mobile Agent Facilitator)查询服务:负责接收用户的查询任务,启动搜索任务,接收移动
9、 Agent 返回的结果,并且给用户提供一个良好的界面。这个系统的工作流程如下:1)各 Web 站点向黄页服务器注册,包括 Web 站点提供的服务及搜索的初始 URL,黄页服务器根据 Web 站点的性质对其进行分类; 2)查询服务接收用户的查询条件,并根据查询条件询问黄页服务器,黄页服务器返回一系列Web 站点供用户选择;查询服务根据用户输入的查询条件和所要到达的一个或多个 Web 站点对移动 Agent 进行初始化,然后制订路由策略将移动 Agent 发送到第一个 Web 服务器:3)移动 Agent 访问该 Web 服务器,进行识别,并将符合要求的 HTML 文档的 URL 和相关信息发送
10、回用户。4)在第一台,Web 服务器上搜索完后,移动 Agent 根据约束条件等决定下一步的行为,如果要再次转移,则保存当前状态和历史一记录并阻塞自身,向第二台主机发出转移请求。得到允许后,开始向第三台主机复制,复制结束后给第二台主机发送清除请求,进入休眠状态,同时在第三台主机开始继续搜索信息。任务完成或达到返回时间,移动 Agent 将返回用户端。5)如果网络负载太重或出现故障,则先转移到 Dock 服务器,具备传送条件后再返回。到达用户节点,将结果返回给用户。3.2 与传统技术的优点移动 Agent 技术构建信息检索系统的优势1)充分利用 Internet 带宽基于移动 Agent 技术的
11、网络信息检索更为有效地利用 Internet 带宽。传统静态的 Web 搜索Robot 请求的所有 HTML 文件,在某些情况下,所有的 HTML 页都是有用的,但有时只有一小部分有用,这样就浪费了宝贵的网络带宽。如果利用移动 Agent 技术就可以解决这个问题,把Web 搜索 Agent 发送到目标 Web 服务器上,利用 Web 服务器方本地宽带网进行信息搜索,只把有用的信息发送回来。2)无需持续稳定的网络连接一旦把移动 Agent 发送到 Web 服务器,移动 Agent 就在服务器端执行检索任务,不需要持续网络连接的支持。移动 Agent 完成任务后会首先检查网络的连接状况,如果 We
12、b 服务器与源搜索主机处于连接状态,就携带结果返回;如果处于断开状态,就转移到一台 DOCK 服务器,等到网络处于连接时再回到源搜索主机。这样,即使在网络不是很稳定的状态下,系统也具有很大的灵活性和可靠性。3)负载平衡在传统检索模式中,所有的计算都在源搜索主机上执行。在移动 Agent 方案中,移动 Agent把本地主机的计算转移到 Web 服务器上。因此可以在本地主机上可以采用合理的策略,把负担均衡地分配给所有的 Web 服务器。参考文献:【1】司卫国.基于移动 Agent 的 Web 信息检索系统的研究 .西安电子科技大学硕士学位论文,2005【2】熊回香.网络信息检索及其发展趋势研究.华
13、中师范大学硕士学位论文,2005【3】韩立新等. 基于 Agent 的面向工 nternet 的信息检索系统的设计和实现.情报学报,2002(6)【4】许鑫.利用移动 Agent 技术改进基于概念的信息检索. 图书情报工作,2003(1):86-90.【5】张云勇.移动 Agent 及其应用,清华大学出版社,2002, 1【6】董红斌,李滨丽,李洪峰.基于 Mobile Agent 的信息搜索技术.哈尔滨师范大学自然科学学报,2002(2)作者简介:王慧娟(1981) ,安徽芜湖人,助理馆员,发表文章一篇。联系地址:安徽省芜湖市安徽工程科技学院科技处(241000) 电话:013855338226 或 0553-2871436