收藏 分享(赏)

基于数字图书馆的RSS 推送服务研究.doc

上传人:weiwoduzun 文档编号:1880279 上传时间:2018-08-28 格式:DOC 页数:5 大小:34.50KB
下载 相关 举报
基于数字图书馆的RSS 推送服务研究.doc_第1页
第1页 / 共5页
基于数字图书馆的RSS 推送服务研究.doc_第2页
第2页 / 共5页
基于数字图书馆的RSS 推送服务研究.doc_第3页
第3页 / 共5页
基于数字图书馆的RSS 推送服务研究.doc_第4页
第4页 / 共5页
基于数字图书馆的RSS 推送服务研究.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、基于数字图书馆的 RSS 推送服务研究 *胡新平 张天俊 董建成(南通大学图书馆 江苏南通 226001)摘要:利用 PHP、JAVA 和 MYSQL 开发基于数字图书馆的 RSS 推送服务系统,通 过信息化集成检索,并在学科馆员优化 过滤的基础上,生成个性化 RSS 摘要,形成个性化频道, 实现推送服务。该系统的使用表明:克服了以往推送服 务的信息 过载的缺点, 满足用户的实际需求。关键词:数字图书馆 RSS 集成 个性化推送服务 学科 馆员分类号:G350Using RSS Technology to realize Push service in Digital LibraryHu xi

2、nping Zhang tianjun Dong jiancheng(Library of Nantong University , Jiangsu 226001, China)Abstract: The system was developed by PHP, JAVA and MYSQL. It realized RSS push service based on digital library. First, search results were obtained through integrated information retrieval technology. Then the

3、y were optimized and filtered by Subject Librarian. At last, personalization RSS abstracts and channels were formed. Running of the system indicates that it can overcome information overload and meet to users practical application. Keyword: Digital Library; RSS Integration; Personalization Push Serv

4、ice; Subject LibrarianClass Number:G3501. 引言随着数字图书馆的建设的逐步发展,越来越多的图书馆已建立了一些数字化信息管理系统,如图书馆自动化信息管理系统、各种数字文献资源管理系统。资源的增多,读者要获得有效资源的能力要求和时间要求越来越高,这势必在一定程度上影响数字图书馆建设的信心。如何减轻读者负担,开发合适的应用系统,实现主动推送服务是图书馆服务的一个发展趋势 1。目前主要有这样几种推送模式:(1)在数据库检索过程中,通过对用户个性、使用习惯的分析以及当前查询的内容而主动地向用户提供其可能需要的信息服务,并在查询结果的网页上加入一些和当前查询关联程度

5、较高的链接,以智能启发式帮助用户获得所需信息。典型的如 Springer 数据库和中国期刊网全文检索数据库等 2;(2)采用异步的邮件或手机信息提示推送 3。 (3)采用专用网页,进行定制服务,同时利用异构系统集成化检索系统,借鉴和引入元搜索引擎与网络检索代理的思想,开发一站式检索系统,实现跨多个数据库的检索。并将检索结果归类到相应链接。典型的代表是康奈尔大学 2000 年推出的 MyLibrary 系统;深圳市图书馆开发的 ILAS 系统中的“我的图书馆”服务项目,还有一些图书馆在 MyLibrary 的基础上开展了此项工作 4,5。 (4)基于频道订阅的推送服务。典型的有:CNKI 可以“

6、开展订阅型推送服务、检索型推送服务和提示推送服务 6。诚然这些技术的采用和服务的开展对图书馆事业的发展做出了较大的贡献,但是这些解决方案还存在一些问题,主要表现在:(1)过分依赖于计算机自动化技术,忽略了人特别是学科馆员的信息服务过程中的主观能动性的作用。 (2)个性化服务不突出,给出的结果集合太大,大多存在信息过载的状况,占据大量网络带宽,效率低下。 (3)缺乏交流反馈。推送服务只顾信息发出者的需要,而忽视用户需求的弊端;推送带有某种强制性;推*本文是江苏省教育厅和南通大学教改重点课题研究成果(项目编号:0541,A36)送系统都不是以用户为中心;推送软件大多依靠用户递交的需求文档来推送信息

7、,无法主动地、智能地、及时地获取用户当前的信息需求;推送的信息与用户信息需求之间存在着滞后现象。在图书馆个性化主动服务中,信息推送要与信息反馈相结合,对这些反馈的信息进行分析,不断调整和完善,逐步逼近用户的信息需求。采用动态频道技术和静态频道技术相结合以及推送技术智能化,从用户的角度出发,为用户提供他们自己定制的频道的推送服务,这样才能实现真正意义上的个性化服务。2. RSS 介绍RSS 为 Really Simple Syndication(简易供稿)的缩写,也叫聚合内容,是一种“轻量级、多用途、可扩展的元数据及联合推广格式” ,也可理解为一种规范。它本身是一种XML 格式,用于为内容整合的

8、客户端提供选择性的、汇总过的 Web 内容。目前许多站点开始通过创建 RSS Feed 向浏览者提供整合内容服务,提供信息通报,站点内容更新等服务。网络用户可以在客户端借助于支持 RSS 的内容聚合工具软件(例如 FeedDemon、周博通、看天下) ,在不打开网站内容页面的情况下阅读支持 RSS 输出的网站内容。可见,网站提供 RSS 输出,有利于让用户发现网站内容的更新,实现信息的推送服务。RSS 摘要采用层次结构来定义,在一个 RSS 文档中,最外层是一个元素,这个元素必须规定 version 属性,该属性明确了本文档遵从何种 RSS 版本规范。 元素只有一个子元素 ,包含了关于这个频道

9、(元数据)和它的内容的一些信息。元素中包含描述频道的名称。它表明别人如何访问你的服务;如果你有一个与你的 RSS文件内容一致的 HTML 网站,你的 title 元素值应该与你的网站的标题相同。描述对应频道的网站的 URL 链接地址。关于频道的描述和 元素。其中最重要的是子元素,一个频道可以包含许多 元素,即多个不同信息资源的摘要。元素 包含三个基本的子元素 ,描述 item 的标题,描述 item 的 URL 链接地址,指向信息提供者网站上的完整内容,描述 item 的摘要,该元素构成了 RSS feed 的动态部分。RSS 文件还包含许多可选元素,可以按需要使用。当然,RSS 文件本身是一

10、个 XML格式文件,其中也可以自定义标签。RSS 阅读器的优点:(1)抗干扰:没有广告或者图片来影响标题或者文章概要的阅读。(2)信息汇聚:用户可以加入多个定制的 RSS 提要,将多个来源的信息整合到单个数据流中,而不用在这些网站或信息系统之间跳来跳去。(3)最新资料管理:自动更新你定制的频道网站内容,保持信息的即时性。(4)订阅方便快捷:订阅对应的频道只需在阅读器中输入频道地址,马上就能实现信息同步,退定时只要将频道从阅读器中删除即可。而不象邮件订阅需要许多繁琐的操作 7,8。3. 基于数字图书馆的 RSS 推送服务系统的设计与实现在通常情况下,读者要获得图书馆的网络资源服务,首先进入图书馆

11、主页网站,然后选择相应的服务链接,通过一站式检索或单个系统的逐步检索获得所需结果,如图书借阅情况、新书通报、预约图书或数字资源文献等。这种服务是图书馆被动服务,用户必须主动关心才能知道结果,同时对用户的计算机技术能力和时间耗费都有很大的要求。我们设计的目标是通过对图书馆数字资源系统集成,根据用户个性化需求,生成 RSS 摘要,用户只要定制服务频道,就能将用户关心的最新信息即时主动地推送到用户桌面,通过 RSS 阅读器就能获得满意的推送服务,而不必直接访问网站就能得到更新的内容。3.1 系统模型结构基于数字图书馆 RSS 推送服务模型结构如图 1 所示。 其中:身 份 认 证系 统个 性 服 务

12、定 制 系 统频 道 生 成系 统频 道 数 据 库RS摘要RS阅读器(用户) 各种数字资源应用系统图 1: RS主 动 推 送 服 务 模 型自 动 搜 索引 擎学 科 馆 员整 理(1)个性化服务定制模块包括用户注册、服务的定制管理和频道发布等功能。主要完成读者个人信息的收集,所需文献资源的主题、关键词,检索式和文献资源需求的详细描述的登记以及发布可以订阅的个性化频道和一些公共频道的列表。(2)身份认证模块包括用户管理和身份认证功能。主要完成注册用户的审核,用户权限的限制。对于某些频道订阅有权限限制,进入频道后,首先进行身份认证,通过身份认证后,对应的频道才能订阅。(3)自动搜索引擎主要根

13、据用户需求,搜索相应资源,取得文献的链接地址和文献摘要等相关信息并归类形成 RSS 信息摘要存入频道摘要数据库。(4)频道生成模块,根据摘要数据库自动生成个性化频道以及公共频道。(5)学科馆员整理模块主要根据查看读者定制需求,对读者提出的检索式等做优化操作;对形成的 RSS 摘要进行过滤性剔除;以期获得更符合读者需求的文献资料。这样可以避免出现信息过载的问题,同时更能贴近用户的真实需求。(6)交流反馈模块。交流反馈在系统中占有重要作用,通过交流沟通,特别是学科馆员的沟通指导,更能挖掘出用户的个性化行为,同时也能使用户更了解系统功能。当用户选择定制以后,他就将被加到该定制的名单之列,交流模块就是

14、在此基础构建的。交流模块包括实时交互和异步交互,前者通过集成 NetMeeting 中的文字聊天、网络白板、网络会议、网络呼叫中心等实现,后者通过电子邮件或留言簿等方式实现。通过交流模块可以实现用户和图书馆员的讨论以及用户之间的讨论。(7)日志记录模块。主要记录用户历史订阅和推送文献的阅读情况,以便作统计分析和日志挖掘,为进一步提高个性化服务打下基础。3.2 系统开发平台选择基于数字图书馆 RSS 推送服务系统的开发平台采用 Linux 操作系统,数据库系统采用MySQL 数据库,编程语言采用 PHP 和 JavaSript 语言,Web 服务器采用的 Apache web 服务器。这几种技术

15、都具有免费、功能强大、互相集成和源代码开放的特点。使得系统的实现不再局限于 Windows 操作系统,也免去了相关软件的购置费用。同时,基于 Linux 操作系统具有稳定性高、免受病毒侵袭等优点。3.3 系统实现举例下面以 PHP+MySql 开发环境实现 RSS 公告频道服务的过程代码。文件名为: announce.php南通大学图书馆公告http:/ “;for each ($return as $line)$output .= “.htmlentities($lineheadline).“ “.htmlentities($linelink).“.htmlentities(strip_ta

16、gs($linedescription).“; 输出符合 XML 格式的每一项的标题,链接地址和简单描述等。$output .= “;echo $output; 生成 RSS 文件?4. 结束语基于数字图书馆的 RSS 推送系统,根据用户个性化需求,采用统一的搜索引擎,生成摘要数据库,结合读者的反馈并在学科馆员的人工干预下,优化用户定制和过滤摘要数据库,实现了动态频道技术和静态频道技术相结合以及推送服务智能化,能够较好地为读者提供信息资源服务,满足读者的要求。在系统试运行过程中,获得了较好的评价。如何完善统一的搜索引擎,减轻学科馆员工作强度,使之更贴近读者的需求以及提供更多的 RSS频道是进一

17、步研究的方向。参考文献:1 刘迎清. 国内信息推送研究综述. 长沙大学学报J,2006,20(5):82-86.2 http:/ 年 1 月 10 访问)3 崔宇红. 基于手机短信平台的图书馆信息推送服务. 大学图书馆学报J, 2004,22 (4): 67-684 王翠萍国内外图书馆 Mylibrary 个性化服务系统比较研究情报资料工作J ,2004,3:67-705 黄如花, 陈朋. 基于网络的集成化信息检索. 中国图书馆学报 J, 2005,1:46-49,60.6 http:/ 年 1 月 10 访问)7 张会娥 , 张智雄. 基于 RSS 的科技信息聚合系统的设计和实现 . 现代图书情报技术J,2005, 7:60-638 杨汉妮. 基于网络环境的 RSS 信息推送服务. 科技进步与对策J,2005,7:170-172联络方式作者简介:胡新平,南通大学图书馆副研究馆员,东南大学计算机应用在读博士,发表论文数十篇。通讯地址:江苏南通,邮编 226001。:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报