1、1基于 Web2.0 技术的 WPopacWPopac:A New OPAC Based on Web2.0黄田青 陈清文(嘉兴学院图书馆 浙江嘉兴 314001)摘要:本文对基于 Web2.0 技术的图书馆新一代的 OPAC(图书馆公共检索系统)WPopac 进行了介绍,讨论了以开源系统 (OSS) WordPress 来架构馆藏书目信息的实现过程,提供了改进图书馆现有 OPAC 的新思路。 关键词:Web2.0;OPAC;WPopac;OSS;LibraryAbstract:The paper gives an introduction to the WPopac being one of
2、 new models for OPACs in libraries. Inside of WPopac is the framework of WordPress making of a library catalog. A consideration for innovations in OPAC is being put forward therewith.Key Word: Web2.0;OPAC;WPopac OSS;Library 中图分类法: G250.7 文献标识码: B1.引言自 1976 年图书馆 OPAC(Online Public Access Catalog 图书馆公
3、共检索系统)出现以来,图书馆的书目检索技术的更新比较缓慢。1 尤其是在注重人性化的可读写互动和信息共享的 Web2.0 时代,现有的 OPAC 存在着许多缺点。图书馆的 OPAC 通常是 ILS(Integrated Library Systems 图书馆集成系统)的组成部分。图书馆一旦购买了某个 ILS 就会动地使用集成在该 ILS 的 OPAC。而 ILS 开发商出于商业利益并不愿意向图书馆开放 API,造成了图书馆就很难从自身要求出发对 OPAC 系统进行针对性的二次开发。OPAC 只局限于图书馆馆藏书刊的信息检索,单向地向用户提供书目信息和用户信息,不重视集体智能(collective
4、 intelligence)的运用。其检索范围也无法延伸至OPAC 之外,检索页面单调乏味。现有 OPAC 支持的 Z39.50 跨库检索支持也十分有限。同时 OPAC 也缺乏聚类搜索、自然语言搜索、搜索结果排序等功能。OPAC 也不具备用户参与书目信息共同建设的条件,用户在书目信息中或无法添加自己的见解,或无法对书目数据中信息进行补充。实际上,现有的 OPAC 已经无法适应 Web 2.0 下图书馆与读者之间信息共享、平等交流的现实需要了。Web 2.0 是一个互动双向网络。在此条件下,图书馆理应从由单纯的“用户读取”模式上转变为“参与编写”和“共同建设”模式。作为图书馆与用户之间的信息互动
5、交流的桥梁 OPAC,更应在技术上做出改进以适应用户在 Web2.0 下的信息检索需求,否则缺乏生气和互动的 OPAC 将会于用户,尤其是年轻用户渐行渐远。为改进现有 OPAC 的窘境,美国马萨诸塞洲 Plymouth 州立大学信息技术工程师 Casey Bisson 在 2006 年试验性地开发了基于 Web2.0 的新一代图书馆 OPAC 系统软件 WPopac,当年已在该大学的 Lamson 图书馆(http:/www.plymouth.edu/library/opac )投入试用。WPopac 为开源系统(Open Source System ,OSS),核心模块为 WordPres
6、平台,Open Search搜索引擎和 Amazon 提供的 Open API,支持 SRW/SRU 协议。WPopac 特点是可将每条书目信息变为一个博客页面供用户浏览,可实现图书馆馆外的搜索引擎使用主题词检索或描述性语言检索图书馆馆藏书目信息。用户对书目信息可自由地添加评论并与图书馆展开互动。WPopac 满足了 OPAC 在 Web2.0 环境下系统互操作要求。它是开源系统在图书馆开发利用的成功实例之一。 12006 年 12 月著名的梅隆(Mellon)信息年度合作奖(2006 MATC,Mellon Awards for 本文系浙江省哲学社会科学规划办课题资助项目研究成果之一,编号:
7、06CGGL06Z 2Technology Collaboration)被授予 CASEY BISSON 本人,以表彰他在开发新一代 OPAC 的努力和成就2。Plymouth 州立大学和 Casey Bisson 将所获的 50,000 美元奖金购买了一批美国国会图书馆(LOC)的书目数据,准备对数据进行处理后以 CC(创作共用协议)或GNU(通用公共许可证)的方式提供给有兴趣的用户,特别是规模较小的图书馆,用以实现书目数据共享和再次开发,从而吸引更多用户参与 WPopac 开发。WPopac 的系统应用和后台管理程序即将对用户免费下载。WPopac 的出现完全回应了 ARL(美国研究图书馆
8、协会)和 OCLC(联机计算机图书馆中心)在 1999 年提出的奠基石原则(The Keystone Principles)的要求, “图书馆应该构建系统的互操作性以便开发和构建开源软件(OSS)用于信息的存取、传播和管理” 。32.相关技术2.1. WordPress开放架构的 WordPress 提供开放源代码并拥有 GNU 的 GPL(公共授权许可证)保证了所有用户都能自由使用。WordPress 是使用最广泛的 Blog 系统,采用 Apache+PHP 以及MySQL 数据库。其 Web 标准支持性好,页面主题与插件丰富,用户可在系统内编写和开发插件,也可以随心所欲的重组页面,并能快
9、速而简便的搭建个性化 Blog 平台。WordPress 允许多用户参与 Blog 的管理,开发与管理成本低。 2.2. Amazon 的 APIsAmazon 公司面向其用户开放其网站 APIs。这使用户在调用 Amazon 的 Web services时无需互联网应用程序中的图形化用户界面,只需将请求直接发送给在公司后端运行的程序就可以得到想要的数据。Amazon 其中一项 Web service 取得了 Weblogger 公司的 API 支持,让用户只需一步就可以在用户的 Blog 中创建一个 Amazon 销售图书的页面 URL,用户可以获取 Amazon 利用 Web servic
10、es 技术集成提供的图书封面、目录、摘要、推荐和读者评价等信息。2.3 SRW/SRUSRW/SRU 是指 SRW(Search/Retrieve for the Web)和 SRU(Search/Retrieve URL Service)协议。这两者是针对 Web 的信息检索协议,以 Web 服务的架构实现 ZING 的核心功能。SRW 以 SOAP 为基础, SRU 则以 URL 为基础,使用 HTTP 与 SOAP 的无状态通信,采用 XML 作为信息传输编码,也可以单纯使用 URL 传递查询请求,用 WSDL 来定义 Z39.50 传输的格式信息,检索结果也以 XML 格式输出。SRW
11、/SRU 支持现存的多种Web 检索方式,采取模块化方式组合调用,共同返回结果。许多站点均支持该协议。AMAZON 采用了混搭模式( Mashup) ,利用 SRW/SRU 协议将开放的检索 API 和 A9 开放的检索 API 进行整合,可融合多种资源内容,保证与其他任何支持 SRW/SRU 的系统进行高层互操作。2.4 Open SearchAmazon A9 公司开发 OpenSearch 是一项用于描述搜索信息的新技术。它使用 XML 格式文件描述网站的搜索信息,当浏览器访问到网站的时候,浏览器通过 link 标签找到该XML 文件,提示用户将该搜索项添加到搜索框。 OpenSearc
12、h 向检索用户提供搜索结果的RSS(聚合内容) 。WordPress 提供 WordPress OpenSearch 插件,可以在每个 Blog 中输出OpenSearch 搜索结果。3.WPopac 系统设计3.1 WPopac 系统环境要求为 Php5X+MySQL 5X 和 Windows X OS。Php+xslt 用于编写相应的操作代码并生成页面,MySQL 数据库则用于转入后的 MARC 数据保存、发布以及内容3编辑。馆藏图书 ISBN 号采用 EAN-13 位条码采集。每条书目信息都有相应的静态 HTML页面生成。系统目前采用 WordPress OpenSearch 1.1 搜
13、索引擎,该引擎负责抓取所有页面并生成索引,搜索结果可进行相关度排序。管理人员只需具备安装和维护 WordPress 的技术即可保证系统安全稳定地运行。3.2 WPopac 采用了许多具有 Web 2.0 特点的技术。系统使用 AJAX 网页混合开发,检索页面在不打断交互过程中进行重新加载和动态更新,动态创建 Web 界面用于显示图书的封面信息、评论、馆藏信息,满足了读者对书目信息的全面了解,从而激发读者的阅读兴趣4。3.3 WPopac 支持 SRW/SRU 协议。它采用 AMAZON 提供的开放 API,可对图书的整书内容执行主题词检索。同时在每个静态页面中套用 Amazon 提供的精彩书评
14、。Wpopac 为以后有更多的开放 API 接入准备了接口。3.4 站内搜索引擎 Open Search 采用查询执行算法5和可延续的固定 URL 语法,执行自然语言搜索,具有拼写自动纠错功能。Open Search 具有基于书目作者和主题词相关条目的自动识别功能。页面提供检索结果的相关度排名列表。系统为图书馆外部的搜索引擎如Google 提供索引,可使这些搜索引擎能搜索到 WPopac 提供的书目信息的 URL。如在Google 搜索作者名 Joe Monninger 的书目信息,其页面出现的首条搜索结果即为 Wpopac 提供的 Lamson 图书馆收藏的该作者图书的 URL。3.5 WP
15、opac 具有 WordPress 平台的基本功能,每个 Blog 页面具有评论和引用功能,并向用户提供 Blog 标签 (tagging)和书签(bookmark) ,提供新书的书目信息 RSS(聚合内容)订阅。系统提供了执行 XHTML 的校验入口以随时校验和完善系统代码。系统提供的WordPress 后台管理入口方便了用户创建自己的个性化界面。支持用户个性化设置和插件开发也是 Wpopac 有别于现有 OPAC 的特点之一。Wpopac 为图书馆提供了外部社区、程序员和设计人员的登录口,同时允许社区的协同参与使图书馆资源更具信息化,可使Wpopac 在一定程度上摆脱 ILS 的束缚。3.
16、6 系统启用 WordPress 构建书目信息前端界面,页面简洁富有个性化。 “最近搜索”侧栏提供了用户检索结果的记录保存。 “热门图书排行榜”提示最受用户喜爱图书的借阅信息。“最新评论栏”是展示用户针对性的图书评论。居中页面为书目信息显示栏,显示包括书目信息,图书状态,馆藏地点等传统信息。图一 Plymouth 州立大学 Lamson 图书馆 WPopac 示意图4. WPopac 系统不足4WPopac 系统的数据载入和转换的是必须克服的难点之一。虽然 WPopac 采用的MySQL 支持绝大部分重要的数据类型,但基于今后图书馆用户的多类型数据库,WPopac的载入命令行工具必须有效设计才
17、能完成数据的载入和转换。插件开发还有待深入,包括在 WordPress 下用于 WPopac 的一些轻量级插件开发、IDE调试、插件测试和部署策略等思路还需要完善。WPopac 需要对 WordPress 底层代码做出更多的修改,以便正确执行系统要求的 SQL语法。修改过程至今仍未结束。Casey Bisson 提供的一些开发后的代码供参考:function next_posts_link($label=Next Page , $max_page=0) global $paged, $result, $request, $posts_per_page, $wpdb, $max_num_page
18、s; if ( !$max_page ) if ( isset($max_num_pages) ) $max_page = $max_num_pages; else preg_match(#FROMs(.*)sGROUP BY#siU, $request, $matches);if(!$fromwhere)$fromwhere = $wpdb-posts;/$numposts = $wpdb-get_var(“SELECT COUNT(DISTINCT ID) FROM $fromwhere”);$numposts = $wpdb-get_var(“SELECT COUNT(*) FROM $
19、fromwhere”);$max_page = $max_num_pages = ceil($numposts / $posts_per_page);if ( !$paged )$paged = 1;$nextpage = intval($paged) + 1;if ( (! is_single() )/, 另外,WPopac 不支持布尔逻辑检索,这对于有经验的信息搜索用户会觉得不习惯。但对于一般用户而言,他们使用布尔逻辑检索的观念比较淡漠,宁愿将搜索词整行地输入也不使用有逻辑关系的布尔运算符进行检索。事实上,布尔检索模式能不能代表用户信息搜索的行为习惯已争论了很久6。WPopac 对于这个问
20、题的解决将视用户的实际检索行为发展的趋势而定。其他一些次要的系统模块,如预约通知等还未开发完成。5.结语受网络搜索引擎,特别是在线图书搜索引擎的强大的影响,用户对图书馆已有的OPAC 所能供的搜索功能的期待值已经有很大的下降,加上 OPAC 固有的一些技术上的缺陷,用户对 OPAC 的依赖性已越来越低。2005 年 OCLC 在对图书馆与信息资源的认知:给 OCLC 成员的报告报告中提到:信息用户中的 “84%的用户使用搜索引擎进行信息检索,1%的人从图书馆网页上进行信息检索,只有 10%的大学生认为,在通过搜索引擎找到图书馆网站后,图书馆的馆藏可以满足他们的信息需求。 ” 7 其实 OPAC
21、 相关技术层面的改进已有了很多。但是建立在开源框架下的基于 Blog 平台的 WPopac 为 OPAC 却是第一次出现,这为在 Web2.0 环境下的 OPAC 发展提供新的开发思路 8。它的价值在于 OPAC 可以5和图书馆外的搜索引擎相互对接,既可避免被搜索引擎所淹没,又可以使习惯与利用搜索引擎检索书目信息的用户变成潜在的图书馆用户,能极好地扩大图书馆的影响力。简洁而友好的系统界面使 WPopac 真正地满足了用户检索书目信息的兴趣和习惯。 WPopac 激发了图书馆与用户的人人互动,帮助成员馆鼓励和吸引大量的本地用户群加入,引发他们对图书馆资源的充分兴趣,让用户从单一的图书馆资源的阅读
22、者转变成为资源建设的参与者,使知识共享变的更为容易。期待着 WPopac 能不断完善,在 Blog 依托下让图书馆的 OPAC在提供传统的信息服务同时,还能成为图书馆的服务平台、用户的个人知识管理平台和社团的学术交流的平台。这也是符合 Web 2.0 的一个关键原则:服务主要扮演着的是智能代理作用,网络上的各个边缘点连接起来并充分利用了用户自身的力量才是关键9。参考文献1. The University Of California Libraries. Final Report: December 2005. 2007-01-07http:/libraries.universityofcali
23、fornia.edu/sopag/BSTF/FinalsansBiblio.pdf 2. MATC 2006 Winners Announced.http:/rit.mellon.org/awards/matcpressrelease.pdf/attachment_download/file3.The Keystone Principles. 2007-01-27http:/www.ala.org/ala/acrl/acrlpubs/crlnews/backissues2000/february3/keystoneprinciples.htm 4. Wiki WorldCat (WikiD)
24、Pilot. 2007-01-27 http:/www.oclc.org/productworks/wcwiki.htm 5.Casey Bisson. Presentation: Faceted Searching And Our Cataloging Norms. 2007-02-07.http:/ 6 Charles R. Hildreth. The Use and Understanding of Keyword Searching in a University Online Catalog, Information Technology and Libraries, 1997(6)
25、 117.Perceptions of Libraries and Information Resources (2005). 2007-02-18http:/www.oclc.org/asiapacific/zhcn/reports/pdfs/Percept_all.pdf 8. Pter Jacs. North Carolina State and Plymouth State Universities OPACs and Dialogs PsycINFO Online 2007(2) 559 Tim OReilly. What Is Web 2.0 2007-03-04http:/ 男 1968.8 生 大学本科 馆员研究方向:信息资源管理通信地址:浙江省嘉兴市越秀南路 56 号嘉兴学院图书馆联系电话:0573-3646457Email: 陈清文.男. 1964.2 生.硕士研究生毕业.副研究馆员研究方向:信息资源管理联系电话:0573-3642478 Email: