1、印本图书与电子图书的集成检索 (陈定权 刘胜(中山大学资讯管理系,广州,510275)摘要 传统的印本图书和 现代的电子图书并存于现代图书馆 之中,通过各自的独立的服务系统为读者提供信息服务,未能形成一个完整的 馆藏资源体系。本文在分析图书馆图书集成检索的现状和采取的技术路线基础至上,提出了 图书集成 检索与服务传递系统的功能结构,指出了图书集成检索将会发展成为馆藏资源整合的不可或缺的一部分。关键词 电子图书 印本图书 OPAC 集成检索Integrated Retrieval of Printed Books and E-Books at LibraryCHEN Ding-quan, LIU
2、 Sheng( School of Information Management, Sun Yat-sen University, Guangzhou, 510275)Abstract: Traditional printed books and modern e-books coexist at modern library that cannot form one integrative collection and provide information service for readers using respective information system. This paper
3、 analyses the actuality of integrated retrieval system of book at some library and the their technical routines, puts forwards the function framework of the retrieval system. Lastly, the paper predicts the trend of book integrative retrieval system that will be part of library collection integration
4、 in the near future.Key Words: Printed Books, E-Books, OPAC, Integrated Retrieval1. 引言图书馆馆藏资源包括传统的印本资源和现代的电子资源。图书馆为读者科学揭示和合理组织这些资源并以恰当方式为读者提供高效服务,然而图书馆并没有将印本资源与电子资源之间、电子资源与电子资源进行很好地集成,使得读者所感受到的仍然是一个个相互独立的信息服务系统,而不是一个完整的馆藏资源体系。图书和期刊是图书馆拥有量最大的两类资源。因为期刊和图书本身固有的特性,电子图书与印本图书的集成检索(简称图书集成检索)比电子期刊与印本期刊的检索集成
5、(简称期刊集成检索)要简单得多,图书馆也大多是先解决图书的集成检索,所以本文专门探讨了图书的集成检索。最常见的图书形态是电子图书和印本图书,其中印本图书也常称为馆藏图书。读者查找图书一般有两种途径:一种是通过 OPAC 系统来搜索印本图书的著录信息,另一种是通过某电子图书服务系统来检索或获取电子图书。在很多情况下读者需要同时使用两类系统,例如:读者利用 OPAC 系统查找到一本满意的图书,但 OPAC 提供的著录信息极为简单,就想利用电子图书服务系统来查阅全文;读者看到一本满意的电子图书,就利用 OPAC 查找图书馆是否有相应的电子图书以便借阅等等。在这些情况下,读者就希望在电子图书和印本图书
6、之间能够建立某种关联,方便读者在电子图书和印本图书之间自由浏览,这就需要图书馆能够为读者提供图书集成检索和一体化服务。本文所讨论的图书集成检索与一体化服务不是传统学者所讨论的“藏、借、阅、咨”一体化服务 1-2,而是一种能够消除印本资源与电子资源之间的技术隔阂、为读者提供图书集成检索与服务传递的一体化服务。本文得到广州市哲学社会科学发展十一五规划 2007 年度课题(07B36)资助2. IFLA 的书目功能需求与图书集成检索国际图联 IFLA 在 1998 发布了著名的 书目记录的功能需求 (Functional Requirements for Bibliographic Records,
7、FRBR)报告 3,旨在为书目记录提供一个抽象的概念模型和规则基础。该报告提出了四个概念:作品(work) 、内容表达( expression) 、载体表现(manifestation)和单件(item ) 。 作品。从本质上讲,作品只存在于创作者的大脑中并且只有以某种表达形式表达出来才能为别人所欣赏; 表达形式。作品只有通过表达才能够被看到、听到或感觉到,一件作品可以有多种表达形式。例如贝多芬的命运交响曲可以以钢琴谱的方式来表现从而被看到,或者是通过演奏的方式让别人听到; 载体表现。以某种作品可见的表现形式存在的载体的名称。例如一篇报告可能以HTML 页面发布,也可能以 WORD 文件、PD
8、F 文件形式发布,还可能以用上述发布形式的打印件发布。 单件。一种载体表现的单一样本,具体的物理实体,如一本具体的可触摸的印本图书或一个可以打开的 PDF 文件。FRBR 书目信息组织十分科学, OCLC 完全遵照 FRBR 模型开发出的 FictionFinder4就系统为读者提供书目记录的搜索和浏览服务,取得了很大的反响。但鉴于目前大量图书馆还是采用传统的 MARC 标准来描述书目信息,完全遵照 FRBR 模型来组织馆藏资源还十分困难。为此,很多系统就对其进行简化或者只借鉴其思想,并取得了很好的效果。如美国研究图书馆集团(RLG)在其网络版联合目录 RedLightGreen 将 FRBR
9、 简化为二级“作品载体表现” 5。本文所讨论的图书集成检索可以说借鉴了 FRBR 的思想,但图书集成搜索则是在某作品的一种表达形式(阅读)的集成,将一种表达形式的不同载体表现的图书集成为一条命中记录,比 FRBR 集成的思想宽松得多。与图书集成检索比较相似的系统有元搜索(Metasearching)或联邦搜索系统(Federated Searching) ,如 Ex Libris 公司的 MetaLib 和 Innovative Interface 公司的 Research Pro、清华同方异构统一检索平台 USP 等。但联邦搜索的搜索对象一般是异构的、分布式的全文数据库,尤其是论文数据库,很
10、少考虑到来自读者对印本图书和电子图书的功能需求,所以图书馆为了解决读者的实际需求,一般是没有采用联合搜索系统的。3. 图书集成检索的几个案例传统的 MARC 标准是为实体资料而设计的,后来为了支持电子资源的编目,特别增加电子文件地址与检索字段 (856 字段) 。基于此,图书馆将电子图书的书目信息经转换后导入到 MARC 书目数据库中,就在 OAPC 系统中实现图书集成检索。这种技术也就是一般学者所指的基于 OPAC 的资源整合技术 6,7。笔者挑选并逐一分析了几个分别代表着不同的图书集成检索技术路线的案例。3.1 中山大学图书馆中山大学图书馆利用原来的目录检索系统(采用深圳的 ILAS II
11、 系统)实现了图书集成检索 8。图 1 是某检索结果的部分界面。如图 1 所示,它将一件作品(黄如花主编的数字图书馆原理与技术 )的电子版本和印刷版本视为不同的检索结果,没有在两者之间建立任何关联。当点击印本图书的“详细信息” ,读者可以看到其基本著录信息以及馆藏地点和可用状态等。当点击电子图书的“详细信息” ,读者可看到其著录信息,并提供了超链接“点击此处查看电子书” ,引导读者到 Apabi 电子图书服务系统。图 1. 中山大学图书馆 OPAC 检索结果界面3.2 中科院国家科学图书馆中国科学院国家科学图书馆在其“图书联合目录”系统中实现了图书集成检索 9。图 2是其检索结果的部分界面。如
12、图 2 所示,该系统也没有在电子图书和印本图书之间建立某种关联,但与中山大学图书馆相比,有更多特色:第一,完全不同于原有 OPAC 界面的全新服务界面;第二,超链接“在线借阅”直接引导读者到电子图书的服务界面;第三,集成了原来 OPAC 系统不能集成的服务,如参考咨询等。图 2. 国家科学图书馆“图书联合目录”检索界面3.3 重庆大学图书馆重庆大学全新开发了资源导航与检索中心(Web OPAC 系统) 10。该系统提供了馆藏图书的查询、电子图书导航与查询的功能,要求数据库商按照图书馆元数据要求提供数据,将其并入该馆自行开发的 AdLib2.0 的统一检索平台中,让各种数据库商的平台逐渐回到后台
13、。在电子图书平台,读者可以浏览和查询电子图书,并且能将不同格式的电子图书都集成在一起,且能够有效链接到对应的印本图书(如果有的话) 。在馆藏书目检索系统,馆藏图书也可以有效链接到对应的电子图书(如果有的话) 。尽管印本图书和电子图书都有自己的检索平台,但两者实际上是一体的,实现了印本图书与电子图书之间的双向关联。图 3. 重庆大学图书馆的电子图书平台图 4. 重庆大学图书馆的馆藏书目检索为方便读者,该系统还提供了“一键搜索”功能。通过它,读者可以实现对印本图书和电子图书的一站式检索,检索结果按照印本图书和电子图书分列。不足的是,当有某本电子图书来自两个不同的电子图书服务系统,电子图书的检索结果
14、会显示成两条命中记录,而不是将这两本电子图书的检索结果整合成一条命中记录。3.4 读秀图书搜索“读秀图书搜索” (也称为读秀知识库)是由北京世纪读秀技术有限公司研发的一个面向全球的图书搜索引擎 11,具备图书搜索及全文文献传递两大功能,方便读者方便快捷地获得想要阅读的图书及其内容。如图 5 所示,该系统有效集成了印本图书和电子图书。超链接“本馆馆藏纸书”引导读者到该馆的 OPAC 系统;超链接“本馆电子全文”引导读者阅读图书全文,如果该馆没有购买电子全文,读者则可免费阅读前 17 页的全文。另外,该系统还,允许读者发表评论、基于社会过滤的图书推荐、文献传递等功能,不足之处是目前还不能集成第三方
15、的电子图书。图 5. 读秀图书搜索3.5 Primo:以波士顿学院图书馆为例Ex Libris 公司 2007 年推出的 Primo 可协助图书馆展示丰富的馆藏(图书、期刊文章和其它的数字对象) ,方便读者方便快捷地发现和获取图书馆的文献信息资源,而不管这些资源的格式和存放的位置。这里以波士顿学院图书馆为例,分析 Primo 是如何整合印本图书和电子图书的 12。在检索图书时,系统根据某种规则将不同载体表现(如印本和电子版本)的图书视为一条命中记录,然后指出该记录存在的几个版本(Versions ) ,读者可以浏览不同版本的图书著录信息。很显然该系统只是借鉴了 FRBR 思想。例如题名为gon
16、e with the wind 、gone with the wind:the Screenplay以及Gone with the wind : 50th anniversary edition并没有作为一件作品来看待,而是呈现为 3 条命中记录。 gone with the wind则有 8 个版本,其题名都是 gone with the wind,并且作者字段包含有 Margaret Mitchell,但有两种表现(book 和 Video) 。图 6 所展示的是一条命中记录的两个版本。尽管在同一命中记录的不同版本之间没有建立直接关联,但因为将它们作为一个命中记录来呈现,也没有给读者使用带
17、来困难。在检索结果页面, “Getit”功能可以根据资源的类型来提供到电子全文的链接或馆藏图书的链接。图 6. Primo 系统的检索界面3.6 EnCore:以肯塔基大学图书馆为例Innovative Interfaces 公司的 EnCore 系统与 Ex Libris 公司的 Primo 系统很类似,截止到2008 年 5 月,已经超出 100 家图书馆采用了该系统 13。这里以肯塔基大学图书馆为例 14,分析 EnCore 是如何整合印本图书和电子图书的。与 Primo 一样,EnCore 也不支持作品的概念,并且不支持 Primo 的版本概念。如图 7 所示,该系统能够将印本图书和不
18、同格式的电子图书作为一条命中记录来呈现,然后提供到电子图书和印本图书的超链接。在读者查看馆藏信息时,该系统还提供了导向其它版本的超链接,相当于建立了一个印本图书到其它版本的单向链接。图 7. EnCore 系统的检索界面4. 图书集成检索的技术路线和功能分析图书馆目前还不能也不一定有必要完全按照 FRBR 思想来组织馆藏资源,但实现图书集成检索却是迫在眉睫的任务。为此,图书馆、传统的图书馆系统开发商以及数据库开发商等单位都投入了大量的资源来开发或改造相关系统。下面将详细分析这些单位所采取的技术路线,并总结出图书集成搜索的功能结构。4.1 技术路线分析通过分析上述案例,我们大致可以将它们的技术路
19、线分为以下几类:4.1.1 完全基于传统的 OPAC 服务系统图书馆在无须引进或开发新的系统的前提下,只需将本馆所购买的电子图书的书目信息按照 MARC 标准转换并导入到原有的书目数据库即可,电子图书的地址存放在 MARC 856 字段内。但该方法存在如下不足:第一,电子图书编目数据维护困难。如果电子图书存放地址发生变化,原来所做的链接将全部失效,后期的维护成本较高;第二,所提供的功能受到原来的 OPAC 系统的框架限制,不能推出新的功能和服务。对于图书馆而言,这样的方案是简单易行,风险极小。采取该技术路线的有中山大学图书馆(ILAS II) 、国家图书馆(Innovative Interfa
20、ces 的 WebPAC PRO)等。4.1.2 在原有系统基础上进行二次开发在原有的电子图书检索系统和馆藏书目检索系统基础之上,图书馆重新开发出新的检索系统。以中科院图书馆为例。该馆图书联合目录系统就是基于 Z39.50 协议和某元数据标准在原有系统基础上实现了图书集成检索。图书联合目录系统有点像是一个元搜索引擎,将查询分发给一个或多个服务系统,然后重新组织获取的检索结果并增加新的服务(如参考咨询服务) 。这类方案不需要改变原先业已存在的文献服务系统并且都能正常工作,这样既保护了以前的投资和系统的稳定,同时能够推出新的服务。4.1.3 开发或引进新的信息系统根据开发系统的公司性质,大致又可分
21、为以下几种情况:(1)由电子图书供应商开发。电子图书服务系统原本处理的对象是电子图书,但为了满足图书馆图书集成检索的需求,将馆藏书目信息纳入其处理范畴。例如“读秀知识库”能够实现电子图书和印本图书的有效集成,但其不足之处是开放性不够,图书馆很难借助该系统将其它格式的电子图书集成到一起。(2)由图书馆/图书馆联盟自行开发。因为开发主体是图书馆或图书馆联盟,它们能够充分考虑某个或某类图书馆的特色功能需求。该方案需要图书馆投入大量的资源,其难度大、风险高。除非有雄厚的资金和优秀的 IT 技术人才的支持,图书馆一般不宜采用这种路线。例如重庆大学图书馆的 ADLIB2.0 和图书馆联盟 OCLC 的 F
22、ictionFinder。(3)由传统图书馆系统供应商开发。供应商在其系统基础上推出了资源发现与服务传递系统(Resource Discovery & Delivery) 。该类系统大量采用了网络 2.0 技术,能够对本地和远程的书刊、论文、数字内容等提供单一服务入口,方便读者发现和获取文献资源。这类系统将会成为读者寻找所需信息的理想地点并逐渐取代 OPAC 的位置,是目前实现电子资源和印本资源集成检索的最佳系统。该类代表产品是前面提及的 Primo 和 EnCore 系统。对图书馆而言,该技术路线风险比较小,经济投入较大,并且需要其它系统的支持。4.2 图书集成检索与服务系统功能通过上述分析
23、,基于目前图书馆的实际情况,笔者认为一个良好的图书集成检索与服务系统应该具备如下功能或特色:(1) 单一的服务入口。通过单一服务入口,读者单次认证或无需认证直接登陆并可访问馆藏资源,给读者的感觉是一个完整的馆藏资源体系,不需要在电子图书服务系统和馆藏图书服务系统之间奔波 。(2) 能够在同一本图书的不同载体表现之间建立关联。将这些不同载体表现的图书视为一个命中记录,并在这些载体表现之间建立关联。(3) 检索结果集的分面浏览。按照某个分面体系,例如载体表现、年代等来提供分面浏览,方便读者在大结果集中快速找到自己所需的文献。(4) 构建一系列的网络服务(Web Service) 。这些服务包括资源
24、的发现、定位、请求、传递、共享等。基于这些服务,图书馆可以将资源发现与服务传递等方便地集成到不同的信息系统之中或针对特殊需求而进行的二次开发,如个人数字化学习系统、课件管理系统、校园门户网站等,读者不访问图书馆网站也可以方便地获取来自图书馆的服务。(5) 提供多种排序方式。这些排序方式有相关度、时间、流行度等。(6) 提供图书推荐功能。图书推荐可以是基于图书的主题内容也可以是基于社会过滤。例如基于图书的全文内容或书名来提供相关图书、基于社会过滤技术“很多人借阅(收藏)本书的同时也借阅(收藏)了”等。(7) 个性化功能。允许读者设置个人信息、个人书架、个人空间等,既可以用来保存自己的个性化信息,
25、方便读者之间的交流,又可以为服务效果的定量评价提供数据支持。例如,通过分析电子/印本图书的访问和借阅次数等使用数据,为下列管理行为提供支持:动态调整电子图书与印本图书之间的配置比例;为印本图书采访提供决策支持;评价图书采访的效果;分析读者的需求和阅读行为;统计流行图书等。5. 结束语图书只是图书馆文献信息资源的一种形式、馆藏资源的一部分,图书集成检索仅仅只是图书馆实现馆藏资源集成的第一步。图书馆应该将其所有的资源集成起来,不管其是印本资源还是电子资源,也不管是在存储在本地(图书馆)还是通过网络远程访问的,使得它们形成一个完整的馆藏资源体系,方便读者发现资源和利用资源。尽管目前出现了商业化的资源
26、发现和传递系统也在很多图书馆得到采用或试用,有取代传统 OPAC 成为图书馆服务门户的趋势,但该系统还处于不断完善之中,没有考虑到中国图书馆界的实际需求和中文信息服务系统的,中国图书馆界最终能否成功引入国外的信息系统或者中国能否成功开发出类似系统,我们还将拭目以待。参考文献1 麦淑平. 图书馆“借、阅、参一体化”服务模式刍议 J. 国家图书馆学刊,2007,(3).2 叶艳鸣 等. 论高校图书馆“藏、借、阅、咨”一体化开放服务管理模式J. 大学图书馆学报,2007,(3).3 Functional Requirements for Bibliographic Records EB/OL. 20
27、08-1-10. http:/www.ifla.org/VII/s13 /frbr/frbr.pdf.4 OCLC. FictionFinder: A FRBR-based prototype for fiction in WorldCat EB/OL. 2008-5-29. http:/www.oclc.org/research/projects/frbr/fictionfinder.htm.5 Patrick Le Boeuf. Brave New FRBR World EB/OL. 2008-5-29. http:/www.loc.gov/loc/ifla/imeicc/ pdf/pap
28、ers_leboeuf-eng.pdf.6 赵凤丽. 我国图书馆 OPAC 功能及其资源整合现状分析. 图书馆界, 2006(4):39-42.7 张薇. OPAC 系统与馆藏数字资源整合研究. 晋图学刊, 2004(6):41 43.8 中山大学图书馆EB/OL. 2008-5-29.http:/.9 重庆大学图书馆EB/OL. 2008-5-29. http:/ 中科院国家科学图书馆EB/OL. 2008-5-29. http:/ 读秀知识库EB/OL. 2008-5-29.http:/ Super Sleuth - Boston College University EB/OL. 200
29、8-5-29. http:/www.bc.edu/supersleuth. 13 Innovative Interfaces. Encore Libraries Surpass 100 EB/OL. 2008-5-29. http:/ pr_display.php?id=378.14 InfoKat-University of Kentucky Library EB/OL. 2008-5-29. http:/infokat.uky.edu/EncoreTab.htm.15 Bibliographic Services Task Force of the University of Califo
30、rnia Libraries. Rethinking How We Provide Bibliographic Services for the University of California (FINAL REPORT) EB/OL. 2005.12. http:/libraries.universityofcalifornia.edu/sopag/BSTF/Final.pdf作者简介 陈定权(1974) ,男,副教授,中山大学资讯管理系.刘胜(1982) ,男,中山大学资讯管理系 07 级图书馆学研究生通信地址:广州市新港西路 135 号中山大学资讯管理系,510275电子邮件:联系电话:13380085107