1、未来数字图书馆的发展方向之一服务主导型数字图书馆上海交通大学图书馆 杨宗英 郑巧英21 世纪人类已进入了高科技知识经济时代,计算机、信息和通讯等高科技技术的迅速发展,以信息高速公路和多媒体技术为标志的信息技术革命,将图书馆推向自动化、电子化和数字化的方向发展。数字图书馆的出现对于正在不断产生的浩瀚的信息资源的整理、管理、提取和服务,具有十分重要的作用,因此数字图书馆研究和发展的意义凸显出来,成为当前的一项重大课题,引起了世界性的广泛关注。全球范围内已有许多国家和地区积极利用最新信息技术创建数字图书馆系统及数字图书馆资源库,一批雏型成果已在 Internet上出现。今后数字图书馆的三种主流模式经
2、过了十几年对数字图书馆各种主要技术的研究和相关技术的发展,为建立现实的数字图书馆打下重要的技术基础,现已诞生或正在建设一批数字图书馆,主要有三种类型: 特种馆藏型模式:将自己图书馆的珍藏(包括善本、古籍和珍藏)或特种馆藏(包括图片、声音、音乐、影视等各种载体)的资料进行数字化,提供网上共享。例如从美国国会图书馆的“美利坚记忆”为代表的一些国家、地方图书馆等。 服务主导型模式:这种服务模式的资源一般由三部分组成:a 图书馆本身的数 字化特种馆藏;b商用的网上联机电子出版物或数据库(包括在本馆的资源镜像库) ;c在因特网上有用的文献信息资源。它们用统一的界面向读者提供服务。例如目前国外有些大学的数
3、字图书馆模式,又如美国加利福尼亚州的数字图书馆(CDL),伊利偌伊斯州的 IDAL 即伊州的数字学术图书馆等。 商用文献型模式:一些文献服务公司、出版社、代理商等建立种供商用文献型的数字图书馆,提供全文的期刊、杂志、电子图书(也包括音乐和影视资料) 等,般既有索引数据库、又有全文的对象数据库。例如中国的书生、超星数字图书馆提供电子图书,荷兰的 E1sevier 公司提供 1500 多种全文杂志,美国 OCLC 的 NetLibrary 也提供几万种电子图书供读者使用。服务主导型数字图书馆的体系结构它以三种主要数字化资源为基础(即图书馆本身的数字化特种馆藏;商用的网上联机电子出版物或数据库;在因
4、特网上有用的文献信息资源),由个统一信息访问平台和个为读者服务的网上参考咨询台(即 Virtual Reference System)为两翼,实现对读者的有效服务。这两个平台对一个实用的数字图书馆是不可缺少的。两个平台在系统结构上有些是相互渗透的。它的体系结构如图。数字图书馆的基础一一特种资源的数字化和数字化资源以近来上海交通大学研究和建设服务主导型数字图书馆为例1 本馆数字化特种馆藏上海交通大学图书馆已建约 35 万种书目记录,包括 1980 年以来,交大中外文图书藏目录,中外文期刊目录。建立上海交大博硕士生论文全文数据库和交大电子杂志等全文数据库系统, 如:上海交通大学学报 ,电子书系统如
5、“Proceedings of the International Symposium on Academic Library in the 21st Century”会议录和交大的各种课程的数字教学参考书,民族音乐数据库等。多媒体视频点播系统,选择部分有启迪创新意识的视频节目如科学与发现等视频资料、院系教学示范实验、多媒体语言教学资料和若干科幻片等的系统,提供数字化资料在校园网上实时点播。此外,在图书馆提供二个宽带,1 00MBS 速率的多媒体电子阅览室供读者在图书馆进行视频点播。CALIS 高校数字化馆藏,如中西文期刊联合目录、中西文图书联合目录,及中国高校硕士、博士生论文摘要数据库等。2
6、 商用网上联机电子出版物(1) 网上联机出版物:购买一批文献数据库,如 Elsevier 全文电子杂志镜像站,中国全文学术期刊镜像站,EI Village,IEEE IEE,Web of Knowledge,EBSCO ,OCLC FirstSearch,ABI 等联机数据库及 NetLibrary 等电子书系统的服务(2) 提供在校园网上的光盘数据库服务,如 Apply Science and Technology,NTIS,LISA,INSPEC 等十多种光盘库。3 因特网上有用的文献信息资源。建立我校进入“2l 1 工程”重点学科及其学科群的文献信息资料库。如“高速网络工程” 、 “船舶
7、及海洋工程” 、 “先进制造技术”等建立十个重点学科的专业门户网站,我们与专业人员合作,配合学科的发展,建立国际相关的研究机构、著名专家学者研究动态、电子出版物、相关国际会议等数据库及免费中西文全文期刊。逐步建立“能源、交通、信息”三个一级学科导航数据库。总之。将这三方面的信息资源,用一种统一界面向读者提供服务。如果读者要访问上述信息可进入我馆 HOMEPAGE(网址 http:/),在其上有声、图、动态图像内容。它们放在图书馆的各种服务器上。信息服务平台信息服务平台包括统信息访问平台和网上参考咨询平台。1统一信息访问平台当前,各种数字图书馆雏型或试验基地有若干种本馆特种馆藏的数据库系统,或购
8、买若干商用二次文献、全文数据库,有些是镜像在本地,有些是购买访问权,数据库在异地,或从因特网上查找有用的资源。这些数据库往往在不同型号的服务器上,使用操作系统和数据库平台不同,使用各种不同检索系统。统一信息访问平台主要解决异构平台的信息资源检索, 向用户提供方便检索的统一界面,提供不同数字图书馆互操作,使读者不必分别一个一个进人不同数据库进行检索,让读者以最快的速度,查找到自己所需的源文献。我们几年来不断探索此问题。最初,我们在主页上设置了搜索引擎,使得各种数据库或文件在 HTML 层面能实现关键词的 “跨库检索” ;研制 Z39.50 服务器和客户端,利用客户端的广播式查询,访问能实现 Z3
9、9.50 协议的各种不同数据库;2 002 年,我们也探索用“中间件”技术,将八种国外引进的全文数据库的主要索引,做成“中间件” ,使读者通过一次检索,就知道所需的资料在哪个数据库,再进一步查找原文献;2003 年研究采用 OAI技术实现跨平台检索;利用中间件技术研制“联邦检索”和“跨平台”的统一平台检索试系统。我们还在进一步深化这方面的研究如 METs Web Service 等技术。国内外汁算机、信息学科的专家也将此作为个热点在探索,一些厂商、公司也做了些有益的探索,如 ISI 公司,以 Web of Science 为核心跨平台检索八个相关数据库,做了“引文”等多种链接,又如国内外跨平台
10、检索软件 Webfeat,SFX,Metelib ,TRS,TPI等。相信随着 XMI、元数据等技术的深入应用,将较好地解决异构平台的信息检索问题。42 网上虚拟参考咨平台近两午来,Virtual Reference System(VRS)也成为世界各主要图书馆研究的热点。这是因为数字图书馆和网上电子文献信息报务,越来越被广大读者认同,网上虚拟参考咨询服务的需求越来越大。相信实现了数字图书馆的模式以后,VRS 将与传统图书馆参考咨询部样,成为 DL 不可缺少的部分。目前,研制 VRS 有几种情况和趋势:(1) 在网上对各个文献信息数据库本身如何查找、步骤等作介绍、说明,建立学习中心(2) 汇总
11、常见问题,如一百问答挂在网上。现已趋于研制成 FAQ 数据库系统,进而建立知识库。读者可上数据库查找自己的疑问是否已有现成答案,或输入要提问的问题后再查找被解答情况,或从 Email 获得回答等等。(3) 利用专家系统技术,研制具有与读者交互功能,为解答读者问题的咨询系统。(4) “座堂”学科专家,网上回答读者问题系统,如上海图书馆 VRS 有十六位专家;美国国会图书馆的 VRS 系统也邀请一批专家,网上公布他(她)的联络办法等,有组织地用 Email 等工具为读者解答各种 (类) 问题。他们正在发展成为一种实时的咨询系统,如使用 Chat, Call Center, NetMeeting 等
12、工具,在网上“面对面”地(将来也可用视频技术,真正 “见面”) 进行咨询,可用对话、文字 “Talk等形式,咨询人员可以看到读者网上联机检索时的疑问和问题,甚至在不中断其检索的情况下,帮助、指导读者解决问题。这里,还可应用“页面推送技术” , “同步浏览技术” , “音视频技术”等,以提高实时咨询的质量。(5) 进而发展成分布式联合虚拟参考咨询系统。(6) 各种标准和规范正在网上参考咨询系统得到应用。数字图书馆研究和建设的若干问题在未来数字图书馆研究和建设中,要注意如下问题:(1) 各种载体数字化技术:如印刷型的文字和图像的数字化和服务的格式、分辨率的确定,音频和视频资料的数字化和服务格式。(
13、2) 元数据研究:对各种典型元数据分析,包括 DC、MARC 等及我国正在制订的“数字对象基本元数据”和“专门数字对象描述元数据规范”的研究及在数字图书馆的应用,各种典型元数据的转换等。(3) 信息检索平台:为了让用户以最快的速度获取所需要的资源,提供“一站式”服务,出现统一检索平台包括“跨库检索”和“联机检索” 。当前文献检索查全率解决得相对好些,查准率正进一步攻克,如基于自然语言的语义检索、数据过滤等技术。(4) 信息发布技术:包括用户界面友好,使用方便,个性化服务,可视化技术的应用等,也在研究之列。(5) 相关标准和规范:这里且不考虑网络的协议等,我们着重要考虑数字资源的组织和服务、标准
14、和规范,数字资源开放性描述与标准的应用。我们非常关注数字图书馆的互操作标准和协议,如 OAI, Z39.50 等。(6) 知识产权问题:我们要认真研究著者的著作刊和出版社的版权,尊重资源的知识产权,又注意研究 “著作权法”中的“合理使用”条款,更好地让资源共享。注意研究 DRM 技术和基于 XML 和密钥的第二代数字权益管理技术 (XrML)及应用。(7) 电子商务:不断解决数字对象服务时的付费问题,与电子商务系统有良好接口。(8) 系统集成:像上世纪八十年代一样,形成图书馆自动化集成管理系统。因数字图书馆建设刚起步 不久,它的集成系统应有一个逐步成熟期,我们渴望有一个从印刷型和各种载体资源的
15、 数字化数字化资源(包括各种商用电子资源)的存储和管理数字资源发布 信息资源访问一一版权保护等,从资源建设、管理到服务,形成一套完整的数字图书馆集成系统。(9) 虚拟参考咨询:上述已探讨,特别要关注分布式联合虚拟参考咨询和基于语音识别的语音数字化技术。 后者有利于方便地为读者咨询,又利于存档,经加工转入知识库。(10) 数据的永久保存:它主要涉及三个问题:A 每天在因特网新出现的几亿条信息( 专家研究:其生命周期约为 6070 天),哪些是应该保存,谁来保存 ? B保存:保存的格式等。 C用什么介质保存,最经济、安全、可靠。如“离线” 、 “近线” 、 “在线”等方式,或几种方式的结台。许多技
16、术,标准和规范不断发展,应当不断研究与探索,如 METs,Web Service,Grid 等。 结束语当前,世界各国已把数字图书馆作为信息化社会的基础设施和知识环境。21 世纪的头 15 年,在世界各地和我国,将有一批数字图书馆涌现出来,其主要有三种模式:即特种馆藏型数字图书馆、服务主导型数字图书馆和商用文献型数字图书馆。许多数字图书馆的关键技术将不断得到解决,如分布异构海量信息环境下,面向数字图书馆系统的体系结构和互操作问题;各种载体数字化获取和表现技术(包括中文文字资料的智能标引) ,基于自然语言的语义检索;各种数字化资源元数据的标准和规范化技术;提供给用户多语种的多模式友好和智能的人机交互界面;全球化的中文信息资源有效组织、集成和共享;还有版权保护、信息安全和管理等问题。在我国,像中国国家图书馆、上海图书馆等特种馆藏型数字图书馆,像清华大学、北京大学、上海交通大学等服务主导型数字图书馆雏型将逐步发展成为实用的数字图书馆,并在网上互为虚拟图书馆。他们能使读者以最快的速度获取最需要的资料,能高度实行网上电子资源共享。