1、哈佛大学在线公共目录信息系统 Hollis Classic 和 Hollis 的深入探析袁晓园(南京大学图书馆 南京 210093)文 摘 哈佛的 OPAC 系统一直位于世界前列。 这篇研究报告从多层面、多角度分析和比 较了哈佛大学图书馆的在线书目检索系统 Hollis Classic 和 Hollis,深入挖掘两者的技术支持、创新服务理念和功能特色。旨在揭开它们的面纱, 为国内 OPAC 系统的发展提供借鉴模式和参考依据。关键词 Hollis ; Hollis Classic ; 哈佛在线书目检索系统The Deeper Study on Hollis Classic and Hollis
2、of Harvard University Online Public Catalogue Systems Yuan Xiaoyuan(Nanjing University Library, Nanjing 210093)Abstract:Harvard OPAC is on the top lists of the world. The article is to analyze and compare Hollis Classic and Hollis of Harvard University Online Public Catalogue Systems from many aspec
3、ts and deeply mine their technical supports, creative service ideas and functional characteristics. The purpose of the study is to open the veil of Harvard OPAC and provide learning models and references for the development of national OPAC in China. Key words:Hollis, Hollis Classic, Harvard OPACOPA
4、C 系统是读者检索和查询图书馆馆藏的基本工具。哈佛大学图书馆作为全世界最大的大学图书馆, 现拥有 73 个分馆,每个分馆都将 Hollis Classic1和 Hollis2 作为馆藏检索系统,Hollis 全称为 Harvard Online Library and Information System, Hollis Classic 是它的传统版, Hollis 是新版。为了满足研究者日益增长的信息需求,开发检索系统的功能,挑战 Google 和 Amazon的技术创新,近 30 年,从卡片目录、机读目录(MARC)、 在线联机系统(OCLC),到 Hollis Classic 和新版 H
5、ollis 的完善与推广,哈佛图书馆善于利用新技术,在信息系统办公室(Office Information System,OIS) 3的组织下,积极与各方合作,不断创新与挖掘,使得 Hollis 成为深入哈佛人心的品牌性服务系统。这篇文章将从不同层面对 Hollis 进行深入分析和揭示。1 Hollis 的发展历史1.1 卡片目录和机器可读目录上个世纪 60 年代前,哈佛大学图书馆一直致力于卡片目录标准化格式的研究。 1965 年,哈佛引进了机器可读目录(Machine Readable Catalogue, MARC),MARC 是一种描述能力很强的元数据格式,哈佛馆利用 MARC 进行信息
6、资源编目,目前它的计算机目录数据达到 1100 万种,包括图书、期刊、缩微制品、手稿、政府出版物、乐谱、地图、照片、视听产品和数据文档等各类资源 4。1.2 在线联机系统的短暂引进与长期合作1967 年原先在哈佛工作过的 Kilgour 搬到了俄亥俄州,建立了“在线大学图书馆中心”(Online College Library Center,OCLC) 5。1975 年哈佛图书馆引进了相对年轻的 OCLC 作为获取书目记录的方法。经过数年的使用,由于当时的哈佛拥有 100 多个分馆,每个图书馆的文献目录和数据系统都是分散管理,为了有效地管理如此庞大的文献数据,哈佛于 1983 年引进了西北大学
7、开发的 NOTIS 管理系统 5。同时,作为 OCLC 的成员馆,哈佛大学图书馆承担了数据上传、规范控制和目录维护等工作,成为 OCLC 长期的重要合作伙伴。1.3 Hollis 的问世今天的 Hollis 最初是哈佛图书馆的书目采购子系统。当时哈佛有一些老档案的磁带被制作成缩微胶片,以 DUC(distributable Union Catalogue)的格式 5将数据传输至 OCLC。1987 年,哈佛图书馆将文献记录包括 DUC 记录全部导入 Hollis 系统,那时哈佛图书馆的工作系统依然是以 NOTIS 为基础的图书馆整合系统(Integrated Library System),它
8、和 Hollis 的数据融合。1988 年 Hollis OPAC 正式在哈佛大学登陆。1.4 与时俱进的 Hollis从 1992 年到 1996 年,哈佛大学图书馆集中将数千万的卡片目录信息全部转换成电子目录,输入 Hollis 系统 5。 1994 年,哈佛图书馆在 Hollis 系统的 MARC 记录中添加了 655 字段表达的非书资源电子记录 6,如缩微制品、VCD 、 CD、 名人手稿和珍贵档案,使读者能够在Hollis 上快速检索到不同类型的馆藏。从 1996 年到 2002 年,哈佛图书馆完成了对中文、日文和韩文 325,000 条馆藏记录的电子转换 5,全部输入 Hollis
9、,同时上传至 OCLC。2002 年哈佛正式采用以色列公司 Ex Libris 研发的 Aleph 系统代替 NOTIS 成为图书馆的工作系统,同时选择 ANSI/NISO Z39.71 作为文献格式的著录标准,实现哈佛的 Aleph 系统 和 Hollis OPAC 的数据融合。从 MARC 发展到 XML5, 从 ASCII 发展到 Unicode5, Unicode 的引入又解决了 Hollis OPAC 多语种检索的问题。2009 年的春季哈佛图书馆正式推出以图书馆 2.0 为基础的新版Hollis, 新 Hollis 不再是单纯的检索工具,它紧紧围绕“从发现到呈递 ”(Discove
10、ry to Delivery, D2D)的服务理念,以“AquaBrowser3” 7作为应用界面,在“信息系统办公室”和“哈佛图书馆实验室”的技术推动下,全速前行。2 Hollis 的工作原理来自 Aleph 的编目系统、OCLC 的数据下载和书商编目记录等多元化的数据源,系统对这些数据进行 XML 的结构化处理和内容丰富 (如增加外接电子链接等 ),然后加工处理过的数据被传送到 AquaBrowser3 系统,在 24 小时内对需要修改的数据进行加工处理并且保存在AquaBrowser3 的系统内 8,数据库将根据不同的字段建立索引 (如作者、题名、出版时间等),同时新数据被上传到 OCL
11、C,这样就形成了新的 Hollis 的工作界面。通过索引和 AquaBrowser3的信息化数字平台,新 Hollis 可以对读者的检索结果进行排序、精炼,提供分面导航和结果聚类的可视化功能,在检索资源的同时引导读者探索新的资源。图 1 是新 Hollis 的详细工作原理图。图 1 Hollis 工作原理示意图3 Hollis 的功能展示3.1 新版和传统版的功能比较尽管 Hollis 不断更新与发展,但是哈佛图书馆一直没有摒弃传统版的 Hollis Classic,而是在新 Hollis 的界面上保留老版本的电子链接,研究者可以轻松切换两者的界面,究其原因,笔者对它们展开了如下的比较:3.1
12、.1 检索条件项的选择新 Hollis 界面只有一个检索框,以关键词输入为主,检索选择单一;而 Hollis Classic 的检索界面提供多项检索条件,除了题名、作者、关键词等一般选项,还有诸如精确题名输入、作者关键词、索书号、医学主题词、政府号、馆藏地、格式和日期范围等专业选项。新版 Hollis虽然拥有高级检索,但它的选择项也少于 Hollis Classic。3.1.2 检索语言的输入新 Hollis 的检索系统不能输入非拉丁语系进行检索,而 Hollis Classic 可以输入中日韩等多种语言,甚至可以选择繁体字或简体字的中文输入。哈佛有 500 种语言的馆藏,当前 Hollis
13、Classic 通过“Modify Search”中的语言限制功能进行不同语种馆藏的选择,而 Hollis 通过“Advanced Search”中的语言选择项进行多语种馆藏的筛选。3.1.3 单词云 (Word Cloud) 这是 09 年新版 AquaBrowser/Hollis 推出的信息可视化试用功能。通过视觉化图形,将Hollis OPAC 中无序的、抽象的书目信息转换为有语义层次的具象信息传递给读者。研究者输入关键词后,屏幕上出现多种形式、不同颜色、不同远近的词汇,有的和检索词拼写相近的,有的是检索词汇的变异形式,有的是和检索词相似的国会图书馆主题目录中的主题词,有的是检索词的翻译
14、形式。根据不同的提示,研究者点击词云目标,可以缩小、扩大检索范围或者重新检索,而 Hollis Classic 不具备此项功能。然而,经过 2009 年到 2010 年的两年试用,根据读者的反馈, “单词云”对 Hollis 信息定位的帮助并不大,因此哈佛图书馆又推出了 “ My Discoveries”的新功能代替“单词云” 。3.1.4 检索界面的友好性Hollis 检索系统的工作界面简单、清晰,对于初次使用哈佛 OPAC 系统的研究者来说,Hollis 的工作界面比 Hollis Classic 更友好、更直观。3.1.5 检索操作的难易性Hollis 只提供一个简单的检索框,习惯于 G
15、oogle、Yahoo 检索功能的读者,Hollis 让他们更适应。Hollis 采用简单的关键词输入,屏幕右侧提供多条限制选择项来对结果进行精炼,如在线/印刷版、出版时间(近 3 年、5 年、10 年和各时间段的分类)、作者/责任者、文献格式(书目、期刊、音像制品、档案、缩微制品等)、语言、类型/形式、主题、馆藏地等;Hollis 还提供对结果排序的功能,所有操作都简单、方便。而 Hollis Classic 由于初步检索的选择项多,操作更复杂。3.1.6 保存条目的数量在新 Hollis 检索结果的界面上,研究者可以一次保存 25 条检索结果;而采用 Hollis Classic检索后,读
16、者一次只能保存 20 条结果。 3.1.7 多种书目分类号的检索新 Hollis 不提供索书号的检索途径,而 Hollis Classic 不仅提供国会图书馆的书目分类号,还提供医学图书分类号、燕京图书分类号、杜威图书分类和其它多种类型的图书分类号等多项检索选择。3.1.8 检索的精度和广度传统版的 Hollis Classic 的检索界面首先提供多项选择,以及命令式检索和高级检索的链接,而新版 Hollis 的初始界面只有一个检索框,输入关键词后,再进行结果的精炼和排序,因此 Hollis Classic 的检索精度优于新 Hollis。对于一些特殊编目形式的馆藏,如采用 856 字段,借助
17、档案著录系统“寻找助手”(finding aids)编著的档案和手稿只输入在新的 Hollis 的检索系统里,另外如可视化文件、照片、数字化特藏等,也都只能在新 Hollis 中被检索到,因此新 Hollis 的检索范围和检索内容更多、更广。3.1.9 检索界面的参与性和互动性凡是拥有 Harvard ID 的研究者在 Hollis Classic 和新 Hollis 的界面上,点击”My Account/Renew”, 输入账号和密码,都可以进入读者的信息界面,查阅书刊借阅记录,进入Z39.50 客户端支持的 Endnote 文献检索下载系统。传统版的 Hollis Classic 提供详细
18、、清晰的元数据著录记录,而新 Hollis 的 MARC 记录简单,但是它提供了“My Discoveries”的参与功能,研究者可以保存、评价、评级、标注书目记录,可以订购或者选择重要信息的推送功能(RSS/FEED)。在新 Hollis 单项结果的界面上,有 Google book 的书评链接,有检索哈佛电子资源的 E-Research(Articles)、Citation Linker 和 Get it 的实用链接。如果读者检索不到相关文献,新 Hollis 提供了咨询馆员 (Ask a librarian)的在线帮助,Hollis Feedback 的限时回复,以及集合了“Borrow
19、 Direct”和 “Interlibrary Loan”的功能于一体的 “Get it”的电子链接,全力满足读者的检索需求。因此新 Hollis 不仅是检索工具,而且它比 Hollis Classic 拥有更多的发现、筛选、提供和传递信息的功能,具有更多的参与性和互动性。基于 Hollis Classic 和 Hollis 的各自优势,哈佛图书馆近期和未来依然会保持新旧版共存,以满足不同读者的检索需要。3.2 Hollis 的服务特色和检索特点新 Hollis 不再是简单的检索工具,它以 Library 2.0、 Web2.0 为基础,实现“从发现到传递” ( Discovery to De
20、livery, D2D)的功能理念 5,呈现一站式多功能服务体系的风貌。3.2.1 Hollis 的服 务特色3.2.1.1 资源信息一体化2005 年哈佛大学采用以色列公司 Ex Libris 推出的 SFX 5作为电子链接服务器,SFX(详见图 2)的出现使得 HOLLIS 成为获得所有资源的初步检索平台。图 2 SFX 作为链接服务器的信息一体化的示意图 5 哈佛的馆藏、开放存取的电子资源(Open Access)、非正式的出版物、期刊全文、档案、照片、哈佛在线的特藏数据库均可以通过 Hollis 被挖掘。Hollis 的网页上提供了 Hollis Classic、 E- Researc
21、h(Articles)、Citation Linker、Get it 等多个电子链接。其中 E-Research 中的Find E-resources 支持多个数据库的跨库检索,研究者只需在同一个检索平台上勾选多项数据库,就可以完成一站式多库同时检索 9。3.2.1.2 馆藏资源获取的快捷化Hollis 是开放的,无论在美国本土或者世界上其它任何角落,基于 WebPAC, 研究者输入http:/discovery.lib.harvard.edu , 进入 AquaBrowser3 支持的 Hollis 界面, 输入检索词后,如果检索结果的元数据书目记录提供了电子链接,读者直接点击就可以无缝获取
22、该结果的数字化文本;如果书目记录的右边提供了电子扫描的申请链接,不管用户身在何处,只需点击,输入哈佛的账号和密码,两天后就可以在电子邮箱里收到扫描好的电子文件。从 1999 年到 2006 年,哈佛出资 1200 万美元推出了图书馆的数字化项目,计划将哈佛各图书馆中一些罕见的特藏进行数字化扫描,制作成精美的数据库,其信息源可以通过 Hollis 检索获得,它的目的就是让全世界的研究者都可以免费浏览哈佛的珍贵特藏。3.2.1.3 用户参与的多元化 新 Hollis 为用户提供了多元化的参与互动途径。它允许研究者对选中的检索内容进行下载、分析、测评和 RSS 推送;用户可以将检索、浏览过的书目信息
23、保存在 “My Discoveries” 中, 或者将信息输送到 Endnote Web、RefWork 等文献管理器中,或者可以直接打印,通过 E-Mail 或手机短信发送和接收。图书馆员或者读者能对文献提出评论、建议和加注,可以在书目记录中添加标签(tagging) 。此外教授、学生、研究者或者馆员的书目评论和提出的推荐书目的订购清单都可以发送到 FaceBook、个人主页、博客,以及哈佛的内部学习资源库 Harvard ICOMMONS10中,让感兴趣的读者能够分享。此外新 Hollis 的界面上拥有一些重要的电子链接,如 Google Book 的书评、Amazon 的网上书店、作者的
24、博客和个人主页、小说多个版本的信息和小说评价网站,可供研究者学习和参考。 3.2.2 Hollis 的 检索特点3.2.2.1 检索界面的专业化传统版的 Hollis Classic 提供多条专业检索的选择项,包括任意关键词、精确题名、题名关键词、作者、作者关键词、精确的主题词、精确的医学主题词、期刊或者连续出版物、精确的片段性题名、中日韩文的作者名、精确的中日韩文题名、ISBN、ISSN、音乐出版号、政府号、国会图书馆分类号、医学图书分类号、杜威分类号、其它图书分类号、年度报告号、馆藏地、Hollis 号或者记录号;同时它的下方还提供扩展性检索功能,结果依据语言、出版时间、格式和馆藏地被加以
25、限制。而新 Hollis 的初步检索只提供关键词检索,然后再对结果进行限制和排序,因此作为检索工具,Hollis Classic 更全面、更专业。 3.2.2.2 信息组织的有序化新 Hollis 的检索结果可以按照相关性、题名、索书号、作者、出版时间等进行排序,它还提供按书目目次和图书的借阅率来对结果进行排序的功能。新 Hollis 不仅是检索工具, 在它的工作页面上,屏幕右侧还显示分层导航浏览,如主题浏览、学科浏览、出版时间浏览、语种浏览、不同文献形式浏览、所属丛刊子集浏览、排名浏览和不同地区的文献浏览等。分层导航方便读者往返于各级检索页面,可以不断修正检索命令,提高检索结果的精确性。而且
26、新HOLLIS 还增加了保存检索历史的功能。对于检索结果,用户可以选择每屏显示的记录数和勾选检索结果的显示内容等,将信息有序的管理,便于研究者对结果进行筛选。3.2.2.3 检索过程的智能化哈佛大学计算机专家和图书馆的系统研究员一直致力于改善检索习惯、拼写错误和输入空格对检索结果的负影响。原先 Hollis 界面的“单词云”就是帮助研究者筛选定位检索结果的辅助工具。当读者输入拼写错误的检索词,Hollis 的屏幕会出现 “Did you mean to search for?”的提示语,同时系统给出提示词汇。例如用户输入 chaikovksy,屏幕会显示“Did you mean to sea
27、rch for: Tchaikovksy?”2,此外页面还提供馆员的建议词库、求助链接、咨询馆员( Ask a librarian)的电子链接等;当读者输入的检索词有多种写法,Hollis 也会把其它形式的词汇列出,供研究者选择,如 adolescent also retrieves adolescents, adolescence;如果检索后屏幕显示: “No search found” , Hollis 会提供咨询馆员的咨询链接( Ask a librarian)和 “Get it”的集合功能链接, 迅速为用户提供合适的帮助。 3.3 Hollis 界面的操作系统 AquaBrowser3
28、AquaBrowser 由荷兰公司研发,号称是第一台提供数字化影像和多层面检索数字化信息的发现平台, 属于 “下一代图书馆界面 ”。从 2005 年到 2009 年,经过 4 年的试用,哈佛图书馆正式选择它作为新 Hollis 的启动界面。在新工作页面上提供了新 Hollis 的详细使用说明、手机图书馆的电子链接、Hollis 的反馈链接以及 AquaBrowser3 的产品说明。AquaBrowser 以 “检索-发现-提炼 ”为理论指导,它将哈佛的 OPAC、电子资源检索门户 (E-Resources)和其它重要的OPAC 目录系统汇集在同一发现界面上,使研究者不仅可以发现哈佛的资源,而且
29、可以找到哈佛之外的信息源。不久的将来,AquaBrowser3 将充分利用研究者 的“My Discoveries”的评级资料,借助“360 信息获取控制平台” ,帮助读者跨目录、跨文献类型,利用同一个检索界面发现需要的信息。自 2009 年春季 AquaBrowser 在哈佛推出后,根据 OIS 对 Hollis 使用情况的统计调查数据 11,比较 2009 年 8 月刚启用 AquaBrowser 时的情况和 2011 年 6 月已经步入正轨的新 Hollis 的使用数据统计情况,详见表 1 表 1 Hollis 系统使用情况的统计数据表 11时间 Hollis 的检索量 Hollis 界
30、面浏览量2009 年 8 月 86,711 101,3862011 年 6 月 134,992 170,525和 2009 年 8 月相比,2011 年 6 月新 Hollis 的检索量和界面浏览量分别从 86,711 次增加到 134,992 次,从 101,386 次增加到 170,525 次,这充分说明新 Hollis 的功能完善、发展良好,深受用户的喜爱和欢迎。3.4 Hollis 的技术创新和未来发展2010 年 7 月,哈佛大学成立了“图书馆实验室” 12,由哈佛大学图书馆学术交流办公室(Office for Scholarly Communication)负责管理。它由英国伦敦
31、Arcadia 基金会捐资,通过项目申报和评选的方式,每年选出 10 个对图书馆的服务有创新型推动的技术项目,目的是利用哈佛师生的智慧,有效地推动图书馆的发展。入选项目中,哈佛学院图书馆(Harvard College Library, HCL)的技术服务部主任 Michelle 主持的“Hollis 读者帐户一站式服务”希望能实现所有的网上申请(如馆际互借、书目荐购、文献扫描和传递、远程哈佛密集书库-Harvard Depository 的书目传递服务) 都能在同一个 Hollis 的帐户中完成;另一个项目是工程应用学院的工程师 Rebecca 提出了在 Hollis 的检索结果旁边添加图书
32、馆位置地图的电子标记,点击后可以显示文献所在馆藏地的电子地图。还有一个项目是利用 Hollis 的 “My Discoveries”中 tagging的标记功能促使网络社会中开放存取的电子资源能够被越来越多的研究者发现和利用。随着 “图书馆实验室 ”的加盟和 AquaBrowser3 系统公司的推陈出新, Hollis 在“信息系统办公室”的科学领导下,正以全速向前迈进。相信不久的将来更加完美的“新新 Hollis”又会登陆在世人的面前。 4 Hollis 的发展对我们的启发哈佛的 Hollis 在图书馆已经使用了将近 30 年,30 年中 Hollis 不断被更新与发展,迄今为止它已经拥有
33、1100 万条电子文献记录,率先解决了多语种检索、文献无缝获取以及多项申请可以一站式解决的技术难题,Hollis 的飞速发展充分体现了哈佛图书馆追求创新的理念,新成立的“图书馆实验室”为 Hollis 的技术团队又增添了新生力量。今天的 Hollis 和 Hollis Classic已经非常成熟和完善,但是哈佛人永远不会满足,Hollis 不会停下脚步。善于把握新技术的脉搏,善于整合优秀的技术团队,善于倾听和采纳读者与专家的反馈和建议,善于加强和系统公司的业务联系等等,都是不断超越自我的 Hollis 带给我们的思考与启示。参考文献1 http:/lms01.harvard.edu/2 htt
34、p:/discovery.lib.harvard.edu 3 http:/hul.harvard.edu/ois/4 http:/hul.harvard.edu/publications/hul_notes_1331/oismarc.html5 M Kaplan. Library Automation M Springer Handbook of Automation, 2009, Part G: 1285-1298.6 J Beall. Indexing Form and Genre Terms in a Large Academic Library OPAC: The Harvard Ex
35、perience. J Cataloging & Classification Quarterly, 1999, 28(2):65-71. 7 http:/ http:/ http:/eresearch.lib.harvard.edu/V/10 http:/icommons.harvard.edu/icb/icb.do11 http:/zellner.harvard.edu/reports/ldireport.php12 http:/osc.hul.harvard.edu/liblab袁晓园,硕士,馆员,已发表论文数篇,2010 年在哈佛燕京担任 1 年的访问馆员。(收稿日期:2011-08-04 编发:许桂菊)