1、大数据视角下地方联合编目工作的现状与思考 杨前进 重庆图书馆 摘 要: 联合编目是公共图书馆全面实现书目数据资源共享的重要途径。但是, 随着该项工作的深入开展, 目前一些地方图书馆的联合编目工作停滞不前, 暴露出一些瓶颈问题。针对这些问题, 本文试从大数据视角对该项工作进行探讨。关键词: 联合编目; 大数据; 图书馆; 作者简介:杨前进, 男, 本科, 馆员。收稿日期:2017-08-03On the Present Situation and Thinking of Local United Cataloging from the Perspective of Big DataYang Qi
2、anjin Chongqing Library; Abstract: United cataloging is an important way for public libraries to realize bibliographic data resource sharing.However, along with the development of united cataloging, the united cataloging has been stagnated in some local libraries and exposed some bottlenecks.Aiming
3、at these problems, this paper tries to make some discussion on the united cataloging from the perspective of big data.Keyword: United Cataloging; Big Data; Library; Received: 2017-08-031 引言2012 年 3 月, 美国启动“大数据研究和发展计划”, 该国政府认为大数据是“未来的新石油”, 一个国家拥有数据的规模和运用数据的能力将成为综合国力的重要组成部分1。2012 年 7 月, 中国“十二五”国家战略性新兴
4、产业发展规划提出支持海量数据存储、处理技术的研发与产业化2。2015 年 9月, 中国国务院关于印发促进大数据发展行动纲要的通知提出, 要创新驱动发展, 加快大数据部署, 深化大数据应用, 推动政府治理能力现代化3。在这种背景下, 以微博、微信、音频、视频等为代表的海量信息数据已经渗透到各行各业, 这些信息数据俨然形成了一个量级非常大的数据集, 随之“大数据”这一概念变得越来越流行, 而且越来越重要。各级公共图书馆作为国家公共文化服务体系的重要组成部分, 如何在国家全面推进大数据发展和应用的过程中更好地收集、存储、传递和推广文献信息资源是每位图书馆人都应该认真思考的问题。而联合编目特别是地方公
5、共图书馆之间的联合编目作为图书馆的一项重要业务工作, 完全可以借国家重视和利用大数据技术的契机, 及自身重视和利用大数据技术的优势, 把分散在各地的图书馆有机地统一起来, 打破图书馆的时空限制, 创新编目模式变革编目技术, 使不同图书馆之间互通有无, 真正实现资源共享。2 当前地方联合编目工作的现状笔者认为, 地方联合编目应基于三个层面, 一是省级图书馆层面, 二是以省级图书馆为中心的地方联合编目分中心层面, 三是地方独立的联合编目机构。2.1 省级图书馆层面1997 年 10 月, 以降低图书馆编目成本、提高编目工作质量、真正实现书目数据资源的共建共享为宗旨的全国图书馆联合编目中心 (以下简
6、称全国联编中心) 在中国国家图书馆成立。从此我国公共图书馆界的联合编目工作以全国联编中心为圆心, 逐步辐射到联编中心成员馆全国各省级图书馆编目部门, 呈现出以点带面、成员馆使用书目数据从收费到免费的联合编目发展态势。全国联编中心在业务指导、人才编目技能培训、编目业务发展规范等方面给了成员馆大力的支持和帮助, 各省级图书馆在全国联编中心的引领带动下, 不仅建成了各地不同类型、不同容量、不同内容的书目信息数据库, 还自编书目数据上传到全国联编中心, 为其他成员馆使用, 更涌现出一批批优秀的编目员。这样的发展态势, 不仅降低了成员馆及用户的编目成本, 提高了编目工作质量和效率, 也为广大读者提供了方
7、便、快捷、准确的书目信息。可是由于全国联编中心和各省级图书馆分别隶属于不同的主管部门, 它们只有业务指导关系, 不具有强有力的领导关系和相应的编目业务激励措施, 直接导致各省级图书馆参与全国联编中心工作的热情不高、重视力度不够。具体表现在各省级图书馆每年向全国联编中心提供的书目数据质量和数量都不达标。另外一些省级图书馆与全国联编中心缺乏长期稳定的沟通与协调, 致使各省级图书馆对文献信息资源编目规则的理解和运用不能达成共识, 也没有权威的行业组织机构或文化主管部门有效地监督这些编目规则和标准的实施, 使得各公共图书馆套录的书目数据质量参差不齐, 一些书目数据质量好、信息多的中心用户多、发展快,
8、一些数据质量差、资源少的分中心用户少、发展慢。导致各省级图书馆数据资源重复建设严重, 竞争大于合作, 服务功能单一, 难以满足用户更加深层次的信息需求。2.2 以省级图书馆为中心的地方联合编目分中心层面2000 年 9 月, 自广东省立中山图书馆与全国编目中心签订合作协议, 正式成为全国联合中心第一家省级地方联合分中心至今, 以省级图书馆为中心的地方联合编目分中心已经达到 28 家。根据这些分中心和全国联编中心签订的协议来看, 他们不仅拥有全国联编中心所有中文图书即时数据的使用权, 接受全国联编中心的人员培训、技术服务和组织管理;而且还要在本区域范围内努力发展地方联合编目中心的成员馆, 积极指
9、导分中心成员馆的人才、技术、管理等工作, 努力推进网络环境下本地区图书馆之间的书目数据资源共建共享工作。可笔者通过浏览相关省级图书馆官方网站、查阅有关图书馆地方联合编目论文及咨询有关图书馆采编部门工作人员等方式了解到, 当下很多以省级图书馆为中心的地方联合编目分中心除了能完成全国联编中心交办的有限的工作任务外, 在推进本地区图书馆之间书目数据资源共建共享方面完全处于停滞不前的状态。地方联合编目分中心几乎都是在地方省级图书馆采编部门的基础上建立起来的, 没有独立的办公场所, 没有专门的人员配备和相应的网络设施及办公软件平台。辖区内的地市 (县) 级公共图书馆中只有少数通过签订协议的方式表明是地方
10、联编分中心的成员馆, 可是分中心并没有为成员馆或辖区内的公共图书馆建立统一规范的编目业务自动化系统软件和书目数据服务器, 没有为用户或成员馆提供客户端、Z39.50 和 WEB 页面等多途径的书目数据上传下载业务, 没有开展编目业务、编目系统自动化等方面的培训。有些省级及以下图书馆干脆将编目工作全部外包, 书目数据全部由书商或者外包公司来做。有些图书馆虽然通过协议参加到地方联合编目中心来, 但由于没有约束措施和激励机制, 往往是合而不编, 编而不力。还徘徊在联合编目大门外的图书馆就更不用说了, 他们对联合编目工作是不理解、不重视, 不支持。2.3 地方独立联合编目机构层面目前, 在国内公共图书
11、馆领域, 比较成功而典型的地方独立联合编目机构有深圳市图书馆牵头成立的深圳地方版文献联合编目协作网和上海市文献资源共建共享协作网。深圳地方版文献联合编目协作网于 2000 年 12 月正式开通, 由深圳图书馆、湖南图书馆、福建省图书馆、上海图书馆、天津图书馆、辽宁省图书馆共同创建。2005 年荣获首届文化部创新奖, 至今已有百余家成员馆, 形成了一个 200 多万条记录的网上书目库, 已成为国内重要的联合编目中心之一4。上海市文献资源共建共享协作网的前身是上海地区文献信息资源协作网。1994年上海地区公共、科研、高校、情报四大系统的 19 个图书情报机构在上海图书馆召开了馆 (所) 长会议,
12、举行了上海地区文献信息资源协作网工作条例等三个文件的签字仪式5。如今的上海市文献资源共建共享协作网有自己的国内特大型文献数据库之一“中文社科报刊篇名数据库”, 有上海地区高校、企业、公共图书馆成员馆上百家, 有切实可行的“信息平台”、“文献采购协调”和“实施信息服务与人才培养”等三个具体方案。他们之所以能把其辖区范围内各自独立的图书馆组织起来, 并应用自主研发的编目系统和网络技术将不同区域的图书馆联合起来共建共享书目数据库, 降低成员馆及用户的编目成本, 提高编目工作质量, 完全得益于当地文化主管部门和图书馆领导的重视及在经费、人才等方面给予的大力帮助和支持, 更是落实党中央、国务院保障广大人
13、民群众享受基本文化权益政策的具体体现。可从全国范围来看, 其他地区的地方联合编目工作还任重道远, 还存在很多困境。一些区县级公共图书馆特别是西部落后地区的公共图书馆不仅没有开展业务的网络设备资源和相应的人力物力财力资源, 缺乏参与联合编制文献书目数据的能力。再者, 由于联合编目分中心缺乏本地区文献联合编目的统筹规划、缺乏适合本地区不同类型文献著录标引的规范和标准, 直接导致各图书馆文献著录标引不规范、不准确, 有的必要的读者检索字段缺失, 直接导致读者检索不到相应的书目信息, 不仅影响到编目工作质量的提升, 也影响了地方联合编目工作的开展。随着微博、微信、音频、视频等信息传递方式的多样化及快速
14、化发展, 海量的信息数据形成了一个量级非常大的数据集, 传统的书目信息检索和传递已走进千家万户, 广大读者也通过互联网、手机等移动设备轻松便捷获取所需的信息。这时, 图书馆不再是广大读者获取所需信息的必去之处, 省级及以下公共图书馆对文献信息资源的传递、共享工作压力倍增, 地方联合编目工作更是如此。大数据给地方文献联合编目带来的冲击直接暴露了其对书目信息资源传递、共享能力的不足, 特别是偏远、落后地区的中小型公共图书馆共享能力更是低下。大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合, 正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析, 从中发现新知
15、识、创造新价值、提升新能力的新一代信息技术和服务业态。因此, 各地方公共图书馆可以充分发挥大数据时代对文献信息的收集、处理、加工、储存等优势进行真正意义上的地方联合文献编目, 让这些机构和用户不再受时间、地域及技术条件的限制, 随时随地使用需要的文献信息资源, 最终实现大数据技术下一馆编目、各馆适时共享的目的。3 运用大数据技术开展地方联合编目工作的设想3.1 争取行政支持并带动图书馆界重视大数据技术按目前的行政格局和图书馆运行经费来源模式来看, 公共图书馆事业发展过程中面临的最大压力还是经费保障乏力, 使得一些新技术和专业技术人员没有应用到图书馆事业中。特别是当某个馆想要通过公共财政支持上新
16、项目或更新设备时, 不但手续繁琐, 而且困难重重。作为未来公共图书馆事业发展的重要途径, 资源共享是要通过某种技术传输形式才可以实现的, 而不只是停留在口号上。因此, 大数据技术就可以发挥自身独特的扩展性优势让图书馆的各种资源在中华大地随时随地与人共享。但必须要努力争取各级政府的行政支持、经费支持和人才支持6, 依靠公共行政关系的力量支持云计算技术运用到图书馆事业中。3.2 积极试行并推广新技术平台以促进资源共享当前, 在现有计算机技术和网络技术支持下的全国联机联合编目作业模式基本上是以中心-分中心-成员馆为运行模式7, 中心数据库接纳并存储所有数据, 成员馆通过相同或兼容系统软件检索口从中心
17、检索获取所需要的数据, 并下载到馆藏。而成员馆若在中心没检索到相应的数据就可以按照中心的有关规定将自编的书目数据上传到中心, 通过这种模式, 实现了所有成员馆数据的共享。另外从公共图书馆采编系统模块云计算平台搭建的试点运行可行性来看, 目前云计算中心操作系统和云计算后台数据中心运营管理系统已经成功上线, 云计算平台所需要的服务器、存储器和网络设备等硬件和终端已经在一些搜索引擎成功使用, 例如 Google 就已经拥有一个数百万节点的云计算技术平台。美国OCLC 公司的“Oclc Web 级协作型管理服务”联合编目系统就是一个典型的云计算模式, 并且早在 2009 年就上线运行。因此这些典型的云
18、计算模块平台的成功运用可以启示我们在某个馆或某个地区情报信息机构引进 CALIS 云战略平台, 建立数字图书馆服务平台和 B/S 模式图书管理系统, 并在公共图书馆采访编目工作流程中试运行。如果反应良好, 能达到资源共享的理想状态, 可以在全国图书馆内推广运行。3.3 借鉴成熟优势将大数据的云计算技术运用到编目工作中联机编目的成熟优势是应用计算机技术和网络技术将分散独立的文献信息情报机构联合起来共建共享书目信息资源, 方便被授权的成员馆适时查询、上传和下载书目信息。这种成熟的编目优势可以借鉴到云计算技术中。图书馆采编模块云计算技术平台搭好后, 可以在存储云中建立一个统一的书目数据库和统一的服务
19、器。书目数据库用于接受终端的书目检索, 如果用户在云存储的数据库中检索到记录就可以下载并修改后直接放入本馆书目数据库中, 如果没有就可以按照相关规范自行编目后存入云数据库中, 然后便于他人下载。统一服务器方便所有的成员馆和用户通过云计算操作系统来操作云存储中的数据, 与联机联合编目不同的是现有书目数据库就不再需要存放在独立的服务器中, 而是统一存放在云端, 可以实现统筹规划, 宏观调控和对书目数据资源的调配8。3.4 以读者为中心搭建网络文献资源学习平台有关调查统计表明, 未来数字资源和网络文献信息资源将会成为图书馆收藏的重点。而在百度、搜狐、Google 等搜索引擎的影响下, 这些资源又会成
20、为读者收集学习的重点。因为他们通过搜索引擎使用这些资源便捷、经济、准确。所以在编目工作中, 一方面要重视对这些资源信息的组织和揭示, 一方面要重视对读者学习心理和检索习惯的研究, 使读者能够更快、更准、更全地检索到所需的各种类型的文献信息资源书目数据。在云计算技术支持下, 可以通过图书馆采编模块云计算技术平台搭建网络资源学习平台, 在这个云平台中建云操作系统, 在云操作系统下建资源调控子系统、信息自动传递子系统、读者自主学习子系统。读者通过终端就可以有一个随心所欲的网络文献资源学习平台。目前 Google 公司提供的 Google 协作平台计算服务, 就是将各类媒体信息与Google 云计算服
21、务整合在一起, 为用户提供方便, 值得图书馆界学习和借鉴。4 结语目前, 大数据技术对图书馆的影响还处于探索摸索阶段, 但对图书馆来说超共享文献资源是事业发展的必由之路。大数据以运营成本低、计算能力超强等独特的优势为图书馆文献资源超共享提供了技术条件。期待在不久的将来笔者可以在大数据网络模式下通过大数据 Web 文本挖掘技术更快捷地访问和使用书目数据, 让全国乃至全球的同行及用户都可以通过大数据技术享受到所需要的服务, 真正实现图书馆文献资源的超共享。参考文献1李国杰.大数据研究的科学价值J.中国计算机学会通讯, 2012 (9) :8-15. 2国务院.国务院关于印发“十二五”国家战略性新兴
22、产业发展规划的通知EB/OL. (2012-07-20) 2017-06-30.http:/ 3国务院.国务院关于印发促进大数据发展行动纲要的通知EB/OL. (2015-09-05) 2017-06-30.http:/ 4深圳图书馆网.地方版文献联合采编协作网概况EB/OL. (2001-12-31) 2017-07-03.http:/ 5上海市文献资源共建共享协作网.上海市文献资源共建共享协作网简介EB/OL. (2014-12-31) 2017-07-03.http:/ 6钟静.区域联合编目工作的实践与探索J.河南图书馆学刊, 2015 (8) :80-81. 7丁建勤.联机联合编目成员馆编目绩效评估及其分析J.图书馆建设, 2012 (8) :21-27. 8黄春红, 李璞.公共图书馆 (区域) 联合编目初探J.四川图书馆学报, 2007 (6) :50-52.