1、走向大数据知识服务:大数据时代图书馆服务模式创新 胡莲香 漯河医学高等专科学校 摘 要: 从知识服务迈向大数据知识服务是大数据时代图书馆服务模式创新的方向。大数据知识服务是面向海量数据处理、智慧图书馆和下一代图书馆的知识服务模式。理性推进大数据应用, 强化图书馆人文关怀, 维护并发展图书馆制度, 培养智慧图书馆员, 构建基于大数据的图书馆知识服务平台是实现大数据知识服务的基本路径。关键词: 大数据; 知识服务; 大数据知识服务; 智慧图书馆; 智慧图书馆员; 作者简介:胡莲香 (1968-) , 女, 漯河医学高等专科学校图书馆, 研究方向:知识服务, 网络信息资源管理。收稿日期:2013-1
2、2-16Toward Big Data Knowledge Services: Innovation of the Library Service Models in the Era of Big DataHU Lian-xiang Library, Luohe Medical College; Abstract: It is the innovation direction of library service model from the knowledge service towards big data knowledge service in the era of big data.
3、 Big data knowledge service is the knowledge service mode with facing the huge amounts of data processing, smart library and the next-generation library. It is the basic path to realize big data knowledge service, such as promoting big data applications rationally, strengthening the library humanist
4、ic care, maintaining and developing the library system, cultivating smart librarians and constructing library knowledge service platform based on big data.Keyword: Big data; Knowledge services; big data knowledge services; Smart library; Smart librarian; Received: 2013-12-162013 年 9 月 30 日, 在中央政治局举行
5、 “以实施创新驱动发展战略” 为题的第九次集体学习时, 百度创始人兼 CEO 李彦宏作为创新企业代表向中央政治局讲解了信息技术领域的前沿课题大数据的发展情况。 继物联网、 云计算、 移动互联网之后, 大数据正掀起网络信息技术发展的新浪潮。 IBM、 亚马逊、 谷歌等 IT 巨头纷纷投入到大数据技术研发, 联合国、 美国等围绕大数据推出一系列公共管理创新的战略构想和实践。 大数据是人们获得新的认知、 创造新的价值的源泉; 大数据还是改变市场、 组织机构, 以及政府与公民关系的方法1。 从图书馆自动化发展史看, 几乎每一项新信息技术的出现, 都能引起图书馆界的极大关注并推动图书馆的管理与服务升级2
6、。 大数据的特性将决定图书馆在大数据业务和整个大数据生态系统中收集、 分析、 管理、 存储及分配数据的方式。当面临知识经济和网络化数字化的双重冲击, 需要重新定位图书情报工作的核心能力, 寻求新的生长点时, 张晓林教授提出 “走向知识服务” 的命题3。 在大数据时代, 图书馆工作面临新的挑战和机遇, 大数据技术作为一种 “破坏性技术”, 可能成为颠覆当前数字图书馆模式的技术、 需求与机制4。 基于此, 我们在梳理相关文献的基础上, 提出大数据环境下图书馆走向大数据知识服务的分析框架, 对大数据知识服务的性质、 内容和实现途径进行初步分析。1 理论背景与文献综述1.1 大数据时代的来临目前对大数
7、据还没有标准的定义, 达成的基本共识是: 它是一种海量、 形式多样化的非结构化数据, 通常与 Hadoop、 No SQL、 数据分析与挖掘、 数据仓库、 商业智能以及云计算等诸多热点话题联系在一起。 一般认为大数据满足 “4V” 特征, 即大量化 (Volume) 、 多样化 (Variety) 和快速化 (Velocity) 和价值高 (Value) 或者准确性 (Veracity) 。 麦肯锡全球研究所 (MGI) 的研究报告将数据作为一种生产资料, 大数据是下一个创新、 竞争、 生产力提高的前沿。 世界经济论坛 (WEFORUM) 认为, 大数据就像货币和黄金一样, 是一种新型的经济资
8、产。 习近平总书记将提出, 包括大数据在内的 “即将出现的新一轮科技革命和产业变革” 与我国加快转变经济发展方式形成历史性交汇, 为我们实施创新驱动发展战略提供了难得的重大机遇。 的确, 大数据将塑造我们的生活、 工作和思维方式。 最终, 大数据标志着 “信息社会” 终于名副其实1。1.2 大数据推动图书馆管理与服务的升级图书馆历来是信息技术应用的重镇, 大数据时代也不例外。 在应用发面, 美国奥巴马政府将美国国家医学图书馆作为 “大数据研究和发展计划” 重要组成部分, 并要求其 “集成生物学及内部的信息 (i2b2) , 旨在创造能够整合和交换医疗保健和生物医学研究数据的方法和工具”5。 哈
9、佛大学图书馆已引入大数据服务, 并准备将图书大数据公之于众6。 目前中国国家图书馆正在进行面向全面数字化的一期维修改造, 致力于打造大数据时代的数字图书馆7。 清华大学图书馆在数据集成和数据挖掘两方面进行了探索和实践, 尝试在大数据环境下从元数据仓储中提取关键词等信息, 分析关键词走向, 分析作者与合作者的关系, 建立以人为中心的知识关联网络8。在理论研究发面, Rousseau 提出, 包括图书馆员在内的信息科学工作者, 应该在知识发现、 数据挖掘和大数据社区方面发挥作用, 减少科学瓶颈, 推动创新应用9。 美国顶级图书馆学期刊 Library Journal 举办 “Future of t
10、he Academic Library Symposium: E-Texts, Big Data and Access” 学术研讨会10等, 讨论如何在大数据时代背景下建设未来图书馆。 侯经川、 方静怡发现, 数据引证在当今大数据时代来临以及数据密集型范式兴起的背景下, 被赋予了新的内涵与重要性, 催生了知识计量学这一新学科11。 樊伟红等提出, 大数据可能给图书馆带来以下变革: 建立各类知识服务及业务建设的风险模型、新型知识服务引擎、 网络化信息资源智能组合方式, 用户流失分析及价值分析、 预测资源故障、 智能辅助决策等12。1.3 知识服务与大数据知识服务张晓林对知识服务的界定成为国内研究
11、者的共识, 即以信息知识的搜寻、 组织、分析、 重组的知识和能力为基础, 根据用户的问题和环境, 融入用户解决问题的过程之中, 提供能够有效支持知识应用和知识创新的服务3。 当前, 国外关于知识服务的研究热点主要集中在组织创新、 知识管理、 知识产业 3 个领域, 国内研究主要集中在服务模式、 核心能力、 本体、 知识挖掘、 网格、语义网格等, 知识服务的研究主题越来越宽、 涉及的问题越来越多, 热点频出。 知识服务实践的模式与机制主要有图书馆服务模式转型优化、 机构知识资产管理、 科研数据管理与服务、 构建虚拟研究环境、 改进学术信息交流模式和环境等方面13-14。 当今的科技创新面对的往往
12、是海量、 模糊、 复杂关联和动态发展的知识, 科技创新的工作流程、 模式、 范式和机制都发生了重大改变15, 大数据既是带来这些挑战的 “破坏性技术”, 又为新环境下的知识服务创新提供了机遇。 我们将基于大数据的知识服务称为大数据知识服务。按照秦晓珠等16人的界定, 大数据知识服务是在大数据获取、 存储、 组织、分析和决策过程中产生, 体现在大数据管理和处理过程中对知识、 服务、 资源和过程等的知识服务配置和整合的能力, 反映知识服务实体或机构完成相应行业、 领域、 任务及预期目标的服务水平, 包含大数据知识服务全生命周期过程中所涉及的知识、 服务、 资源和过程等因素。2 大数据知识服务是面向
13、海量数据处理、 智慧图书馆和下一代图书馆的知识服务模式2.1 大数据知识服务是面向海量数据的知识服务模式舍恩伯格认为:“数据就像一个神奇的钻石矿, 它的真实价值就像漂浮在海洋中的冰山, 第一眼只能看到冰山一角, 而绝大部分都隐藏在表面之下”1。 在大数据时代对海量数据的处理能力意味着获取财富、 知识与权力。 由海量的交易数据、 交互数据和数据处理主要技术趋势汇聚而成的大数据给图书馆存储能力和计算能力提出了挑战, 各种非结构化的数据又增加了大数据的复杂性。 由计算机图灵奖得主 Jim Gray 提出科学研究的第四范式以协同化、 网络化与数据驱动为其主要特征数据密集型科学研究17也在呼唤新的知识服
14、务模式。 而现有数据中心技术难以满足大数据的应用及知识服务需求, 整个知识服务架构的革命性完善势在必行。 大数据知识服务作为一种新的知识服务理念, 是在海量数据的获取、 存储、 组织、 分析和决策过程产生的。因此, 大数据知识服务具有如下特征: (1) 对知识需求不确定性的整体性把握。大数据知识服务嵌入于用户随时随地需求, 通过综合运用知识服务技术, 动态地把握全体数据而不是小数据时代的样本数据, 部署服务实施方案, 优选知识服务解集合, 将服务与资源进行关联绑定, 进而部署执行。 (2) 是跨越共性技术体系与细分特征的知识服务模式。 针对不同的行业、 领域或需求, 大数据知识服务方法有共性,
15、 但它更强调共性技术体系的基础上的差异性, 形成专业化的、 独具特色的大数据知识细分服务体系。 (3) 支持是支持按需使用/ 付费的知识服务模式。 实际上, 大数据就是云计算本身, 因为两者都是数据的大规模聚集于定制化分布的结合18。 通过云计算对大数据进行处理, 会使知识服务更为精准。 大数据知识服务是一种由用户需求驱动的、 按需使用/ 付费的知识服务新模式。 (4) 大数据知识服务强调用户参与和群体协同。 它关注用户需求满足过程, 将满足需求的服务渗透到大数据知识服务过程及大数据全生命周期管理的每个环节, 并充分利用群体创新对海量数据进行管理、 分析、 可视化和获取知识。2.2 大数据知识
16、服务是提供智慧服务的知识服务模式作为未来图书馆的新模式, 智慧图书馆将成为图书馆创新发展、 转型发展和可持续发展的新理念和新实践。 王世伟19-20对智慧图书馆进行了系统的论述: 智慧图书馆是以数字化、 网络化、 智能化的信息技术为基础, 以互联、 高效、便利为主要特征, 以绿色发展和数字惠民为本质追求, 是现代图书馆科学发展的理念与实践, 是未来图书馆发展的新模式。 由智慧图书馆提供的智慧服务是建立在知识服务基础上的运用创造性智慧对知识进行搜寻、 组织、 分析、 重组, 形成实用性的知识增值产品, 有效支持用户的知识应用和知识创新的服务。黄幼菲认为图书馆提供的公共智慧服务是一种特殊的智慧服务
17、, 代表着现代图书馆职业最核心、 最显著、 最本质的价值取向和终极目的, 是对图书馆知识服务的扬弃和飞跃21。 而分析应用大数据是获得智慧的关键、 是产业创新转型的新路径、 是科技创新的新范式, 大数据是数字世界的智慧基因。因此, 大数据知识服务是面向智慧图书馆提供智慧服务的知识服务模式, 主要表现为: (1) 实现图书馆基础设施互联、 融合和共享。 大数据推动图书馆、 网络、 数据库、 物体以及广大读者统一在智能的网格中, 成为联为一体的互动要素。 大数据为图书馆重组再造以及相应的数据应用和读者咨询提供了新的发展机遇, 对图书馆发展中的海量数据进行系统升级, 加强学科信息的关联性和数据质量,
18、 从海量数据分析中获得知识和洞见并提升能力, 从数据挖掘中提升图书馆服务品质, 这都将给图书馆迎来一个充满智慧的数据管理、 数据服务和数据创新的时代。 (2) 提供智慧服务。 大数据知识服务模式实现的核心是知识服务全生命周期活动中用户、 技术、 管理、 知识、 能力、 资源和过程的有机集成和优化。 为此, 大数据知识服务体系综合运用物联网、 云计算等新兴信息技术, 实现大数据处理过程的全方位、 全生命周期地接入和智能感知。(3) 构建高效的智能管理体系。 基于大数据的智能图书馆管理体系具有下列特征: 分析、 预测及智能辅助决策技术建立具有图书馆自身机构特色的、 科学的、 实用的风险模型; 通过
19、分析图书情报机构软件、 硬件和数据资源的状况来预测可能的故障, 或对于机构资源突然的波动可以帮助图书情报机构制定应对策略; 通过涉馆数据、 动态数据流、 关联数据和社会网络数据等新型数据的整合和分析, 洞察图书馆发展环境和读者需求, 以智能管理助推图书馆智慧服务。2.3 大数据知识服务是面向下一代数字图书馆发展的知识服务模式随着云计算、 物联网和大数据技术的发展, 数字图书馆正朝向语义出版、 数据知识组织、 移动阅读和分析统计的趋势发展, 下一代数字图书馆跃然呈现22。 业界的开发和应用现状表明, “新一代图书馆服务系统” 正呼之欲出, 日益具有 “全媒体” 资源管理能力、 完整的业务流程管理
20、能力和 “全网域”的资源发现能力23。 大数据知识服务的实现与人工智能方法有着不可分割的联系, 也与物联网、 云计算、 传感等技术相互支持, 是对下一代数字图书馆发展和新一代图书馆服务系统需求的回应。因此, 大数据知识服务是面向下一代数字图书馆发展的知识服务服务模式。 主要表现为: 第一, 全新的资源建设策略。 它借助大数据处理技术, 着眼于非结构化数据的业务流程再造, 不仅重新进行元数据整合、 登记、 录入, 推进主题知识库分析、 知识组织体系构建和智能信息服务平台开发, 而且深化实体标注与主题标引、 科研实体规范与关联、 书目关联、 资源耦合与时序组织等业务内容, 为资源加工与知识服务构建
21、良好的数据支撑体系。 第二, 构建全新的知识服务平台。 大数据服务平台分为基础框架体系、 大数据处理体系、 过程管理体系、 大数据分析与决策体系、 交互体系, 作为大数据获取、 存储、 组织、 分析和决策服务资源和服务能力共享、 交易和协作的智慧平台, 强调完整的业务流程管理能力和效率。 第三, 提供 “融入环境、 嵌入过程” 的预见性服务。 大数据的核心就是预测, 它把数学算法运用到海量的数据上来预测事情发生的可能性1。 图书馆运用大数据可以灵活方便地从已有海量数据资源中抓取有用的知识、 关系、 模式, 建立更加灵活智能的数据资源智能组合方式; 可以通过数据了解用户的行为、 意愿、 业务需求
22、、 知识应用能力及知识服务等需求; 可以利用数据对用户的科研创新合作过程及合作交互型知识服务过程中进行分析和预测以便提供具有前瞻性服务; 即时获取可分析的数据, 有利于提高对用户需求预测的实时性。3 实现大数据知识服务的基本路径3.1 理性推进大数据应用强化图书馆人文关怀图书馆在信息革命中的每次重大技术变革中都是通过积极运用新技术进行制度创新、 文化创新和技术创新开创了美好的未来, 这是我们理性坚信大数据时代通过走向大数据知识服务是实现图书馆光明前景的历史经验。 图书馆要正视大数据带来的机遇与挑战, 转变思路, 熟练掌握各种大数据分析技术, 提供大数据知识服务。 政府机构、 图书馆联合组织、
23、图书情报机构、 相关商业机构在关键领域进行政策制定、 科研投入与发展转型, 通过建设智慧图书馆实现跨越式发展, 把图书馆推向全新的发展阶段。无论是文华图专的 “智慧与服务” 校训, 还是阮冈纳赞的 “图书馆学五定律”都浸透着图书馆人文关怀, Gorman 提出 “图书馆学新五律” 中提出 “明智地采用科学技术提高服务质量 (Use technology intelligently to enhance service) ”24体现了信息环境下的图书馆人文关怀。 在大数据时代, 图书馆通过倡导社会责任与社会包容, 通过提供智慧的、 以人为本的大数据知识服务, 抑制大数据造成的公共权力和商业资本对
24、数据的控制权, 从而维护大数据时代的信息公平, 消除大数据将造成文化滞后和社会风险, 消除海量数据造成的制度解体和不确定性, 保护隐私权和数据安全。3.2 维护并发展图书馆制度图书馆特别是公共图书馆是不仅是一种社会机构, 而且是国家及其政府为了保障公民的知识权利而选择的一种制度安排。 它代表的是一种社会用以调节知识或信息分配, 以实现社会知识或信息保障的制度。 在大数据时代, 维护并发展图书馆制度是大数据知识服务的制度保证。 第一, 积极推动政府和相关组织履行图书馆特别是公共图书馆治理中的责任, 包括为制度供给的责任、 积极回应的责任和适度规制的责任。 通过制度来约束、 调节和优化政府、 图书
25、馆和读者的行为, 推动图书馆制度创新。 第二, 发挥图书馆在隐私权和数据安全保护中的作用。 大数据的特性使 “早期信息化时代构建的个人信息安全规则体系成了马其诺防线”1, 舍恩伯格提出了构建开展 “互联网遗忘” 运动的理念来保护隐私权和数据安全25。 其中, 图书馆可能在建立数字隐私权基础设施、打造良性的信息生态和完全的语境化和对数字化记忆设定一个存储期限等对策中发挥重要作用。 第三, 构建以公共图书馆的为主要角色的公益信息制度。 公共图书馆制度作为官办公益信息机构相关制度, 将其它类型的信息慈善捐赠制度等协同发挥作用, 保障社会基本信息权益, 满足中低阶层的最低信息需求, 实现公平信息社会的
26、愿景。 第四, 推动大数据时代公共权力、 公民社会与公民权利的再平衡。 舍恩伯格发现大数据造成的数字化记忆是一种全景控制的有效机制, 可能巩固并加深现有的 (不平等的) 信息权力分配, 进而导致数据独裁。 公民社会既是沟通政府与公民的重要桥梁, 也是影响政府决策的重要因素和推动政府改革的强大动力源。 卡梅伦政府提出基于数据开发的建立的执政纲领, 强调了民间组织和政府共同开展诸如 “邮局、 图书馆、 博物馆” 等公共服务, 建立 “更大、 更强、 更好” 的社会26。 图书馆通过提供大数据知识服务推动政府、 公民社会与公民的良性互动从而有效抵制数据独裁, 是图书馆制度创新的一个方向。3.3 培养
27、智慧图书馆员英国图书馆与信息学专家约翰逊认为任何 “智慧图书馆” 都需要 “智慧的图书馆员”, “智慧图书馆员” 的基本特征是: 资质达到一定水准、 致力于终身学习、 社会及种族多元化、 灵活性、 创造力、 见多识广、 思想开放和参与公共生活等27。 我们认为, 在大数据环境下, 智慧图书馆员要具备准确把握用于分析和预测的大数据的范畴、 价值、 状态和周期的能力; 熟练运用人工智能、 商业智能、 数学算法、 自然语言理解、 信息技术等多个跨学科领域的技术成果的能力; 为服务对象和本机构做基于 “投入回报” 的人力、 物力、 财力及发展张力的发展规划的能力等, 最终具备建立集成化的公共智慧获取、
28、 存储、 组织、 分析和决策的大数据综合解决方案的能力。 舍恩伯格预见的一种新职业 “数据科学家” 即统计学家、 软件程序员、 图形设计师和作家的结合体1是大数据时代人力资源创新的一个方向, 也应该成为培养智慧图书馆员重要标准。 这些能力可以通过政府机构、 图书馆联合机构、图书情报机构、 相关商业机构和图书馆员的共同努力而获得。3.4 构建基于大数据的图书馆知识服务平台大数据知识服务平台是一个大数据获取、 存储、 组织、 分析和决策服务资源和服务能力共享、 交易和协作的智慧平台。 根据智慧图书馆建设的基本要求, 本文提出基于大数据技术构建图书馆知识服务平台的体系架构主要包括: 数据源层、 大数
29、据智能感知层、 基础支撑层、 数据流转层、 处理工具层、 虚拟服务构件层、 知识服务平台层、 应用层和网络传输层。 构建过程中涉及的主要关键技术包括: 大数据管理与处理根据如 Hadoop 和 Map Reduce, 大数据智能识别、 传感与适配技术, 大数据知识服务模式、 体系架构、 资源分类及平台标准规范, 大数据知识服务全生命周期过程中的数据、 知识、 资源、 能力、服务、 过程和任务等资源和能力的虚拟化接入技术, 大数据知识服务交易模型研究, 大数据知识服务质量评价体系, 支持多元化、 可视化大数据知识服务终端交互技术等。4 结语研究在梳理相关文献的基础上, 对大数据时代图书馆走向、
30、大数据知识服务进行了描述和分析, 认为它是大数据知识服务是面向海量数据处理、 智慧图书馆和下一代图书馆的知识服务模式。 在此基础上提出, 理性推进大数据应用, 强化图书馆人文关怀, 维护并发展图书馆制度, 培养智慧图书馆员, 构建基于大数据的图书馆知识服务平台等路径打造智慧图书馆, 迎接大数据时代。 由于关于大数据知识服务的研究和应用只是初露端倪, 研究仅是初步考察, 结论有待在实践中进一步检验和修正。参考文献1英迈尔舍恩伯格, 英库克耶.大数据时代M.盛阳燕, 周涛译, 杭州:浙江人民出版社, 2013. 2胡小菁, 范并思.云计算给图书馆管理带来挑战J.大学图书馆学报, 2009, (4)
31、 :7-12. 3张晓林.走向知识服务:寻找新世纪图书情报工作的生长点J.中国图书馆学报, 2000, (5) :32-37. 4张晓林.颠覆数字图书馆的大趋势J.中国图书馆学报, 2011 (5) :4-12. 5OBAMA ADMINISTRATION UNVEILS“BIG DATA”INITIATIVE:ANNOUNCES$200 MILLION IN NEW R&D INVESTMENTS.EB/OL.2013-12-9WhiteHouse.gov/OSTP. 6Audrey Watters.Strata Week:Harvard Library releases big data
32、for its books:Harvard offers big data for books, Clouderas new Hadoop distribution, Splunk goes publicEB/OL.2013-12-9.http:/ 7许娓玮.国家图书馆:打造大数据时代的数字图书馆N.中国电脑教育报, 2013-2-4 (17) . 8邓景康.大数据环境下清华大学图书馆的实践N.中国新闻出版报, 2013-8-29 (005) . 9Ronald Rousseau.A view on big data and its relation to InformetricsJ.Chin
33、ese Journal of Library and Information Science, 2012, (3) :12-26. 10Library Journal.The third future of the academic library symposium:E-texts, big data, and accessEB/OL.2013-12-9.http:/ 11侯经川, 方静怡.数据引证研究:进展与展望J.中国图书馆学报, 2013 (1) :112-118. 12樊伟红, 李晨辉, 张兴旺, 等.图书馆需要怎样的“大数据”J.图书馆杂志, 2012 (11) :63-68, 7
34、7. 13李晓鹏, 颜端武, 陈祖香.国内外知识服务研究现状、趋势与主要学术观点J.图书情报工作, 2010 (6) :107-111. 14李麟, 初景利.国外文献信息服务机构知识服务实践研究J.图书情报工作, 2012 (15) :5-8. 15张晓林.研究图书馆 2020:嵌入式协作化知识实验室?J.中国图书馆学报, 2012 (1) :11-20. 16秦晓珠, 李晨晖, 麦范金.大数据知识服务的内涵、典型特征及概念模型J.情报资料工作, 2013 (2) :18-22. 17Jim G.On eScienceA transformed scientific methodA/Tony
35、H, Stewart T, Kirstin T.The fourth paradigm:Data-intensive scientific discoveryM.Redmond, WA:Microsoft Research, 2009:19-33. 18郭晓科主编.大数据M.北京:清华大学出版社, 2013. 19王世伟.未来图书馆的新模式 智慧图书馆J.图书馆论坛, 2011 (12) :1-5. 20王世伟.论智慧图书馆的三大特点J.中国图书馆学报, 2012 (6) :22-28. 21黄幼菲.公共智慧服务 图书馆知识服务的高级阶段J.情报资料工作, 2012 (5) :83-88. 2
36、2周杰, 苏静, 曾建勋.下一代数字图书馆的发展思考J.图书情报工作, 2013 (8) :35-39. 23殷红, 刘炜.新一代图书馆服务系统:功能评价与愿景展望J.中国图书馆学报, 2013 (5) :26-33. 24Michael Gorman.Five new laws of librarianshipJ.American libraries, 1995, (9) :784-785. 25英迈尔-舍恩伯格.删除:大数据取舍之道M.袁杰译, 杭州:浙江人民出版社, 2013. 26涂子沛.大数据:正在到来的数据革命, 以及它如何改变政府、商业与我们的生活M.桂林:广西师范大学出版社, 2012. 27英伊安约翰逊.智慧城市、智慧图书馆与智慧图书馆员J.陈旭炎译, 图书馆杂志, 2013, (1) :4-7.