收藏 分享(赏)

高校图书馆参与科学数据管理研究.doc

上传人:无敌 文档编号:170826 上传时间:2018-03-23 格式:DOC 页数:9 大小:80KB
下载 相关 举报
高校图书馆参与科学数据管理研究.doc_第1页
第1页 / 共9页
高校图书馆参与科学数据管理研究.doc_第2页
第2页 / 共9页
高校图书馆参与科学数据管理研究.doc_第3页
第3页 / 共9页
高校图书馆参与科学数据管理研究.doc_第4页
第4页 / 共9页
高校图书馆参与科学数据管理研究.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

1、高校图书馆参与科学数据管理研究 徐坤 曹锦丹 吉林大学公共卫生学院 摘 要: 高校作为科研的主要阵地, 其产生的科学数据亟待系统管理。文章在全面调查高校科研人员数据管理现状基础上, 对图书馆参与管理科学数据的可行性及问题进行深入的分析, 提出图书馆科学数据管理模型, 旨在为图书馆有效实施科学数据管理提供参考。关键词: 高校图书馆; 科学数据; 数据管理; 作者简介:徐坤, 男, 吉林大学公共卫生学院博士研究生;作者简介:曹锦丹, 女, 吉林大学公共卫生学院教授。收稿日期:2013-11-18Study on University Librarys Involvement in the Mana

2、gement of Scientific DataXU Kun CAO Jin-dan Abstract: Scientific data is of great importance for researchers and need to be managed systematically. After giving an investigation to current management of scientific data in universities, this paper performs in-depth analysis of the feasibility and the

3、 related issues of librarys involvement in the management of scientific data; it also proposes a scientific data management model as reference for library to manage scientific data effectively.Keyword: university library; scientific data; data management; Received: 2013-11-180 引言科学数据是指科研人员在研究过程中所产生的

4、有关实验、调查等的相关数据、图片等资源。作为科研活动的产物, 科学数据是信息时代最基本的科技资源, 对科技的发展和创新具有支撑作用, 其重要性被越来越多的科研人员所认同。为了最大限度地发挥科学数据的价值, 需要对其进行系统的管理, 以方便科学研究的合作与资源共享, 有效提高科研效率。国外已经在科学数据的存储与发布、数据的发现获取、数据管理规划、数据分析、数据引用、数据咨询等方面取得了一定成果1, 特别是在美国, Data ONE2项目、Data Curation Profiles 3项目、Data Conservancy 项目、DataStaR4项目、D2C25项目、HMDC6项目和约翰霍普金

5、斯大学的数据保存中心7等相继出现, 它们都是美国高校图书馆成功开展的数据管理和服务项目。由此可见, 科学数据管理已经成为国外高校图书馆界的一个研究热点。我国也于 2002 年开始实施“国家科学数据共享工程”, 已在气象、地震、地球系统科学、海洋、林业、农业、交通、先进制造、医药卫生等领域构建了 50 多个科学数据中心。但目前国内高校较少对科学数据进行系统管理, 利用和共享程度低, 没能发挥它们应有的价值, 令科研项目奖金投入出现一定程度的浪费。为了更好地促进高校科研事业的发展, 提高科研效率, 高校科学数据亟待进行系统的管理。虽然国外高校图书馆有很多成功的经验值得借鉴, 但由于国情不同, 数据

6、管理在国内高校的有效实施还需要面对一系列问题, 如科学数据的创建者和使用者对科学数据管理的认同情况如何? 由谁或者是哪个部门来对科学数据进行管理? 如何对科学数据进行管理?这些问题都有待于深入探讨和系统研究。1 国内高校科研人员的科学数据管理现状1.1 国内研究现状国内高校对科学数据的研究相对较少, 只有少量文献对科学数据的研究和服务进行初步探讨8-9。随着科学数据的重要性越来越明显, 科学数据的管理和利用开始获得国家相关机构的关注;科学技术部于 2002 年开始实施科学数据共享工程, 国家科技基础条件平台科学数据共享项目“医药卫生科学数据管理和共享服务系统”于 2004 年 4 月启动。国家

7、人口与健康科学数据共享平台已经投入使用, 有药学、基础医学、临床医学等 7 个数据中心10。CALIS 机构知识库项目计划收集包括科学数据和图片在内的数字资源, 但限于人力财力等诸多原因, 主要以期刊和会议论文等比较容易收集的数字资源为主。由武汉大学图书馆主持的 CALIS 三期科研项目“中国高校科学数据管理与服务机制和平台的研究”开始对高校科学数据管理展开研究。由上可见, 科学数据已经得到越来越多国内科研机构和学者的重视, 成为国内科研领域的一个研究热点。1.2 专项调查为了更好把握国内高校科学数据管理的现状, 笔者对吉林省 3 所高校的 46 名科研人员 (讲师、副教授、教授、科研管理部门

8、人员) 进行了访谈。通过访谈了解到科研人员获得的科学数据方式多数是临时、零散和不规范的。科研人员主要要求管理实验室实验、网络采集、同 行提供、社会调查等活动所产生的数据, 其中实验数据是主要部分, 网络采集主要是指所参考的其他科研人员的研究论文, 同行提供是指熟悉的朋友所提供的材料。需要进行管理的数据量多在 1G到 5G 之间;在数据组织上, 组织格式多由科研个人或者团队制定, 保存介质主要是纸质文档和个人电脑, 数据组织标准不统一, 不同团队共享共用存在障碍, 数据包括文字、图片表格等多种形式;数据安全性和可重用性较低, 很多科研人员有丢失数据或查找困难的经历。科研人员非常希望有专人来帮他们

9、管理科研数据, 把他们从繁琐的数据管理中解脱出来, 但又担心数据泄露。因此, 当谈及科学数据共享时, 科研人员普遍认为数据共享是有意义的, 但却顾虑自己的数据一旦被共享会有被滥用的可能, 从而损害自己的合法权益; 也有部分科研人员对共享的数据的真实可靠性提出质疑, 所以他们一般只和熟悉的工作伙伴进行数据共享, 共享方式主要是打包文件发送或者移动设备拷贝。由于每个科研人员都具有自己存储数据的习惯, 在科学数据共享利用时往往出现查找困难, 需要数据记录者或创建者来帮助查找, 数据再利用的比例极低, 造成科研资源的一种变相浪费。随后, 笔者又对武汉和北京两所具有科学数据管理实践经验的高校的 7 名科

10、研人员进行电话访谈。相比而言, 这 7 名科研人员的数据管理量有所增加:从 10G 到数 10G 不等, 数据组织和使用情况比没有进行数据管理的吉林高校科研人员要好, 数据共享和复用情况也有所改善, 其他方面与吉林高校的科研人员大体一致。通过访谈调查可知, 科研人员具有数据管理的需求, 但受限于技术、资金、人力等因素没能很好地对科学数据进行管理, 亟待专业部门和人员配合科研人员管理数据, 发挥科学数据的更大价值。2 图书馆是高校科学数据管理的最佳部门高校科研活动往往缺乏专门的科学数据管理计划, 也没有专门的工作团队负责科学数据管理, 因此需要专门部门承担该管理以实现数据的保存和共享利用。在访谈

11、中, 科研人员表示高校图书馆与科研管理部门应该负责科学数据管理, 而图书馆在这方面更具优势。科学数据作为信息资源的一种已经为越来越多人所重视, 因此由图书馆进行数据管理将成为一种必然趋势, 同时图书馆在科学数据管理上也具备一定的优势。2.1 图书馆具有信息组织管理和共享的经验高校图书馆的主要任务就是信息的组织和传播。从最初提供印刷材料的分类目录, 到后来开发数据库索引体系, 图书馆和图书馆员在信息系统开发和相关方法的使用中都是一个先行者。随着网络与计算机技术的发展, 图书馆向资源数字化、管理知识化、服务网络化等趋势发展, 多个省份已经建立数字图书馆联盟, 即区域性文献资源共享网络, 在对数字信

12、息资源的组织管理和共享利用上11, 图书馆积累了大量的经验。有了这些经验, 图书馆将能更好地胜任对科学数据的管理工作。2.2 图书馆具有相应的硬件平台和人员随着图书馆数字化进程的推进, 各高校图书馆都配置了相应的数字资源管理硬件设施和软件环境。笔者了解到在吉林省高校中有 11 所高校的中高端服务器平均每所超过 10 台, 用于存储和共享相关电子资源的存储空间从 10T 到上百 T 不等。在现代化的数字化环境和条件下, 科学数据的存储和管理所需要的效率和空间能够得到很好的满足。在人员方面, 大部分图书馆工作人员都有图书情报专业教育背景, 以本科和硕士研究生为主, 不少高校图书馆已经配有几名或者多

13、名博士研究生, 在电子资源管理的人力资源和技术上是一个很好的保证。同时现在各个高校图书馆的学科馆员已经和各个科室的科研人员建立起了合作关系, 为以后的共同管理科学数据打下了良好的基础。2.3 图书馆有进行数据管理的需求在信息资源数字化的背景下, 越来越多的信息资源都可以直接在网上找到, 去图书馆查找资料的用户变少。同时, 开放获取已经在各个国家实施, 很多数字资源都能方便地从网络中免费获取, 这样, 图书馆馆藏资源的价值将会大打折扣, 图书馆采集并保存信息资源的中心任务将变得不那么重要。因此, 图书馆迫切需要开发新的服务项目以增加其存在的价值。张晓林从教育科研信息的内容形态变化, 介绍科学数据

14、管理以及科学数据发现、关联、利用和再利用等方面在国外的发展情况, 并将科学数据的大量出现列为可能导致颠覆数字图书馆的破坏性技术12, 给图书馆带来了巨大的挑战。在挑战中也蕴藏着机遇, 图书馆需要抓住科学数据管理这项服务, 更好地发挥其专业优势和资源优势。3 科学数据管理的困难尽管图书馆是高校科学数据管理的最佳部门, 但是其参与科学数据管理仍存在一些困难。(1) 什么样的数据需要保护。高校科学数据量大, 并且形式多样, 并不是所有的数据都需要保存, 有的只需要临时保存, 有的则需要长期存储以便复用。如何对需要存储的数据进行筛选, 这要求数据管理人员具有相关学科的专业知识, 而不仅仅是图书情报知识

15、。(2) 如何进行科学数据的深层服务。科学数据存储的目的是为了利用和共享, 更好地发挥科学数据的价值。如何利用存储的科学数据为用户提供更好的服务是科学数据管理的一个迫切需要解决的问题。如科学数据与文献如何进 行关联?不同的数据如何相互关联?科学数据如何分类获取?这些都是科学数据深层服务所要解决的问题。(3) 科学数据管理团队成员的组成和管理。科学数据管理不仅需要图书情报知识, 更需要相关学科的专业知识, 这就要求科学数据管理的团队需要把图书情报知识和专业知识有效结合起来, 不但要有图书情报人员, 还需要配备具有领域知识的专业人员。这种跨部门的人员如何组织和管理关系到科学数据管理和利用的效果。这

16、对科学数据管理的参与人员提出了更 高的要求, 如何提升未达到要求的管理人员的相关知识水平也是科学数据管理团队需要面对的一个重要问题。(4) 科学数据管理费用。科学数据管理不但需要有专门的人员, 还需要有专门的平台来组织和管理科学数据。科学数据需要存储在专用的服务器上才能安全有效地实现共享和复用; 同时, 很多科学数据的创建都需要投入资金和人力。这些管理费用应该由哪个部门来承担? 如何使科学数据保存得到稳定的经济保障?这些都是科学数据管理需解决的重要问题。(5) 科学数据访问权限问题。科学数据在科研活动中具有重要的位置, 是科研的重要资源, 涉及科学数据创建者的利益问题。为了既保护其创建者的合法

17、权益, 又使科学数据发挥最大作用, 需要设定科学数据的访问权限。如只允许创建者访问, 无法达到科学数据管理的预期目的:实现科学数据的共享和复用, 如果让所有人都可以访问, 又会侵害创建者的知识产权。如何设置访问权限是科学数据利用过程中必须要解决好的问题。(6) 科学数据的组织和表示。由于高校学科种类多样, 产生的科学数据在格式上具有多样性。如何将不同学科的科学数据统一描述, 满足科学数据的临时存储和长期共享复用需求, 同时也方便提供者提交和保存数据, 成为科学数据组织较大的挑战。(7) 科学数据管理的其他问题, 如科学数据共享的意愿、科研人员上传数据的可信度等问题, 这些问题并非技术所能解决,

18、 而需要制定相关政策法规, 以及相关人员的理念更新。4 如何管理高校科学数据在数字化的背景下, 科学数据管理需要通过专门的管理平台来实现。对数据创建者来说, 要求能方便地对数据进行及时存储和修改, 并可设置相应的共享权限与其他研究人员进行共享复用。对数据的使用者来说, 需要通过平台实现对科学数据的搜集整理、顺利下载;如果相关数据量较大, 还需要平台提供数据分析服务。所以高校科学数据管理平台应分为数据存储和数据服务两个大功能模块。数据存储模块主要负责数据的临时或者长期存储, 是数据复用和共享的基础;数据服务模块提供数据检索服务, 通过权限的控制, 使相关用户能够检索浏览数据目录或者查看相关数据的

19、具体描述, 如果有需要可通过某种渠道下载完整数据。此外, 还应对大量的相关数据提供数据分析服务, 解构数据与相关科研文献的关系, 这正是研究人员所需要的更高层次的服务。基于上述分析, 笔者设计出一个科学数据管理的基本模型, 如图 1 (见第 96 页) 。科学数据管理平台主要由科研人员和图书情报人员使用管理。科研人员参考管理平台上的已有数据, 与自己的隐性知识相结合, 通过实验或者调查研究等方式产生新的数据并提交到管理平台;图书情报人员负责相关元数据等信息组织规范的建立, 帮助科研人员规范数据存储格式, 同时将检索到的其它网络公开数据或相关链接补充到管理平台, 方便科研人员参考使用, 提高相关

20、数据的广泛程度。平台中的系统管理模块可以设置用户权限, 有助于解决科学数据的访问权限问题。为了充分保障数据创建者的权益, 科研人员存储数据和上传数据时可以设置数据的访问权限。其基本工作流如图 2 所示。图 2 下载原图科学数据管理工作流科学数据由相关科研人员创建, 保存在临时存储库, 工作组人员可以共享, 并可以对数据进行修改删除操作。当某项科学研究完成后, 通过数据筛选, 将有长期存储价值的数据存入长期存储库长期保存。此过程主要解决什么样的数据需要保护的问题, 即决定哪些数据需要短期管理, 哪些数据需要长期存储。可采用学科专家把关的形式, 通过图情人员与科研人员的沟通共同解决数据筛选问题。上

21、传数据的质量须接受同行评议, 这要求上传的数据要足够详细完整, 具有可重复性。如果相关科研人员对上传数据具有异议, 要有通畅的渠道与数据创建者进行沟通, 对有问题的数据进行及时更改, 并解释产生错误原因。这不仅为后续研究提供好的借鉴作用, 也达到保证数据质量的目的。对同行评议效果好的数据给予其上传者较大的贡献值, 能够在系统中享有较大的权利。从长期存储库到学科数据中心要面对科学数据的组织难题, 即怎样将不同科研人员产生的科学数据规范化, 以方便其他人使用, 进一步为科研服务。可以让图书情报人员制定相应的元数据标准, 使学科数据组织规范化, 便于共享和复用。图书情报人员需具有专业的信息检索能力,

22、 可以通过检索渠道收集相关的公开数据, 将其补充到长期存储库中, 方便校内科研人员检索使用, 提高科研效率。这样也能使图书情报人员更好地了解相关专业知识, 方便进一步与科研人员协作管理科学数据。在长期存储库中, 选取不损害创建者权益的数据发布到相关学科数据中心, 让公众访问, 在更广泛的范围内共享, 发挥科学数据的最大价值。由于涉及到权益问题, 一般数据创建者在数据所支持的论文发表前是不愿意将数据公布出去的。笔者认为系统在建设过程中可以采取局域网与互联网相结合的方式, 在数据产生之初, 将数据存储在局域网的服务器内, 作为长期存储库, 只供有权限的内部人员或数据创建者使用, 保证数据的安全性。

23、数据保存时必须要注意用户使用的便捷性, 因为科研人员需要在不增加额外工作的情况下保存、组织和整理数据。由数据创建者设置何时将长期存储库中的数据发布到互联网学科数据中心 (如设置时限为 1 年) 。同时公众也可将相关数据资源上传到学科数据中心, 通过审核后在平台上与其他研究人员交流和共享。为保证数据质量, 上传的数据同样需接受同行评议, 对不合格的数据及时修改或删除。科研人员除了通过平台从数据存储库或者学科数据中心获得数据分类浏览、数据下载等基本服务外, 还需要数据分析等高层次服务, 包括数据统计分析、定性数据分析、数据关联分析等。数据分析服务是未来的发展方向, 需要更高的技术支持, 如在数据的

24、存储阶段需要描述机器可读性, 其后需要进行语义推理, 找出数据之间的潜在关系。完全由机器完成这些处理存在一定的技术难度, 但若能使科学数据融入到大数据科研环境中, 发挥它们更大的价值, 就能够解决深层服务问题。目前高校图书馆的学科馆员是科学数据管理团队成员之间沟通的重要协调者, 在解决管理团队问题时具有重要作用。至于科学数据管理费用来源的问题, 需要相关政策和相关部门的支持才能解决, 相信随着科学数据研究的成熟, 这些困难将会被合理解决。对于科研人员上传意愿问题, 笔者建议:(1) 严格执行科学数据汇交的有关规定。各级课题所产生的科学数据汇交到学校科研部门, 由科研部门与图书馆一起整理录入数据

25、长期存储库, 做好安全保密和备份工作。(2) 提高对科学数据的重视度。科学数据与学术论文具有同样的价值, 如果学科数据中心的数据能具有像期刊上的论文一样的认可度, 科研人员将会更加愿意把自己的数据发布共享。数据引用已经成为研究热点, 数据出版也已成为可能。有研究表明, 数据共享有利于提高相关文献的被引率, 加快数据出版和数据引用更能够激励科研人员将科学数据予以发布与共享。(3) 整理已有的科学数据。目前科研人员手中的科学数据大多处于休眠状态, 复用、重用率极低, 由相关部门进行整理录入, 有助于提高数据价值, 同时也能提高科研人员数据共享的意识。(4) 加大对科学数据管理的资金投入。鉴于科学数

26、据的重要性, 需要重视其管理, 对科学数据管理的资金投入有利于减少因重复创建数据而投入的资金。(5) 参与科学数据管理的图书馆员需签署保密协议, 保证数据不被泄露;同时还需帮助科研人员提高数据管理意识和能力, 使科研人员能很好地利用系统, 安全有效地管理数据。对个人上传数据的可信度问题, 目前除了在数据发布时必须经过专家审查外, 较好的方法仍然是同行评议。因此, 要求科研人员上传的数据必须完整且具有可重复性, 接受同行评议;对有问题的数据及时修改或者删除, 对上传虚假数据的人员须进行必要的惩罚。此外, 要做好对科研人员的培训和教育, 提高其数据共享意识和数据检索能力, 加强科研人员思想道德建设

27、, 减少学术不端行为, 从而保证上传数据的质量。5 结语科学数据在科学研究中的地位越来越重要, 相关科研单位和个人也越发重视对科学数据的管理和利用, 科学数据被深层次利用或者是商业出版已成为可能, 国家已建立多个数据中心以提高科学数据的利用率和更好地发挥科学数据的价值。高校作为大量科学数据的产出单位, 亟待对其产生的科学数据进行的有效管理和利用。国外图书馆同仁在数据管理上已经积累很多可以借鉴的经验, 作为高校科学数据管理的最佳部门, 国内高校图书馆应该积极主动地承担起数据管理的责任, 使高校科学数据发挥更大价值, 更好地为高校科研服务。参考文献1洪程.国外科学数据服务现状研究J.图书馆杂志,

28、2012 (10) :31-34. 2Data ONEEB/OL.2013-10-06.http:/www.dataone.de/DE/Seiten/default.aspx. 3Data Curation Profiles DirectoryEB/OL.2013-10-06.http:/docs.lib.purdue.edu/dcp/. 4Data ConservancyEB/OL.2013-10-06.http:/dataconservancy.org/. 5D2C2EB/OL.2013-10-06.http:/d2c2.lib.purdue.edu/. 6Harvard-MIT data

29、 centerEB/OL.2013-11-12.http:/hdmc.harvard.edu/. 7Digital R esearch and Curation CenterEB/OL.2013-11-12.http:/ldb.library.jhu.edu/dkc. 8彭洁, 涂勇.科学信息机构从事科学数据研究的趋势和可行性分析J.图书情报工作, 2009 (10) :47-50. 9黄筱瑾.研究型图书馆参与科学数据共享服务研究J.图书馆论坛, 2009 (12) :177-179. 10国家人口与健康科学数据共享平台EB/OL.2013-11-10.http:/ 11马志杰.我国省域高校数字图书馆联盟建设现状调查与分析J.图书馆建设, 2012 (11) :73-78. 12张晓林.颠覆数字图书馆的大趋势J.中国图书馆学报, 2011 (9) :4-12.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报