1、高校数据管护人员素养框架:探索与构建 樊振佳 秦若玉 南开大学商学院信息资源管理系 摘 要: 目的/意义数据素养是数据管护工作开展的重要基础和保障, 随着 e-Science和数据驱动的科研范式推动着数据管护的发展, 对数据管护人员的数据素养提出了更高要求。目前国内数据素养的研究和实践处于起步阶段, 尚未形成广泛认同的数据素养框架。方法/过程基于数据生命周期和数据素养相关理论, 构建出数据管护人员数据素养基本理论框架。采用质性研究方法对高校数据管护工作者及利益相关者的半结构化访谈数据进行编码分析, 实现对数据素养框架的修正。结果/结论最终形成包含数据意识、数据知识与能力、数据伦理 3 个层次的
2、高校数据管护人员数据素养框架模型。关键词: 数据管护; 数据素养; 数据管理; 作者简介:樊振佳 (ORCID:0000-0003-4966-6965) , 男, 1984 年生, 博士, 讲师。研究方向:数据治理与管理;信息社会问题研究。作者简介:秦若玉 (ORCID:0000-0002-3326-3080) , 女, 1995 年生。研究方向:数据管护。基金:中央高校基本科研业务费专项资金资助项目“面向创新驱动的企业数据治理研究”的成果, 项目编号:63172077Exploration and Construction of Literacy Framework for Data Cur
3、ators in UniversitiesAbstract: Purpose/significance As the basis and guarantee of data curation, data literacy of data curators should meet higher standards with the development of e-Science and data-driven paradigm. However, currently the research and practice of domestic data literacy are in the i
4、nitial period, and the universally recognized data literacy framework has not been formed. Method/process Taking data lifecycle and data literacy as the theoretical basis, the paper puts forward basic literacy framework for data curators. Based on qualitative analysis of semi-structural interview of
5、 data curators and other stakeholders in universities, the amendment for the basic framework has been completed. Result/conclusion This paper proposes the amendatory data literacy model for data curators in universities, which includes data consciousness, data knowledge and ability, and data ethics.
6、Keyword: data curation; data literacy; data management; 在大数据和 e-Science 环境下, 科研活动往往建立在对已有数据的重新认识、组织、分析和复用上。加强对数据生命周期的管理, 实现数据的保管、共享和增值, 开展数据管护 (Data Curation) 活动成为当前科研管理的必然需求。国外数据管护领域形成了 Data Net, D2C2, Data STa R, Data Cite 等项目和组织, 创办 IDCC、RDMF 等交流会议和“The Information Journal of Digital Curation”等学术
7、期刊, 实施了 Dig CCurr, DCEP, IDEA Working Group 等课程计划和教育论坛;众多高校已开设数据管护的相关课程和教育培训。国外对数据管护的实践机构、教育、职业发展、政策制度、关键技术、标准规则等做了探索性实践1-4。数据管护工作贯穿在数据生命周期的各个环节, 对相关从业人员提出了更高的数据素养要求。作为数据管护工作的实践主体, 数据管护人员素养很大程度上影响着数据管护工作开展的质量。对数据素养的定位、结构、功能开展实证探讨, 具有显著的理论价值和实践意义。1 研究设计鉴于目前尚未形成广泛认同的数据素养框架, 本文旨在基于对已有成果的梳理, 通过对高校数据管护工作
8、者和科研人员的半结构化访谈数据进行定性分析, 构建适用于高校数据管护工作者的数据素养框架, 为数据管护人员数据素养提升和数据管护工作开展提供参考。1.1 研究问题鉴于上述理论和实践背景, 本研究主要回答以下问题:当前我国高校数据管护人员主要包括哪些类型 (或岗位) ?其工作内容与素养需求是什么?高校数据管护人员的数据素养表现在哪些维度?每个维度下包含哪些核心能力和具体内容?1.2 研究对象数据管护是指为了确保数据当前使用目的, 并能用于未来再发现及再利用, 围绕数据全生命周期, 对数据进行的主动的管理活动。这里的数据主要是指科研数据, 指科学研究过程中形成的原始性、基础性数据及根据不同需求加工
9、后产生的衍生性数据, 包括实验勘测数据、调查资料、研究报告、论文成果等。1.3 研究方法基于通过系统梳理国内外数据生命周期理论、数据管护工作流程、数据素养内涵的相关成果, 构建出基于数据生命周期理论的数据素养基本理论框架。根据前期研究形成半结构化访谈提纲, 并于 2016 年 12 月至 2017 年 4 月针对高校图书馆等机构中从事数据管护工作的人员利益相关者进行访谈, 通过分析对理论框架进行修正补充, 最终形成高校数据管护人员的数据素养框架模型。2 数据管护角色与素养综述2.1 数据管护人员角色随着数据管护理论研究和实践的不断推进, 从事数据管护的工作者即数据管护人员 (Data Cura
10、tor) 也开始受到学界的关注。2008 年, Swan 和 Brown5提出了数据创造者 (Data Creator) 、数据科学家 (Data Scientist) 、数据经理 (Data Manager) 、数据馆员 (Data Librarian) 四种数据相关的职业角色, 4 种角色相互联系、相互协调, 其中尤以数据馆员与 Data Curator 的内在要求更为接近6。樊振佳7在对企业科研数据管护角色梳理后进一步细分为数据主管、数据管家、数据运维人等具体角色。Lesk 认为数据管护人员将成为大数据时代的高需求职业, 并探讨专业数据管护人员的职业定位、路径和职业道德等问题8。Walt
11、ers9探讨了研究图书馆和图书馆员在新时代的新角色, 进一步强调了数字管护与保存的协同策略。从全球范围来看, 数据管护的实践机构可分为国家、高校、图书馆 3 个层面的机构10。目前国内对于数据管护人员没有明确的对应岗位, 较多的学者倾向于图书馆尤其是高校图书馆作为数据管护工作的中心和机构, 图书馆的传统工作内容使其在数据管护方面具有众多优势11-13与之对应, 图书馆工作人员, 具体到数据馆员或者在原本的学科馆员基础上发展而来的新型图书馆员是目前数字管护工作的主要承担者14-15。我国图书馆学界也借鉴国外实践经验, 积极探索 e-Science 环境下图书馆的角色定位与馆员的职责和制度建设,
12、一些研究着重对数据馆员进行研究, 并对其服务内容和能力要求进行了界定16-17。2.2 数据管护教育与职业发展中对数据素养的描述随着数据管护职业的产生, 相应的专业教育与职业发展也建立起来。国外 Data Net、Dig CCurr、Data Cure Education Program 等项目促进了国外课程体系的构建18, 目前已基本形成覆盖本科生到硕士、博士、在职进修的数据管护课程体系19-20。北美 LIS 学院的数据管护课程反映出 LIS 学院对于社会的数据管护人才需求的积极响应, 与图书情报专业课程有机衔接, 兼具实践性与应用性。但从高校整体教育现况来看, 仍未形成一个整体性的制度框
13、架。我国高校的数据管护专业课程和职业发展教育实践比较薄弱, 研究主要集中于以下两个方面:一是对国外开设数据管护课程的院校、课程设置、培养目标、考核方式、特点等进行全面分析, 明确数据管护的职业需求。二是针对国内情况, 提出相关发展的建议和途径, 以期为数据管护教育提供参考、寻找突破。总体来看, 数据管护课程的内容和课程目标都与 ALA 所提出的核心竞争力中的五点相关联:信息资源、组织知识和信息记录、参考与读者服务、管理与经营、技术知识和技能21。学科背景与专业知识、从业经验、数据管理能力、数据服务、数据伦理、沟通协作能力是一名数据管护者职业发展的必备能力。此外, 数据管护强调对数据规范和标准的
14、掌握、对科研流程的了解和数据工具的使用, 是多学科知识、高学历、多经验相融合的高技能要求的工作。3 基于数据生命周期的数据素养理论框架构建数据生命周期是指从数据产生, 经数据加工和发布, 最终实现数据再利用的循环过程, 实质是依据科研过程来管理数据。数据管护是将处于生命周期中的数据通过管理活动实现复用和增值, 数据生命周期为数据管护提供了基本框架, 是数据管护流程管理的依据。因此, 从数据生命周期角度出发, 有助于理清数据管护的过程数据管护人员所担任的角色和责任, 以及对应所需具备的数据素养。3.1 数据生命周期模型梳理国外研究机构结合实践, 构建了多个数据生命周期理论模型, 其中具有代表性的
15、有 DCC22, DDI3.023, Data ONE24等数据生命周期模型, 受篇幅所限, 本文对上述模型具体内容不作赘述。数据生命周期模型主要有层次性、链型、环型等模式, 在阶段划分方面, 各模型虽有不同, 但都是以科研活动的过程为依据, 包含初期的数据创建、计划, 中期的收集、描述、保存、分析阶段, 以及后期的发布、共享和再利用。从内容来看, 包含数据加工与知识抽取两部分。数据加工可细分为初次加工和再加工, 数据初次加工包含数据收集、描述、存储等环节, 实质上是完成数据的长期存储。数据再加工是对已经存储的数据进行二次加工, 如可视化处理、数据链接生成、数据模拟、数据注释, 以增加附加值。
16、而知识抽取则是在数据加工基础上的服务升华, 如数据挖掘、数据建模、数据分析、数据融合。参照前述内容, 科研数据生命周期可分为数据管护计划、数据收集、数据处理、数据分析、数据存储与保存、数据共享与再利用共 6 个阶段:。3.2 数据素养内涵梳理及基本框架构建通过对相关内涵分析发现, 数据素养具有以下特点: (1) 数据素养与科研工作流、数据生命周期紧密相连, 具有嵌入性; (2) 目前对数据素养的定义主要分为两个视角, 一是科研数据管理视角, 二是数据利用视角;数据素养更为强调分析数据、展现数据的能力以及数据管理工具的使用等具体实践技能。数据素养与信息素养的关系主要包括两种观点:一种认为数据是一
17、种具体形式的信息, 数据素养是信息素养的子集25-26;另一种则基于广义的数据概念, 认为数据素养是信息素养在大数据时代的产物, 是信息素养的延伸与深化27-30。综观数据素养内涵的现有研究, 主要以两个角度展开, 一是科研数据管理视角 (关注数据生产、组织和存储等环节) , 二是数据利用视角 (以信息素养为逻辑框架, 关注科研数据的利用与再利用) , 内容主要分布在数据意识、数据知识、数据能力、数据论理 4 个方面。数据知识和能力是数据素养的主体和基础, 数据素养贯穿在数据管护生命周期中, 与学术活动过程相融合, 本文基于数据生命周期理论, 将数据素养内涵嵌入科研工作流, 构建出数据管护人员
18、的数据素养理论框架, 如图 1 所示。图 1 基于数据生命周期的数据素养基本理论框架 下载原图在目前高校数据管护实践中, 基于图 1 的基本理论框架, 本研究通过对高校数据管护工作者以及科研人员的访谈分析, 从高校数据管护实践工作和数据素养需求两个角度, 对数据素养框架进行修正。4 高校数据管护人员数据素养框架4.1 数据素养要求:高校数据管护工作者访谈分析本次研究受访者共 21 人, 包括数据管护一线工作人员和教师、本科生、研究生等相关人员。数据管护工作人员来自高校图书馆、档案馆、校级科研处、院系科研管理办公室等科研管理相关岗位工作人员。访谈采用半结构化的形式, 通过面对面访问、电话访谈和在
19、线交流三种方式, 试图了解以下几个方面的情况:数据管护工作开展情况及职能要求、从业者数据知识和数据技能水平的现状、对数据素养提升和教育培训的想法。利用质性分析软件对文本进行编码分析, 通过开放编码、主轴编码、选择编码和节点分析, 对通过理论梳理建立的基本框架进行修正补充, 最终形成高校数据管护工作人员的数据素养框架。4.1.1 高校数据管护实践主体目前高校科研数据管理的相关工作主要集中在两类部门:一类是科研管理处、科研管理办公室等行政部门;另一类是高校图书馆、档案馆, 其中尤以图书馆为主。三者虽然都围绕科研数据开展工作, 但是工作内容和侧重点差异明显, 如图 2所示。图 2 高校数据管护实践主
20、体示意图 下载原图档案馆保存科研档案, 主要以归档保管为目的, 对数据共享与增值的关注较少。从定义来看, 科研档案的范围比科研数据宽泛, 作为科研档案中的一部分, 目前科研档案中很少包含过程性的研究数据, 更多的是项目开展过程的记录性文件。图书馆作为高校智库和科研数据中心, 则更多关注于科研数据本身, 在文献保存、数据库建设、学科服务方面都开展了很多工作, 充分体现了图书馆传统业务的基础和优势。国外高校数据管护有两种模式, 一是由学科馆员承担数据管护的工作, 例如康奈尔大学图书馆的 Data STAR 项目。另一种模式是设立独立的岗位, 由专业人才全面负责, 例如纽约大学、普林斯顿大学等。目前
21、。国内大部分高校的模式更类似于前者, 没有设置专门的数据管护岗位和部门, 对工作职业界定模糊, 更多的是基于信息咨询部、学科服务部、数字资源建设部、战略情报部等原有部门, 与其他工作相交叉。不同的机构工作内容不同、相互补充。在受访的 12 所高校中, 有 5 所高校表示机构间有合作沟通, 方式以数据交换和共享为主。总体而言, 机构间合作方式较为简单, 主要是单向分享数据, 尚未形成深层次合作和明确的协作机制。4.1.2 高校数据管护人员的数据素养要求基于半结构化访谈数据, 对实践中高校数据管护人员的数据素养要求进行了梳理归纳, 将数据素养分为数据意识、数据知识与能力、数据伦理三大维度。除了上述
22、数据素养要求, 要想完成好数据管护工作, 通用能力也是重要的组成部分, 受访者对通用能力也表现出了较高的关注。因篇幅所限, 本文略去对访谈记录编码过程的展示, 仅对编码结果汇总说明如下:1) 在数据意识方面, 了解数据管护、科研数据的概念是开展数据管护工作的前提和条件, 很多图书馆没有形成对数据管护的正确认知, 对工作的意义和目标不了解, 这直接影响了数据管护工作的开展。数据管护的最终目的是实现数据的共享、再利用和增值, 要具有数据价值意识, 认识到数据能够被管理利用并发挥作用。此外, 数据共享意识不仅仅是对数据管护工作者的要求, 也是对科研人员的要求。2) 数据知识和能力是数据素养中的主体,
23、 且嵌入科研数据管护过程。这一维度的内容主要涉及数据采集、数据处理、数据保存、数据分析、数据利用 5 个阶段。1 数据采集主要是检索、人工获取和系统自动抓取三种方式。关注的数据素养以确定数据源、采集能力、数据选择和评估为主, 数据收集阶段的难点和重点是数据不全面和数据采集来源的问题, 要保证数据的全面、准确、有价值。2 数据处理主要是进行数据核对和清洗、数据描述、系统录入、创建目录等, 这一块对图情领域的专业传统知识要求较高, 如数据组织、元数据、数据评估与筛选、数据标准与规范处理等。3 数据的保存。对于行政部门来说, 数据有科研管理系统, 上传到系统中, 有的简单的数据直接用 Excel 来
24、保存, 有的不保存具体论文内容。图书馆主要是以本地服务器、机构知识库、网络数据库等平台进行保存, 出于数据安全, 会进行备份。这一阶段需要了解数据的存储格式、制定存储计划、具备数据安全与备份能力。同时由于系统间地差异, 要注意数据格式和互操作能力。4 数据分析阶段是现有工作中相对薄弱的部分, 主要进行简单的统计分析, 没有更深入数据挖掘和整合, 提供的共享服务也较为简单。数据管护对于数据分析的需求很大, 数据挖掘、大数据分析能力、数据可视化, 甚至是统计学和数学计算机的基础都很重要。例如, 北京理工大学图书馆与数学学院合作, 请数学系的学生加入到数据分析的工作中来。此外, 数据分析工作的重要需
25、求是学科背景知识, 对专业前沿知识敏感、了解学科相关知识, 能够更好地理解和分析数据、开展专业性的工作。5 数据利用方面, 目前的主要形式是提供数据库、机构知识库等平台, 提供检索下载等服务;一些高校建立了学科数据平台, 教师可以在上面自主管理并上传科研数据进行管理。数据共享与再利用环节, 这是数据管护的核心所在, 在是最需要法律政策, 伦理道德来约束的环节。为了数据能够更好地被利用, 要提供使用渠道, 通过多种呈现和检索方式, 多重角度呈现数据。此外, 要积极进行宣传和推广, 宣传能力、营销能力都很关键, 要真正让用户感到数据管护流程的价值。将实践情况与上文的理论框架进行对比我们可以发现,
26、数据管护计划这一阶段在实践中基本是缺失的, 这与我国的数据管护政策有关, 国外一些项目立项对数据管护计划有强制性要求, 这在国内还未形成统一要求。但更多的情况是, 目前的数据由科研团队和项目负责人自己进行负责, 在研究计划中并没有对此提出要求。这一块也是目前广泛存在的小科研数据。嵌入科研工工作流并不是数据管护工作提出的新概念, 早在图书馆的学科服务中这一点就有所体现, 但是受访的高校图书馆均表示目前的学科服务进行的较浅, 要让科研团队感觉到你的服务和存在有价值, 这才能合作。要有数据需求的分析能力, 准确把握用户的需求点, 使数据管护工作真正满足用户需求, 实现价值。这一过程中也需要工作人员具
27、备一定的项目管理能力。4.1.3 数据管护培养目标与专业培训培训是提升数据素养的重要手段, 数据管护工作对工作人员提出了新的数据素养要求, 需要对原有馆员进行培训提升。此外, 数据管护机构本身也担负着进行数据素养教育的职责。在受访的 10 所高校中, 图书馆和档案馆都表示会定期组织培训, 有些图书馆员也面向校内开展课程。培训包括新入职培训和职后培训, 主要包括学术前沿讲座、部门交流、机构内培训、校外机构培训等, 培训内容基本都是结合实际业务, 大数据分析、数据可视化、数据挖掘也成为图书馆培训的新领域。但对于数据伦理、法律政策、宣传运营、数据管护具体方面的内容比较薄弱, 在课程开设方面也没有形成
28、较为成型的培养体系。4.2 数据素养期许:数据用户需求的访谈分析作为科研数据的创造者和数据管护的用户群体, 科研人员的数据需求, 是研究数据管护如何更好发挥效用的关键因素。通过访谈分析, 科研人员对数据管护机构和人员的关注点主要集中在以下方面:1) 数据管护需求。由于学科性质的差异、科研数据特点的不同, 不同学科的研究人员对数据管护的需求呈现出差异。相对而言, 理工科会产生大量的实验数据、过程性资料等, 数据体量大, 通常以 T 为单位, 并且需要更为专业的、集合的平台来辅助管理。同时数据共享需求较大, 意识也较强。有社会科学人文学科的研究者则表示, 数据量较小, 自己可以管理, 没有数据管护
29、的需求。2) 数据共享机制与价值。在对数据管护机构的调查中发现, 数据以公开性数据为主, 过程性数据科研人员一般不愿提供, 科研竞争、知识产权保护、无强制性的制度等因素都使得数据共享工作开展困难。3) 数据管护技能与知识背景。归根到底, 科研人员关注数据将被如何处理和加工、如何被更好地使用。“没有人比我更了解我自己的研究”这是很多学者的想法, 一方面数据管护人员必须具备数据的采集、组织、分析、存储、利用等能力, 另一方面对学科知识背景提出了要求, 要求数据管护工作具有专业性, 真正发挥其价值。4) 数据安全。在受访的科研人员中, 数据安全是所有人都提到的问题。数据如何被合理、安全地共享和利用,
30、 过程中如何处理可能出现的学术剽窃、数据盗用、恶意竞争等问题, 这需要国家层面强制性、完善的制度进行保障。数据安全不仅仅是对工作人员的要求, 也是对所有参与到数据管护过程中的主体的要求。4.3 高校数据管护人员的数据素养框架修正通过研究分析, 对前述数据素养基本理论框架进行修正和补充, 形成高校数据管护人员数据素养框架, 如图 3 所示。图 3 高校数据管护人员的数据素养框架 下载原图该框架采用同心圆结构, 共分为三层, 框架中心是数据意识, 中间层将数据知识与能力进行整合, 并按照数据管护的流程进行分类, 其中增加了一块通用能力;最外围是数据伦理。体现了 3 个部分的内在关系, 数据意识是内
31、在驱动和前提、数据知识和能力是基础、数据伦理是准则与保障。4.3.1 数据意识数据意识位于框架中心, 是数据管护工作开展的前提和内在驱动。数据意识是指人们能够认识到并认可数据在科学研究中的价值、对数据具有敏锐性和洞察力、具有数据开放共享的意识。数据意识存在于数据管护工作的各个环节, 对数据管护工作的概念认知和价值认同是数据管护工作开展的重要驱动力。4.3.2 数据知识与能力数据知识和能力是完成数据管护工作的刚性需求, 是基础。数据知识是指具备的数据相关的基本知识, 数据能力是数据工作实践中的实际操作技能和应用的技能。本文将数据知识和能力整合为一个整体, 并按照数据管护的生命周期流程进行细分,
32、分为如下 7 个方面:1) 数据管护计划:数据管护人员要了解 e-Science 环境中科学研究的过程与流程, 制定数据管护计划。这一过程需要数据管护人员参与到项目中, 要具有数据需求分析能力, 了解科研人员的数据需求。要对项目中可能产生的数据类型、体量、形式、元数据标准、保存方式与期限、访问利用方式等予以规定。这一阶段对数据价值判断力和敏感度、项目管理能力、数据管护知识具有综合要求。2) 数据产生与采集:科研过程伴随着大量数据的产生, 需对数据进行及时收集, 确保其在未来一段时间得以长期保存并降低其损坏流失率。数据管护人员要明确数据源, 会使用数据采集工具、掌握数据检索技巧, 并能够对数据是
33、否具有管理价值进行评估判断。3) 数据处理:数据要用适当的格式进行管理和描述, 制定统一的元数据标准, 使不同的系统、不同领域的数据能够统一设置。此外要对数据进行清洗筛选、标识、编目等处理, 并保证数据规范和质量。4) 数据分析:该阶段是对数据价值的再次挖掘和呈现, 需要掌握基本的数据统计和分析方法, 能够用可视化工具分析, 对数据进行重新表现和解释, 并利用数据为决策服务。5) 数据存储与保存:为了数据能长期保存和共享, 科研人员应了解数据存储、备份和数据安全控制方面的知识, 遵守相关的保存和安全方面的规定, 掌握基本的处理和解决方法。6) 数据共享和再利用:数据管护的最终目的在于数据的重用
34、、共享和增值。需要建立数据发布和共享平台、提供多样的数据访问入口。数据管护人员要了解共享规则和政策, 关注数据的安全、隐私、知识产权问题。此外要具备数据宣传和推广能力、反思与决策能力。7) 通用能力:通用能力在实际工作中发挥着重要作用, 包括计算机 (编程) 、数学知识 (统计) 、学科知识背景、沟通交流、项目协作能力等。4.3.3 数据伦理数据伦理问题由信息伦理的观点延续而来, 对数据管护工作人员仍然适用。数据伦理包含法制意识、数据安全、数据道德、知识产权、数据法律、数据规范等多方面。不同于实际的知识能力, 数据伦理的提高更具有难度。数据伦理是数据管护用户最为看重和关心的一个维度, 数据管护
35、需要相关法律制度进行保障, 也对数据管护人员的法律伦理提出了更高要求。5 结束语数据管护人员是数据管护实施的主体, 其数据素养是影响管护效果的重要因素, 值得关注。本文基于数据生命周期和数据素养的相关理论、结合实践调研提出形成包含数据意识、数据知识与能力、数据伦理 3 个层次的高校数据管护人员的数据素养框架模型, 可为数据管护人员的数据素养提升和高校数据管护实践发展提供参考。我国目前的数据管护实践尚处于探索阶段, 有很大的研究和发展空间。关于数据素养的讨论学界也尚未形成统一定论, 相关研究可从实践角度出发, 制定数据素养框架、探讨教育培训机制等, 对数据素养的理论与实践进行更深入的探讨。受研究
36、条件限制, 本文在访谈对象覆盖度方面有待进一步提升。希望后期继续在此基础上开发数据素养测量量表, 检验、修正其信效度, 最后通过大规模问卷调查, 从定量角度建立高校数据素养理论模型。参考文献1KARASTI H, BAKER K S, HALKOLA E.Enriching the Notion of Data Curation in E-Science:Data Managing and Information Infrastructure in the Long Term Ecological Research (LTER) NetworkJ.Computer Supported Coop
37、erative Work (CSCW) , 2006, 15 (4) :321-358. 2WITT M.Institutional Repositories and Research Data Curation in a Distributed EnvironmentJ.Library Trends, 2008, 57 (2) :191-201. 3BEAGRIE N.Digital Curation for Science, Digital Libraries, and IndividualsJ.International Journal of Digital Curation, 2008
38、, 1 (1) :3-16. 4HIGGINS S.Digital Curation:The Emergence of a New DisciplineJ.Bulletin of the Australian Mathematical Society, 2011, 6 (6) :475-477. 5SWAN A, BROWN S.The skills, role and career structure of data scientists and curators:an assessment of current practiceand future needsJ.Nieuwsbrief Spined, 2008, 22 (7) :20-22.