收藏 分享(赏)

CALIS数据收割与导出Record格式扩展规范.doc

上传人:杨桃文库 文档编号:1183703 上传时间:2018-06-17 格式:DOC 页数:14 大小:658KB
下载 相关 举报
CALIS数据收割与导出Record格式扩展规范.doc_第1页
第1页 / 共14页
CALIS数据收割与导出Record格式扩展规范.doc_第2页
第2页 / 共14页
CALIS数据收割与导出Record格式扩展规范.doc_第3页
第3页 / 共14页
CALIS数据收割与导出Record格式扩展规范.doc_第4页
第4页 / 共14页
CALIS数据收割与导出Record格式扩展规范.doc_第5页
第5页 / 共14页
点击查看更多>>
资源描述

1、CALIS 基本标准与规范27CALIS OAI 记录格式与发布规范CALIS 基本标准与规范28CALIS OAI 记录格式与发布规范目 录1 概述 .292 CALIS 记录格式 V1.0 及数据发布模式 1 .292.1 记录(Record)格式 V1.0 .292.2 CALIS 数据发布模式 1 .313 CALIS 记录格式 V2.0 及数据发布模式 2 .333.1 记录(Record)格式 V2.0 .333.2 CALIS 数据发布模式 2 .343.3 记录(Record)格式 V2.0 示例 .354 数据发布模式的实现方式 .364.1 CALIS 数据发布模式 1 的

2、实现方式 .364.2 CALIS 数据发布模式 2 的实现方式 .385 相关标准规范 .39CALIS 基本标准与规范291 概述本文给出了 CALIS OAI Record V1.0 和 2.0 格式的定义、相应的数据发布模式和实现方式、以及所应遵循的标准规范。2 CALIS 记录格式 V1.0 及数据发布模式12.1 记录( Record)格式 V1.0在 CALIS 在 2005 年公布的有关 OAI 系列规范中涉及到了一种 OAI Record 数据格式的定义。本文将其称为“CALIS Record V1.0 格式规范” 。该规范完全符合 OAI-PMH 2.0 标准。在 CALI

3、S Record V1.0 格式规范中, OAI Record 格式的示意图如下: 符 合 C A L I S 元 数 据 规 范 的 元 数 据 片 断图 1:CALIS Record V1.0 格式结构在上述结构中,元数据(metadata)通过“CALIS_OBJ:objInfo”来建立与相应数字对象的对应关系。详细 metadata 和 CALIS_OBJ:objInfo 的定义参见 CALIS 有关规范。CALIS OAI Record(V1.0)有以下两种应用方式。CALIS 基本标准与规范301) 作为 OAI 数据导出文件的数据记录格式2) 作为 OAI-DP 发布的数据记录格

4、式(1)方式一:作为 OAI 数据导出文件的记录格式当采用符合CALIS OAI METS 数据导出规范 (2005 公布)所规定的格式进行元数据导出时,所导出的 XML 记录文件中含有一条 Record 记录。该记录的格式就是 CALIS Record V1.0 格式。该文件成为 OAI Record 文件。(2)方式二:作为 OAI-DP 发布的数据记录格式OAI-DP 提供两种数据发布方法,如 GetRecord 和 ListRecords。当采用 OAI-DP 中的 GetRecord 方法进行单条元数据发布时,GetRecord 的响应结果中含有一条 Record 记录,如图 2 所

5、示: 符 合 C A L I S 元 数 据 规 范 的 元 数 据 片 断图 2:OAI GetRecord 的响应结果当采用 OAI-DP 中的 ListRecords 方法进行多条元数据发布时, ListRecords 的响应结果中含有一一至多条 Record 记录,如图 3 所示:CALIS 基本标准与规范31 符 合 C A L I S 元 数 据 规 范 的 元 数 据 片 断 图 3:OAI ListRecords 的响应结果2.2 CALIS 数据发布模式 1(1)基于 OAI + MQ 的发布方式在 CALIS 在 2005 年公布的有关 OAI 和 METS 系列规范中,学

6、位论文和特色库本地系统的数据发布方式如下:1)自动发布 本地系统的元数据通过 OAI-DP 发布。OAI-DP 所发布出来的 OAI Record 采用 CALIS Record V1.0 格式(如图 1 所示) 。 本地系统的数字对象通过 METS-DP+MQ 发布。METS-DP 负责将数字对象封装成 METS 数据包(参见 CALIS 有关规范) ,然后通过 MQ 服务器发布出去。CALIS 基本标准与规范32 元数据和数字对象之间的关系通过 OAI Record 中的 CALIS_OBJ:objInfo 子元素所包含的 MetaID 进行关联。2)手动发布 本地系统管理员用 OAI 数

7、据导出工具将 OAI-DP 中的元数据导出成为包含OAI Record 数据的 XML 文件(如图 1 所示) 。该文件称为 OAI 记录文件。如前所述,该文件中的数据格式为“CALIS OAI Record V1.0” 。 本地系统管理员用 METS 数据导出工具将 METS-DP 中的数字对象数据导出成为包含 METS Record 数据的 XML 文件。该文件称为 METS 记录文件。本文将该文件中的数据格式记为“CALIS METS Record V1.0” 。 管理员手工将上述两类文件通过 FTP 上传至 CALIS 子项目中心,由 CALIS子项目中心完成数据汇总工作。本文将上述元

8、数据和数字对象的基于 OAI+MQ 的整合发布方式称为“CALIS 数据发布模式 1”。(2)数据质量检查模块 V1.0在上述“CALIS 数据发布模式 1”中,OAI-DP 、METS-DP 和 MQ 三个模块的部署都较为复杂,OAI-DP 中的 OAI 记录、METS-DP 中的 METS 记录以及 MQ 中的消息包记录之间都存在一定的对应关系,学位论文和特色库本地系统需要保证这三类记录中数据的必备性、内容正确性以及这些记录之间的数据一致性。为此,CALIS 特制定了学位论文和特色库本地系统的数据质量检查模块 V1.0 的功能规范 ,要求学位论文和特色库本地系统的开发商按此规范开发和部署符

9、合该规范的“数据质量检查模块” ,用于对 OAI record(遵循 CALIS OAI Record V1.0 格式)和 METS record(遵循 CALIS METS Record V1.0 格式)数据进行校验(校验方式包括“分别校验”和“联合校验” ) 。同时,OAI-DP 和 METS-DP 在数据发布之前,也应自动调用该模块完成对 OAI record 和 METS record 数据的校验。本地系统的管理员可以采用上述“数据质量检查模块 V1.0”对本地系统所发布的 OAI和 METS 数据(无论是通过著录方式添加的数据还是通过数据迁移增加的数据)从多个方面(必备性、正确性和一

10、致性等)进行检查和校验,以便发现可能的数据错误,易于管理员解决和重新发布。CALIS 基本标准与规范333 CALIS 记录格式 V2.0 及数据发布模式2为简化“CALIS 数据发布模式 1”中数字对象发布的复杂性,本文提出了新的“CALIS OAI Record V2.0 格式 ”以及相应的“CALIS 数据发布模式 2”。3.1 记录( Record)格式 V2.0与 CALIS OAI Record V1.0 格式相比,在 CALIS Record V2.0 格式中,保留了原有的header 和 metadata 段,而对原 about 段采用两种方式处理: 方式 1:若当前元数据存在

11、对应的 METS 包,则在 about 段中直接添加 METS 包。METS 包本身的格式不变(仍遵循“CALIS METS Record V1.0 格式” ) 。相应的 OAI Record数据格式如下图所示。 符 合 C A L I S 元 数 据 规 范 的 元 数 据 片 断当 前 元 数 据 所 对 应 的 M E T S 包 符 合 C A L I S 元 数 据 规 范 的 元 数 据 片 断用 于 维 护 元 数 据 与M E T S 一 致 性 的 四 项 信 息图 4:从 CALIS OAI Record V1.0 格式到 CALIS OAI Record V2.0 格式方

12、式 2:若当前元数据不存在对应的 METS 包,则将 about 段去掉。相应的 OAI Record 数据格式如下图所示。CALIS OAI Record V1.0 格式 CALIS OAI Record V2.0 格式(含 METS 包)CALIS 基本标准与规范34 符 合 C A L I S 元 数 据 规 范 的 元 数 据 片 断图 5: CALIS Record V2.0 格式(不含 METS 包)本文将上述方式 1 和 2 所定义的 OAI Record 格式统称为“CALIS OAI Record V2.0 格式” 。3.2 CALIS 数据发布模式 2(1)基于纯 OAI

13、的发布方式基于 CALIS OAI Record V2.0 格式和 OAI-DP,学位论文和特色库本地系统的数据发布方式如下:1)自动发布 本地系统将相关的元数据和数字对象按 CALIS Record V2.0 格式封装为一条OAI 记录,通过 OAI-DP 对外发布。2)手动发布: 本地系统管理员采用新的 OAI 数据导出工具将本地系统中的元数据和数字对象合并为一条 OAI 记录导出为 OAI 记录文件。该文件中的数据格式为“CALIS OAI Record V2.0”。 METS-DP 中的数字对象数据无需再单独导出。 管理员手工将上述类型的文件通过 FTP 上传至 CALIS 子项目中心

14、,由CALIS 子项目中心完成数据汇总工作。本文将上述元数据和数字对象的基于纯 OAI 的整合发布方式称为“CALIS 数据发布模式 2”。CALIS OAI Record V2.0 格式完全符合 OAI-PMH 标准,并与 CALIS 原有的 CALIS OAI Record V1.0 格式遵循相同的元数据 schema 规范和 METS 数据包规范:(1) http:/www.openarchives.org/OAI/2.0/OAI-PMH.xsd(用于定义 OAI-DP 响应格式)CALIS 基本标准与规范35(2) http:/ CALIS Record 数据导出格式)(2)数据质量检

15、查模块 V2.0在上述“CALIS 数据发布模式 2”中,本地系统只需部署一个 OAI-DP 用于对外发布数据,而 METS-DP 只需为 OAI-DP 提供数字对象的封装功能。OAI-DP 所发布的 OAI Record 数据遵循 CALIS OAI Record V2.0 格式。在该 OAI Record 数据内,metadata 和METS 存在同一个中,能够自动保证元数据和数字对象的对应关系。但该 OAI Record 仍需要保证数据的必备性、内容正确性以及数据内部的一致性。为此,CALIS 特制定了学位论文和特色库本地系统的数据质量检查模块 V2.0 的功能规范 ,要求学位论文和特色

16、库本地系统的开发商按此规范开发和部署符合该规范的“数据质量检查模块” ,用于对 OAI record(遵循 CALIS OAI Record V2.0 格式)数据进行校验。同时,OAI-DP 在数据发布之前,也应自动调用该模块完成对 OAI record 的校验。本地系统的管理员可以采用上述“数据质量检查模块 V2.0”对本地系统所发布的 OAI Record 数据(包括其中的元数据和数字对象)从多个方面(必备性、正确性和一致性等)进行检查和校验,以便发现可能的数据错误,易于管理员解决和重新发布。3.3 记录( Record)格式 V2.0 示例下面给出了一个符合 CALIS OAI Reco

17、rd V2.0 格式的 OAI Record 数据片断,其中包含了元数据 metadata 和 METS 包两个主要部分。CALIS 基本标准与规范36图 7:CALIS OAI Record V2.0 样板数据片断由于篇幅有限,图 7 中没有列出 OAI Record 中元数据部分(metadata 的子元素)和METS 包部分(about 的 METS 子元素)所包含的详细内容。图 7 所对应的完整的样例,请查看文件CALIS OAI Record V2.0 格式附例 。4 数据发布模式的实现方式在同一个学位论文或特色库本地系统中,上述所定义的“CALIS 数据发布模式 1”和“CALIS 数据发布模式 2”可以同时存在,由管理员灵活选择使用,也可以只提供其中的一种发布模式。4.1 CALIS 数据发布模式 1 的实现方式CALIS 数据发布模式 1 的实现方式包括以下几个方面:1、增加“数据质量检查模块 V1.0”该模块为管理员提供手工校验操作功能。该模块还为本地系统提供两种数据校验接口:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 规章制度

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报