1、利用 OCLC 网上免费数据促进西文图书分编质量Improving the quality of the western language cataloguing use the free OCLC data张利红 (北京大学第三医院图书馆 北京 100083)摘要为了提高西文图书的分编质量,我们利用 OCLC 免费的书目数据库的源记录进行西文图书套录编目,从书目数据、编目规则、编目规范等方面认真核对和修改,确保编目数据的规范化、标准化。关键词西文文献编目 套录编目 源记录 编目质量控制中图分类号 G254.3 Abstracts To improve the quality of the w
2、estern language cataloguing, using the free OCLC data of original recordings, cataloguing data, rules and regulations should be carefully checked and revised so as to ensure the recognize and normalize of cataloguing data.key words Western language cataloguing; Inherent cataloguing; Original recordi
3、ngs; Quality control在图书馆基础业务工作中占很大比重的我国图书馆编目工作,特别是西文图书编目,早在 20 世纪 90年代初期就开始采用套录的方法。套录的数据源主要是来自著名的 OCLC 书目数据库。OCLC 是 Online Computer Library Center, Inc.的缩写,即联机计算机图书馆中心,创建于 1967 年,目前 OCLC 已发展成为世界上最大的图书馆自动化网络,向全世界 64 个国家和地区的 2.7 万个图书馆提供信息服务。OCLC 是世界最大的联机书目中心,利用其免费数据库的数据编目,可以达到意想不到的效果,新书的套录率几乎达到 95%,大大
4、减少了原本必须做的原始编目数据,数据的规范化、标准化程度得到进一步提高。具体套录方法:依据原版书的 ISBN 号检索,因为 ISBN 号专指性能强,检索快捷准确,检索率高。未检索到的记录可以通过题名、著者等检索。将检索到的源数据下载,然后对源数据进行修改、删除、增加相应的字段,使之成为本馆记录。为保证编目质量,编目时应注意下面几种情况。1 修改源数据的 USMARK 格式如实的著录是编目工作的一条基本原则,套录编目同样要遵循这一原则, 不受源记录的影响,因此要认真地将源记录数据逐一与所编文献核对,对不符合之处做出修改,使之符合所编文献的客观状况,一部作品出自多国,多个出版商推出多种版本,即使是
5、美国国会图书馆也难以收齐一种著作的所有版本,通过联机数据库网络控制也是如此。因此,所编文献的版本与源记录的版本不很一致的情况时有发生,稍有疏忽容易出错,要特别注意审核源记录字段的内容。1.1 记录头标区头标区位于机读目录的开端,以固定字符作用,代码反映文献的特征和记录状态。其中 05 字符位为记录状态,06 为记录类型,17 为编目等级,18 为著录标准共 18 个字符位。编目员在套录数据时,只要修改源记录就要注意头标区的变动,要在记录状态 05 字符位选择 c,表示修改的记录,编目等级 17 字符位的代码是#,表示完全级,如果 17 字符位的代码是 1,则表示此记录虽然是完整的 MARC 记
6、录,但未核实文献实体,主要用于回溯转换记录。 1.2 008 字段008 字段以代码的形式描述编目文献整体和特有的书目特征,很容易被机器识别,在检索和数据管理时起作用。源记录修改时要注意字符位与所编文献的对应:(1)记录入档日期(00 05 字符位)是由计算机自动生成。它与 001 字段中的入档日期不同,001 字段的日期是动态的,记录每更新一次,日期也随之更改,而 008 字段则是永久不变的,修改源数据时要按F4,改变当前日期。(2)出版日期类型 (06 字符位)和出版日期(07 10,11 14 字符位) ,按所编文献的出版年改写;出版地代码(15 17 字符位)应根据所编文献的出版地如实
7、记录。(3)插图代码(18 21 字符位)若源记录是根据在版编目资料( CIP)编制的,300 字段的载体形态说明就是空缺的,因此在补充 300 字段时要在本字符位添加相应的插图代码。本字段的著录信息与007、008 字段相应代码保持一致。1.3 010 美国国会图书馆 (LC)控制号和 082 杜威分类法原则上保留。1.4 020 字段 ISBN 字段ISBN 即国际标准书号。主要用于检索特定书目,是很有用途的检索点。当标准号不同时,可能有以下几种情况:(1)装订形式(精装本与平装本)的区别;(2)版本不同;(3)标准号码有误。有时,在同一条记录中会出现几个不同的 ISBN 号,要根据文献实
8、体,将与本馆所收藏的图书相一致的 ISBN 放在首位,其余的逐一记录在不同的 020 字段。曾经是有效的但后来被取消的或错误的 ISBN 也应著录在020 的$z 子字段,以防检索者根据错号查询图书,提高查全率。在录入国际标准书号时,不必录入各组数字之间的连字符。例如: 020 # # $a3540418733 (hardcover : alk. paper)020 # # $a0071428690 (pbk. : alk. paper) 020 # # $a3805575181 (softcover) 1.5 245 题名说明字段和 246 变异题名字段(1)245 字段是书目检索中最重要的
9、题名检索点,亦可作关键词检索。第 1 指示符:说明是否提供题名附加款目。0 表示无题名附加款目,1 表示有题名附加款目。也就是说,当所编图书没有 1XX 字段,即以题名作为主要款目标目,悬行著录时,第一指示符代码为 0,不需要再为题名增设附加款目;当所编图书有 1XX 字段时,通常情况下,第一指示符代码为 1;第 2 指示符:不排挡的字符(0 9) 。不排挡的字符包括冠词和空格,决定题名检索的入口词,所以必须准确选择。(2) 246 字段则表示与 245 字段$a 的题名形式有所不同、并在所编文献中出现、又具有在检索意义的题名,均可记录在 246 字段。例如Baums textbook of
10、pulmonary diseases 一书 245 字段著录为:245 00 $aBaums textbook of pulmonary diseases /$ceditors, James D.Crapo et al.246 30 $aTextbook of pulmonary diseases.1.6 丛编与丛编附加说明字段丛编题名著录在 440 字段和 490 字段(1)440 丛编说明/附加款目题名本字段记录文献的丛编说明信息,同时提供与丛编说明相同的丛编题名检索点。例如: 440 # 0 $aContemporary neurology series ;$v67.(2)490 丛编说
11、明当规定信息源提供的丛编说明与丛编规范题名形式不一致时,则启用 490 字段著录丛编说明。第 1 指示符说明丛编是否做丛编根查。当第一指示符为 1 时,说明记录在本字段的丛编说明需要做检索点,同时启用一个或多个 830 丛编附加款目字段。例如 Male hypogonadism一书: 490 1 # $aContemporary endocrinology.830 # 0 $aContemporary endocrinology (Totowa, N. J.) 2 源记录的著录和主要款目是否符合 AACR2由英、美、加三国图书馆协会于 1978 年联合出版的、具有可操作性的、国际上先进的英美编
12、目规则(第二版) (简称 AACR2) ,不仅完全采用 ISBD,对不同文献类型实行了统一著录,而且对主要款目的选择做出了重要修改。美国国会图书馆 1981 年正式启用 AACR2,1988 年再次修订并出版AACR2R。套录源数据时一定要了解该记录的编目背景, USMARC 记录的质量可以通过头标区的 17 字符位和 18 字符位的代码值来判明是否依据 AACR2 的规则编目,不符合的要特别注意此记录的著录标识、著录用语和书写规定,以及主要款目的选择。 2.1 分类标引规范文献分类是以分类号作为文献主题概念的标识,着重从学科体系的角度揭示文献内容,便于族性检索。在实际编目中,西文图书大都是使
13、用源数据进行编目的。在套录数据中,绝大部分都有 050,082 字段,它们分别为美国国会图书馆索书号和杜威十进分类号,对于这些字段原则上予以保留,并可根据需要设置检索点。源数据使用的是杜威十进分类法,而我国是以使用分类检索语言为主的国家,使用的是中国图书分类法,且典藏排架也依据中图法分类排架,所以修改源数据时应添加 093 字段中图分类号。例如: 050 00 $aRC901.7.H45$bC55 2005 (LC 分类号) 082 00 $a617.4/61059$222 (杜威十进分类号)093 # $aR459.5$24 (中国图书分类号) 2.2 主题词规范源数据的主题词是比较准确的。
14、我馆属于医学图书馆,选用的主题词是美国医学主题标目 NLM 规范文档,在套录数据时,650 # 0 表示采用的是美国国会图书馆主题词表( Library of Congress Subject Headings) ,简称 LCSH,此时应增加 650 #2 MESH 医学主题词。例如: 650 # 0 $aPediatrics.650 # 0 $aChildren$xHealth and hygiene.650 # 2 $aDiagnosis$xInfant.650 # 2 $aDiagnosis$xChild.2.3 责任者选取原则责任者是一个比较重要的检索点,提供从责任者的途径来检索特定的
15、文献。.责任者包括对作品负有某种责任的个人责任者、团体责任者和会议名称。(1)不论文献的形式和体裁,文献上明确反映的是个人著者,则以此人作主要款目标目。例如:Dermatological differential diagnosis and pearls / H. Eliot Y. Ghatan 著录为:100 1# $aGhatan, H. E. Yedidiah,$d1958-245 10 $aDeramtological differential diagnosis and pearls /$cH. Eliot Y. Ghatan250 # $a2nd ed.这是一部关于皮肤病鉴别诊断的
16、图书,依据主要信息源上反映的情况,应以著者 Ghatan, H. E. Yedidiah 作主要款目标目。(2)如果分担责任者超过三个,而从措辞或版式上不能判定一至三个主要责任者时,取题名作主要款目标目,并为第一著者作附加款目。例如:Colour handbook of renal medicine / by. James Pattison et al.(主要信息源上共有 5 个著者)著录为:245 10 $aColour handbook of rental medicine /$cby. James Pattison et al.246 #4 $aRenal medicine700 1#
17、$aPattison, James. 3 源记录与本馆的编目方针保持一致我馆作为医学图书馆,大部分图书是医学类图书。套录数据并不是全部保留,还应该根据每本原版或影印书的具体情况及本馆的实际要求相适应,编目时根据本馆的需要,为保证著录的前后一致,制定了具体规定,所以对一部分字段需要修改和增加。3.1 修改字段:以授权影印版西文图书为例,需要修改的字段具体表现在:(1)定长数据 008 字段的修改:本字段的修改主要在 06 字符位,即出版日期/状态类型的修改,记录状态由单个已知或可能日期变为重印日期,代码由 s 变为 r,07-10 字符段出版日期 1 为授权影印图书的国内出版发行日期,11-14
18、 字符段出版日期 2 则录入原版图书出版发行日期,第 15-17 字符段出版地应著录授权影印图书的国内出版物的代码,依据Calis 联机合作编目手册(下册) 中的国家代码表为“cc” 。例如Textbook of cardiovascular medicine一书的 008 字段为:008 # # 040924r20032002cc # a # # # f # b # # # # 001 # 0 # eng # d (2)020 字段录入授权影印图书的国内出版物的 ISBN。 原版图书的 ISBN 则著录在 534 原版附注项字段中的$z 子字段。例如Textbook of cardiovas
19、cular medicine020 字段为:020 # # $a7533134095 534 # # $z0781732255 (3)245 原版图书书名,246 影印图书书名,246 第二指示符代码值取 1。例如: 245 00 $aCasarett & Doulls toxicology :$bthe basic science of poisons = 卡萨瑞特与道尔毒理学 : 中毒的基础科学 /$ced. by Curtis D. Klaassen246 31 $a 卡萨瑞特与道尔毒理学$b 中毒的基础科学(4)260 字段记录文献的出版、印刷、发行以及制造等信息。因授权影印版图书只限
20、在中国境内出版、销售,所以 260 字段著录国内出版发行等信息,并在 534 字段原版附注项中加以说明。例如Operative gynecology一书 260 字段为:260 # # $a 北京 : $b 人民卫生出版社,$c2002 534 # # $preprint. Originally published : $cPhiladelphia : W. S. Saunders, 2001.$z0721679870(5) 534 关于原版图书的出版发行、版本信息、影印书的中文目次、中文前言等信息均可以在附注字段予以说明。3.2 添加字段(1)020 字段增加中文价格$c(2)035 字段登
21、录号或条码号具有唯一性,所以有必要增添,使其完整、规范。如果是多卷书,可以有多个 035 字段和 099 字段相对应。035 # # $aE011822$p900.80$x1035 # # $aE011823$p900.80$x2099 # # $aB$dR541-43$eBHD$vV1$y2005099 # # $aB$dR541-43$eBHD$vV2$y2005这是一种集中著录的方法,035 字段中的$a 为我馆的登录号,$p 为多卷书的分册价格,$x1 与 099 字段的$v1 相对应,表示为多卷书的第一卷。(3) 093 字段中图法是国内重要的一部分类词表,为了显示中图分类号与国外分
22、类号(如杜威分类号等)的平等地位,有必要添加此字段,建立完整的分类体系。我馆根据具体情况,例如核磁共振成像在中图法分类中应归入 R445.2 超声医学的下位类,而在临床医学中放射科医生使用较多,我馆将此类图书统一归入 R816 放射医学类。(4)增加 094 字段主要是为了说明西文图书的版本信息,如是原版还是影印版。(5)099 字段为 CALIS 联合目录系统控制号,它包括修改机构代码及完整的索书号信息。(6)增加 242 翻译题名字段。(7)我馆在回溯建库中发现有些图书丢失不齐,有的图书登录号前后不一致,增加 500 字段标明某一本图书对应的某一登录号。在实际编目工作中自己体会到,保证数据的质量是建立一个标准化的文献数据库、联网交换、资源共享的基础。编目员要熟练掌握各种有关编目的理论和技术,了解 AACR2、ISBN、LCSH、MARC 知识,具有丰富的工作经验和责任心,对问题要全面考虑,具体问题具体分析,减少工作失误,才能出色地完成编目工作。参考文献1 林明. 西文套录应注意的几个问题. 大学图书馆学报, 1999, (3):55-582 刘方山,王乃萍. 西文套录编目的质量问题探索. 现代情报, 2004, (3):187-1893 曹开江. 如何利用网上数据进行西文编目. 图书馆理论与实践, 2005, (2) 130-131