收藏 分享(赏)

基于dc的医学资源元数据方案.doc

上传人:cjc2202537 文档编号:211814 上传时间:2018-03-24 格式:DOC 页数:11 大小:44.50KB
下载 相关 举报
基于dc的医学资源元数据方案.doc_第1页
第1页 / 共11页
基于dc的医学资源元数据方案.doc_第2页
第2页 / 共11页
基于dc的医学资源元数据方案.doc_第3页
第3页 / 共11页
基于dc的医学资源元数据方案.doc_第4页
第4页 / 共11页
基于dc的医学资源元数据方案.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、基于 DC 的医学资源元数据方案现代图书情报技术2006 年第 3 期工作交流总第 134 期基于 DC 的医学资源元数据方案宋涯含延清(中国科学院文献情报中心北京 100080)(中国科学院研究生院北京 100049)(北京大学第三医院北京 100083)【摘要】介绍五种医学资源元数据方案:OhioLINK 医学元数据,NLMMetadataSchema,Medical(:oreMetadata(MCM),CISMeF 元数据,EBMmetadata,分析比较他们的共性与区别,为制定我国的医学元数据方案提供思路.【关键词】元数据医学资源 DC【分类号】G250.73MedicalResour

2、cesMetadataBasedonDublinCoreSongYahanYanQing(LibraryofChineseAcademyofSciences,Bering100080,China)(GraduateUniversityofChineseAcademyofSciences,Beijing100049,China)(PekingUniversityHospital,Beqing100083,China)【Abstract】Introducesfivekindsofmedicalresourcesmetadata:OhioLINKmedicalmetadata,NLMMetadata

3、Schema,MedicalCoreMetadata(MCM),CISMeFmetadata,EBMmetadata.thenanalyzesandcomparestheircommonnessanddifference.【Keywords】 MetadataMedicalresourcesDublinCore1 前言元数据(Metadata) 作为“ 关于数据的数据 “,是数字信息组织和处理的基本工具,为各种形态的数字化信息单元和资源集合提供规范,普遍的描述基准和方法,在数字化网络化信息服务中发挥着日益重要的作用.除了通用元数据 DublinCore 外,针对不同应用领域的元数据大量涌现.这

4、些元数据有的是唯一的标准化方案,如描述政府信息资源的元数据 GILs,描述地理空间信息的元数据 FGDC/CSDGM,描述档案库与资源集合的元数据 EDA,而有的元数据是多种方案并存,如描述博物馆藏品的元数据 VRACore,CDWA,描述教育资源的元数据 IEEELOM,GEM,描述医学资源的元数据 NLMMetadataSchema,MedicalCoreMetadata,CISMeF 等.本文将介绍五种医学信息资源元数据方案,并分析讨论他们的共 I 生与区别.2 五种国外医学元数据方案分析2.1OhioLINK 医学元数据OhiouNK 的 LifeScience/Medicine 数据

5、库直接采用收稿 13 期:20051201?82?DC 元数据元素集,同时以美国国立医学图书馆的医学主题词表(MeSH)和护理学及相关医学主题词表(CINAHL)作为补充 .OhioLINK 复用了 DC 的 15 个元素,扩展 2 个元素,如表 1.表 1OhioLINK 元数据元素集内容描述元素知识产权描述元素外部特征描述元素TifleMCre0rDateMSubjectMPublisherMTypeMDescriptionMCOiltributorFormatMSourceRightsIdendfierLanguageMFileSizeMRelafionMCaptureDataMCove

6、rage(注:表中“M“表示该兀累为必备兀素,所有兀素都可重复.“是扩展的 2 个元素.)2.2NLMMetadataSchemaNLMMetadataSchema 是美国国立医学图书馆(NLM)在 DC 的基础上制定的元数据,用于描述图书馆出版的电子资源.它直接复用了 DC 的 8 个元素,同时又将 DC 的部分限制属性定义成新的元索,扩展 DC 的限制现代图书情报技术2006 年第 3 期工作交流总第 134 期属性并定义为元素(NLMDC),根据医学资源特点定义了7 个新元素(NLM), 如表 2【 .在这 7 个新元素中,只有PermanenceLevel(长期保存程度 )和 Perm

7、anenceGuarantor(长期保存保证人 )是必备的 .NLM 根据网络资源的标识有效性,资源可获得性和内容稳定性定义了 unchangingContent,StableContent,DynamicContent,NotGuaranteed 四种保存程度,30 种资源类型分别对应一种长期保存程度,如 ClinicalAlerts 是 UnchangingContent,Database 是 DynamicContent.表 2NLMMetadataSchemaDCDCTitleTableofContentsPublisherEditionI,anguageAbstractpeAudie

8、nceRishtsGeographicCoverageContributorTemporalCoverageRelationRelation,VersionofFormatRelation,IsFormatofAlternativeTitleRelation,IsReplacedBySubject,KeywordRelation,ReplacesSubject,MeSHRelation,IsRequiredByDateIssuedRelation,RequiresDateCreatedRelation,IsPartOfDateoflastupdateRelation,HasPartIdenti

9、fier,URIRelation,IsReferencedByIdentifier,URLRelation.RefefencesNotesContactInformation,EmailNLMDCNLMSubject,ClassNumberPrrnanenceLevelSubject,NamePermanenceGuarantorSubject,TideMandateDateoriginalformcreatedContactInformation,SectionAffliliationMajorrevisiondateContactInformation,PersonalNameExpira

10、tiondateChangeHistoryIdentifier,NLMBibUIIdentifier,ISSNIdentifier,ISfiNContrlbutor,Role2.3MedicalCoreMetadata(MCM)医学核心元数据 MCM 是美国 OregonHealthSciencesUniversity 于 1998 年制定的元数据方案,它主要描述基于网络的生物医学文献,帮助临床医生和需要卫生保健的人更好的获取网络资源6J.MCM 直接复用 DC 的 15个元素(如表 3l5J),只是对限制属性做部分扩展,此外MCM 还制定了 MCMMeSHTermScheme 和 MCMRe

11、sourceTypeScheme,便于主题词和资源类型选择.除了MEDLINE 数据库中的 13 种资源类型,MCM 根据网络医学资源的特点又详细分出 22 种,如 Homepage,Radio.graphs,Forums,PatientEducation 等.MCM 使用受控的主题描述语言 MeSH 表,并可通过 HTML 标识语言表达出副主题词及主要主题词.表 3MCM 元素集CoreElementsEnhancementsTifleAU 出 0rKeywordsMeSH,hyphensubheadingsDescription(abstracts)PublisherContributor

12、sDateResourceTypeFromMedlinRecordplusInternetAdditionsFormat(filetype)CompliantwithIMT.MayaddMedlineAccession#).ISSN:0008ResourceIdentifier(URL)4263forDeerreviedmaterialsSource(relateddoes)Journal,Project,otherHoldings,ere.LanguageRelation(hierarchy)Coverage(subject)SubjectMajorRightsManagementCopyr

13、ightStatement.ete.2.4CISMeF 元数据CISMeF 是由法国 RouenUniversityHospital(RUH)1995 年发起的基于质量控制的主题网关项目,其目的是通过描述法语医学资源来帮助医生和患者查找网络资源.CISMeF 采用两种标准组织资源:美国国立医学图书馆制定的医学主题词表(MeSH 表)和四个元数据元素集.CISMeF 复用四种元数据元素集.(1)DublinCore,用于描述有关健康的资源 ;(2)IEEE1484LOM(学习对象元数据 ),用于描述教学资源;(3)描述循证医学资源的元数据,用于指出证据级别,对资源内容进行控制;(4)HIDDEL

14、(卫生资源发现,描述和评价语言元数据),用于增强医学网络资源的透明度,可信度和质量.CISMeF 复用了 DC15 个元素中的 11 个,即 AuthororCreator,Date,Description,Format,Identifier,Language,Publisher,ResourceType,Rights,SubjectandKeywords 和 Title.同时扩展了 8 个元素来满足描述特殊资源需求, 即Institution,City,ProvinceorState,CountryTargetorAudience,TypeofAccess,Cost 和 Sponsorshi

15、p.2.5EBMMetadata?83-现代图书情报技术2006 年第 3 期工作交流总第 134 期这是日本学者 YukikoSakai 在研究已有的描述医学资源的元数据基础上,根据循证医学资源的特点,提出的描述循证医学资源的元数据方案,这个元数据方案是基于 DublinCoreMetadataElementSet(DC)和 Administra-tiveContainerCore(ACore)制定的,如表 4.表 4EBMmetadata 元素集ElementEncodingSchemeElementRefinementDC.TifieDC.CreatorMeSHDC.sl】biectEB

16、MCEBMSAbstractObjectiveDesignSettingParticipantsDC.DescriptionAnMyzedhelm0uomeMeL1re8ResultsConclusionCommentaryDC.publisherDC.ContriburetDC.DateDC.TypeDC.FormatDC.IdentifierDC.SourceDC.LanguageDC.RelationDC.CoverageDC.RishtsAC.NallleAC.ActivityAC.EmailAC.ContactAC.DateAC.DateRangeAC.Risht8AC.Locati

17、onDC.Subject 元素采用了三种编码规则:MeSH,EBMC(EvidenceBasedMedicineClinicalPerspectives),EBMS(EvidenceBasedMedicineStudyType).DC.Description元素具有两个限制属性 Abstract 和 Commentary.Abstract用于描述结构化文摘,Commentary 用于描述二次文献中的评论信息.Abstract 又有 8 个限制属性:Objective,De.sign,Setting,Participants,Analyzedfactors,OutcomeMeas.urcs,Re

18、sults,Conclusion.复用 ACore 的一些元素主要是用于描述原始文献元数据的创建者的信息.?84-这个元数据方案的特点是:能够描述原始文献的结构化文摘;用 MeSH 表和 EBMC,EBMS 编码规则描述循证医学资源的重要特征,如证据级别,临床研究焦点(治疗,诊断,预后和病因);可以描述网络循证医学资源;可区别各种类型,如研究类型,资源类型,格式等.3 分析与讨论比较这五种医学元数据方案,其共性是:DC 适应性强,弹性大.以上五种医学元数据方案都复用了 DC 的大部分元素,同时根据医学信息资源特点,都以美国国立医学图书馆的 MeSH 表作为描述主题元素的内容编码规则,MeSH

19、表能够系统表达规范的生物医学概念.这五种医学元数据方案都复用了 Dc 中的 Title,Publisher,Type,Language,Rights,Format 六个元素,而且是完全复用,对元素语义,数据类型和取值规定等都没改变,所以这六个元素可以看成是描述数字化信息资源的最基本元素.不同点在于,这五种医学元数据方案根据各自描述的内容对象特征,采用了不同的复用形式.OhioLINK 医学元数据和 NLMMetadataSchema 采用融合性复用 ,即复用某个元数据格式中的多个甚至全部元素,然后建立新的元素,共同构成新的元数据格式;MCM 采用扩展性复用,即一个元数据格式为核心,复用其它元数

20、据格式中的少量元素,核心元数据格式中所有元素的语义,数据类型和取值规定等都不改变,最多是扩展限制属性;CISMeF元数据和 EBMMetadata 则采用混合性复用,即从多个元数据格式中选择合适的元素进行复用来描述复杂对象的各种属性和参数,涉及多个元数据格式交叉复用.通过元数据复用可以描述复杂对象,扩展元数据格式适用范围,兼容不同元数据,促进元数据的相互转换.元数据复用作为一种快速建立元数据格式和辅助元数据转换的方法,需要严格的语义定义和复用规则来保障复用中的描述清晰性,逻辑整体性,语义一致性和操作规范性,其关键在于建立应用规范.应用规范对被复用的元素在编码规则,取值范围,出现频次,相互关系等

21、方面作详细描述,也可以描述自定义的元素和扩展的限制属性.元数据复用有助于实现元数据的互操作,实现分布式信息环境下的集成信息服务,解决了元数据多元化发展所带来的各种弊端.生物医学是科学的重要分支,其文献量在整个科学文献中所占比例超过 20%,居自然科学各科之首,但是对它的利用却不容乐观,尤其是医学网络资源.其原因在于对医学网络资源的组织,检索与利用研究存在着许多问题,其中最重要的就是网上医学信息资源的内容揭示.现代图书情报技术2006 年第 3 期工作交流总第 134 期(上接第 71 页)7 岳丽华.韩恺.龚育昌.异构数据源集成系统 KDIRIS,计算机科学,2001,28:2522558 吴

22、啸鹏等.WrapperBase:基于 CORBA 网络的 Web 信息集成系统,计算机科学,2001.28:2642689WongKK.BazexP.MRDSM:Arelationalmultidatabasemanagementsystem.In:Proc.ThirdInt.SeminarDistributedDataSharingSystem,Mar.198410MetroA.Superviews:VirtualIntegrationofMultipleDatabases.IEEETrans.OnSoftwareEngineering,1987,SE 一 13(7):78579811LiC

23、,eta1.CapabilityBasedMediationinTSIMM1S.In:Pmc.OftheACMSlGM0DConf.1998.56456612BayardoRJ,eta1.Infosleuth:AgentBasedSemanticIntegrationofInformationinOpenandDynamicEnvimments.In:Proc.OfACMSIGMODInt1.Conf.1997,1952061517AhmedR,eta1.ThePegasusheterogeneousmultidatabasesystem.IEEEcomputer.1991,24(12):2229KimW.eta1.Classifyingschematicanddataheterogeneityinmultidatabasesystems.IEEEComputer.Dec.1991.1218彭智勇等.基于对象代理模型的异构多数据库集成,计算机科学,2002,29:256258乔鸿,余锦凤.数字图书馆异构信息封装问题研究.全国博士生学术信管分论坛的论文集,2004:1014王欣:数字图书馆服务动态集成关键技术,全国博士生学术信管分论坛的论文集,2004:8188

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 教育学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报