收藏 分享(赏)

信息检索的基本知识.ppt

上传人:无敌 文档编号:797922 上传时间:2018-04-24 格式:PPT 页数:217 大小:11.74MB
下载 相关 举报
信息检索的基本知识.ppt_第1页
第1页 / 共217页
信息检索的基本知识.ppt_第2页
第2页 / 共217页
信息检索的基本知识.ppt_第3页
第3页 / 共217页
信息检索的基本知识.ppt_第4页
第4页 / 共217页
信息检索的基本知识.ppt_第5页
第5页 / 共217页
点击查看更多>>
资源描述

1、1,信息检索与利用,2,课程介绍,3,引言:学位论文开题报告与课题申报,4,5,学位论文开题报告要求提供的论文创新点、国内外发展趋势、研究材料、研究条件、预期结果等都和信息检索密切相关!,6,7,课题申报表中最重要的设计论证部分必须通过充分的信息检索和文献阅读才能完成!,8,1、学习目的,(1)节省科研时间,提高工作效率,避免重复研究,促进科技创新对检索的文献进行统计分析,以跟踪学术动态,尝试发现学科/专业热点问题、技术空隙和发展趋势,寻找科研课题,撰写论文,9,学习目的,(2)为继续学习和终生学习打下良好的基础知识爆炸:世界上每年出版期刊70万种左右,出版图书约100多万种,发表的科技论文约

2、500多万篇世界平均每天发表1万余篇论文,平均35秒有一篇问世近20年文献的出版量已超过以往2000多年文献资料的总合20世纪60年代以后科学技术上的新发明、新发现,比过去2000年的总和还要多人类社会的知识量以每三年翻一番的速度递增传统的学习已不再适应现代社会,人的大脑无法也不必要容纳海量的知识,知识结构需要不断更新、充实,10,学习目的,(3)培养信息素质(Information Literacy):即培养对知识信息的获取、利用、加工和创造的意识和能力包括:-意识到准确和完整的信息是科学研究与明智决策的基础-信息需求及问题所在-制订信息检索策略-掌握信息检索(计算机检索)技术-能评价信息-

3、根据实际用途组织信息-将新信息融会到现有知识结构中,在批判性思考、解决问题和交流的过程中使用信息,11,2、课程内容,(1)基础理论知识:包括文献信息的基本知识,文献检索的基本原理,数据库、计算机检索基本知识(2)基本技能:基本的参考工具书和书刊数据库的使用方法,计算机检索和网络信息检索的方法,整理分析文献信息的方法,12,课程内容,课程介绍第一讲 信息检索的基本知识 1、2第二讲 互联网专业信息资源的检索3 第三讲 工具书与参考数据库、事实数据库检索4实习15第四讲 中外文全文数据库资源及其使用方法6、7实习28第五讲 信息的分析与利用方法(总结)9,13,3、考核要求,(1) 两次检索实习

4、作业(2) 期末考核:检索报告,14,期末检索报告要求,检索与自己的专业方向或自拟课题相关的中外文信息,写出详细的检索过程并提交检索报告:课题名称(中外文)课题分析:课题简介、检索目的课题检索:关键词提取过程、关键词/规范主题词、选择合适的数据库、各自的检索途径与检索式、检出与课题有关的文献、从引用文献再查出相关文献等检索结果:以参考文献标准著录格式列出检到的相关文献(按相关度排序),15,期末检索报告要求,原文查找与获取情况有关该课题的重要学术站点及其评价文献综述报告:查找结果统计分析;课题的学术史:同行的研究成果及目前进展;存在的研究空白点及今后可能的方向,16,4、主要参考书目,(1)信

5、息检索与分析利用/谢德体等主编,清华大学出版社,2007.2 (2)人文社会科学信息检索/马文峰主编,北京图书馆出版社,2004.8 (3)数字信息资源的检索与利用/肖珑等编著,北京大学出版社,2003.7(4)信息检索导论/叶继元主编,电子工业出版社,2003.5(5)网络信息资源搜集与利用/孙建军主编,东南大学出版社,2000.8,17,第一讲,信息检索的基本知识,18,主要内容,信息信息源信息检索-信息检索语言-信息检索工具-信息检索途径与方法-信息检索技术-信息检索策略*,19,一、信息,1、信息(Information)的定义:哲学家们从产生信息的客体来定义信息,认为事物的本质、特征

6、、运动规律通过一定的媒介或传递形式(声音、文字、图象等)使其它事物感知。这些能被其它事物感知的、表征该事物特征的信号内容即为该事物向其它事物传递的信息。所以,信息是事物本质、特征、运动规律的反映。不同的事物有不同的本质、特征、运动规律,人们就是通过事物发出的信息来认识该事物,或区别于其它事物简言之,信息是事物的运动状态和方式,20,2、信息的特点,(申农)信息是认识过程中不确定性的消除或减少,不是已知消息的重复,而是未知的内容,是新的、适用的、及时的消息,21,3、与信息相关的一些概念,知识(knowledge):可资利用的信息就是知识是人类通过信息对自然界、人类社会及思维方式与运动规律的认识

7、与概括,是人的大脑通过思维重新组合的系统化了的信息,是信息中最有价值的部分,22,与信息相关的一些概念,情报(intelligence) :是关于某种情况的信息和报告,多带机密性质,具有特定传递对象,23,与信息相关的一些概念,文献(literature/document) :我国文献著录总则(GB3792.1-83):文献是指“记录有知识的一切载体”,它是存储在一定物质载体上的关于知识信息的记录文献组成四个要素:第一,要有一定的知识内容第二,要有用以保存和传递知识的信息符号,如语言、文字、图像、符号、电子信号、视频、声频等第三,记录方式,如印刷、复印、篆刻、翻拍、录制等第四,要有记录知识的物

8、质载体,如纸张、感光材料、磁性材料等,24,二、信息源,信息源:个人为满足其信息需要而借以获得信息的来源,一切产生、生产、存贮、加工、传播信息的源泉都可以看作是信息源,25,1、国内文献信息的地区分布,纸质文献:北京地区最多,占全国总文献量的一半以上,上海、广州、武汉、成都、西安、沈阳等约占30%左右,其余不到六分之一数字资源:广东、北京两省市占比例较高(约40%),按地区分布的话,华东地区占比例最大,26,2、文献信息的系统分布,图书、期刊、会议录、报告等由国家信息系统提供:科技信息系统、图书馆系统(公共图书馆、高校图书馆、社科院图书馆),提供部分免费的的书目信息和全文文献服务专利、标准、档

9、案由国家的专门部门管理学位论文由国家图书馆、中国科技信息研究所和学位授予单位共同收藏,27,文献信息的系统分布,出版社(国内有565家)和报刊杂志社国内主要数据库运营机构万方数据公司、中国学术期刊网、维普资讯超星数字图书公司、书生公司中国专利信息中心、中国标准信息中心新华社综合信息数据库,28,美国国会图书馆:www.loc.gov,29,英国国家图书馆:portico.bl.uk,30,中国国家图书馆: 2004 年被“中文核心期刊要目总览”收录的期刊,按核心期刊表进行分类排序,41,外文核心期刊的查找:外文核心期刊一般指被SSCI及A&HCI收录的人文社会科学外文期刊(1)通过CASHL查

10、找:http:/ sources):所谓“零次文献”是指非正式出版物或非正式渠道交流的文献,未公开于社会,只为个人或某一团体使用,如文章草稿、私人笔记、会议记录、未经发表的名人手迹,甚至包括口头言论和现代的电子邮件、电子布告牌文章、讨论组文章等。内容新颖,但不成熟,获取比较困难一次文献(primary sources):凡是以著者本人的经验、研究或研制成果为依据而撰写的原始文献,经公开发表或交流后,称为一次文献。其特点是论述比较具体、详细和系统化,有观点、有事实、有结论。一般包括期刊论文、专著、科技报告、研究报告、会议论文、学位论文、专利说明书、技术标准、技术档案等。是人们检索和利用的主要对象

11、,但数量庞大、分散,利用不方便,47,按照加工深度不同区分的文献类型,二次文献/信息(secondary sources) :二次文献是信息部门将那些分散的、无组织的一次文献,用一定的方法经过加工整理、归纳、简化,把文献的外表特征和内容特征著录下来,使之成为有组织、有系统的检索工具,如书目、题录、文摘、索引等。主要作用是存储和报道一次文献线索、提供查找的途径。三次文献(tertiary sources) :它是在二次文献的基础上选用一次文献的内容进行分折、概括、综合研究和评价而编写出来的文献。它可分为综述研究类和参考工具类两种类型。前者如动态综述、学科总结、专题述评、进展报告等;后者如年鉴、手

12、册、大全、词典、百科全书等。三次文献源于一次文献又高于一次文献,属于一种再创性文献。三次文献主要是信息研究的产物和成果,其特点是一次文献的浓缩,是我们研究以往文献内容的重要信息源,48,按照加工深度不同区分的文献类型,以上四级文献的关系是,零次文献是一次文献的素材,一次文献是二次、三次文献的来源和基础,二次、三次文献是对一次文献进行组织、加工、综合后形成的,它们编写的目的明确,专指性强从一次文献到二次文献,再到三次文献,是一个由繁到简、由分散到集中、由无组织到系统化的过程。文献内容有很大的变化。二次文献和三次文献的产生并没有增加知识总量,但对于一次文献的形成和再生产有着很大的推动作用 “文献检

13、索”主要是对二次、三次文献的检索,49,按载体的物理形态和加工方式区分的文献类型,手写文献(script):古代各种非印刷型文献如甲骨、简策、帛书等以及还没有正式付印的手稿。印刷型(Printed form),主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上。如纸质图书、期刊等缩微型( Microform / Microfilm / microfiche),以感光材料为载体,以光学缩微技术为记录手段 。如缩微胶卷、缩微平片等声像型/视听型(Audio-Visual form/Compact audio/video form),以磁性、感光材料为载体,直接记录声音、图像的一种文献。如唱

14、片、录音带、录像带等机读型/电子型/数字型(Machine Readable form / Electronic Publication / Electronic form),利用计算机进行存储和阅读的一种文献形式。如文献的各种电子版本(Magnetic tape / CD-ROM / online / network),多媒体(multi-media)等。包括电子图书、电子期刊、动态电子信息(包括BBS、广告、网络新闻、e-mail个人通信等)等,50,图书,期刊,报纸,特种文献(灰色文献),专利,学位论文,科技报告,档案,产品资料,会议论文,政府出版物,连续出版物,非公开、非正式出版的文献

15、,按内容特点和出版方式区分的文献类型,标准,51,(1)图书(book,monography),按照联合国教科文组织的定义,图书是指50页以上的以印刷方式单本刊行的出版物。大多是对已发表的科研成果、生产技术知识和经验通过选择、比较、核对、组织而成的包括专著(含有首次发表的新成果、新思想的图书)、丛书、教科书、词典、手册、百科全书等特点:内容成熟、定型,论述系统全面、可靠;但出版周期较长,知识的新颖性不够,时间性较差,传递信息的速度较慢,52,图书的形式特征,53,国际标准书号ISBN(International Standard Book Number)介绍,ISBN系统创建于1970年,它是

16、国际出版业和图书贸易通用的标识编码系统。一个ISBN唯一标识一部在制作、销售和发行中的专题出版物组成:10位数字:组区号(国家、地区、语言的代号)+出版者号+书序号+检验码(2007年1月后补充了三位前缀号:978)组区号由国际ISBN中心分配,组区中的成员来自相同的语言区或相近地域0、1代表英语;2代表法语;3代表德语;4是日本出版物的代码;5是俄罗斯出版物的代码;6表示伊朗;7是中国出版物使用的代码(中国大陆的组区号是“7”;中国香港地区的组区号是“988”和“962”;中国台湾地区的组区号是“986”、“957 ”;中国澳门地区的组区号是“99937”);89表示韩国;982南太平洋地区

17、。,54,如:科技信息检索(孙平,任其荣编著,清华大学出版社1997年)ISBN号为:7-302-02372-7,“7”表示中国大陆“302”表示清华大学出版社,其书号为02372、“7”为该书的校验码,55,ISBN号可以作为一个检索途径,56,57,58,59,(2)期刊(Journal,magazine,serial,periodical),期刊又称杂志。一般指具有固定题名,定期或不定期的连续出版物。期刊上刊登的论文大多数是原始文献。特点:出版周期短,报道文献速度快,内容新颖,信息量大。据估计,人文社科研究中期刊信息约占整个信息源的30%-40%,60,(3)报纸,是一种专门刊载新闻和评

18、论为主的定期出版物。特点:出版周期短,时效性强,传递迅速、发行广泛、信息量大、政策性强。,61,(4)学位论文(thesis,dissertation),高等学校、研究机构的学生为取得学位而撰写的论文,是经过审查的、具有一定独创性的科学研究成果特点:能够解决具有相当科学意义的某个特定的科学问题或是对某一问题作出理论性的概括各国学位论文,除少数在期刊中刊载以外,多数是非卖品,一般不出版发行,62,63,(5)会议论文(conference paper),指由国内外重要学术会议上发表的论文和报告,也包括一些非学术性会议的报告特点:学术性较强、研究成果较新、尤其是国际性会议或全国性会议的论文可不同程

19、度地反映某一学科在相应范围内的学术水平、发展趋势和研究的进展情况,64,65,66,(6)报告(report,memorandum),是国家政府部门和科研单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。特点:单独成册,统一编号,由主管机构连续出版。比期刊论文新颖专深、详尽可靠,出版周期短,报道速度快,能反映一个国家或某一学科领域的科研水平美国四大科技报告:PB、AD、NASA、DOE及美国兰德公司的决策咨询、预测研究报告,67,美国政府四大报告,一、PB报告:是美国国家技术信息处(NTIS)出版的报告,报道美国政府资助的科研项目成果,内容涉及广泛,几乎包含自然科学与工程技术领域所

20、有学科领域。主要侧重民用工程,如,土木工程,城市规划,环境保护,生物医学等方面。二、AD报告:是美国国防技术信息中心(DTIC)出版的报告,主要报道美国国防部所属的军事机构与合同单位所完成的科研项目。内容涉及与国防有关的各个领域,如:空间技术、海洋技术、核技术等38类。三、NASA报告:美国国家航空宇航局出版的报告,内容侧重于航空和空间科学技术领域,广泛涉及空气动力学、飞行器、生物技术、化工、冶金、气象、天体物理、通信技术、激光、材料等。四、DOE报告:美国能源部出版的报告,报道能源部所属的研究中心、实验室以及合同用户的研究成果。内容包括能源保护、矿物燃料、化学化工、风能、核能、太阳能与低热、

21、环境与安全与地球科学等,68,(7)政府出版物(government documents),由政府机构,包括国际组织(如联合国、国际联盟、欧洲共同体、世贸组织等)和各国政府及其所属的专门机构所发表、出版的各种文献资料按其性质可分为行政性文献:会议记录、政府法令、方针政策、规章制度、决议和指示、调查报告和统计资料等科技性文献特点:内容范围广泛;具有权威性;一些非正式出版的文献不易收集用途:对了解各国的方针政策、经济状况及科技水平,有较高的参考价值。,69,(8)专利文献(patent),专利文献是指实行专利制度的国家出版的专利说明书,也包括专利局出版的各种检索专利文献的工具书专利文献融技术情报、

22、法律情报和经济情报于一体,利用专利文献可以分析研究其技术动向,产品动向和市场动向,因此,它具有很高的使用价值专利法明文规定申请专利必须具备新颖性,不得事先将内容发表为论文,因此使得专利信息是许多技术信息的唯一来源.。,70,中文专利文献检索可以检索”国家知识产权局” http:/ (Derwent Innovations Index )提供全球专利信息欧洲专利局网站 http:/ ISO3297-1986 区域标准国家标准 GB18187-2000行业标准企业标准,万方数据库可以检索并下载国内标准的全文,标准的分类,如:GB/T 5795-1986,强制性的标准,SC/T 1083-2007

23、(水产),74,标准号通常由国别(组织)代码顺序号年代组成例如: ANSI Stand n B 109.1 1973,36P ANSI 是美国国家标准协会; 109.1-标准号; 1973,36P-年份及总页数,75,(10)档案(archives)文献,档案是指各政府机关、企事业单位等在进行日常事务时产生并具有查考使用价值,经过立卷归档集中保管起来的各种文件材料包括收发电文,会议记录,电话记录,人事材料,技术文件,出版物原稿,财会账册、照片、录音带、录像带以及具有保留价值的各种文书档案是人类社会实践活动中自然形成的第一手参考材料,是社会历史的真实记录,具有重要的凭证作用,76,是厂商为推销产

24、品而印发的介绍产品情况的文献,包括产品样本、产品说明书、产品目录、厂商介绍等。 特点:-反映的技术比较成熟,数据也较为可靠,内容具体、通俗易懂,常附较多的外观照片和结构简图,形象、直观。但产品样本的时间性强,使用寿命较短,且多不提供详细数据和理论依据。用途:-作为技术人员设计、制造新产品的一种有价值的参考资料-了解各厂商出厂产品现状、掌握产品市场情况及发展动向。,(11)产品资料(Product Literature),77,附:不同文献类型的著录/识别格式,参见2005年3月由国家质量监督检验检疫总局和中国标准化管委会发布的GB/T 77142005文后参考文献著录规则,78,专著 (mon

25、ographs),以单行本形式或多卷册形式,在限定的期限内出版的非连续性出版物。它包括以各种载体形式出版的普通图书、古籍、学位论文、技术报告、会议文集、汇编、多卷书、丛书等,79,专著的著录/识别标识,序号主要责任者.题名:其他题名信息文献类型标志.其他责任者.版本项.出版地:出版者,出版年:引文页码引用日期.获取和访问路径.例:1余敏.出版集团研究M.北京:中国书籍出版社,2001:179-193.2全国文献工作标准化技术委员会第七分委员会.GB/T 5795-1986 中国标准书号S.北京:中国标准出版社,19863辛希孟.信息技术与信息服务国际研讨会论文集:A集C.北京:中国社会科学出版

26、社,1994.4孙玉文.汉语变调构词研究D.北京:北京大学出版社,2000,80,专著的著录/识别标识,5赵耀东.新时代的工业工程师M/OL.台北:天下文化出版社,19981998-09-26.http:/www.ie .nthu.edu.tw/info/ie. ne wie.htm(Big5).6 World Health Organization. Factors regulating the immune response:report of WHO Scientific GroupR.Geneva:WHO,1970.7丁世良,赵放中国地方志民俗资料汇编华北卷G.北京:北京图书馆出版社,

27、1989.8韩吉人.论职工教育的特点G/中国职工教育研究会,职工教育研究论文集.北京:人民教育出版社,1985: 90-99.,81,专著中的析出文献著录格式,析出文献contribution:从整本文献中析出的具有独立篇名的文献析出文献主要责任者.析出文献题名文献类型标志.析出文献其他责任者/专著主要责任者.专著题名:其他题名信息.版本项.出版地:出版者,出版年:析出文献的页码引用日期.获取和访问路径.示例 :l程根伟.1998年长江洪水的成因与减灾对策M/许厚泽,赵其国.长江流域洪涝灾害与科技对策.北京:科学出版社,1999; 32 -36.2钟文发.非线性规划在可燃毒物配置中的应用C/赵

28、玮.运筹学的理论与应用:中国运筹学会第五届大会论文集.西安:西安电子科技大学出版社,1996:468-471.,82,连续出版物著录格式,连续出版物serials:一种载有卷期号或年月顺序号、计划无限期地连续出版发行的出版物。它包括以各种载体形式出版的期刊、报纸等。其著录格式:主要责任者.题名:其他题名信息文献类型标志.年,卷(期)-年,卷(期).出版地:出版者,出版年引用日期.获取和访问路径.示例:1 中国地质学会.地质论评J.1936,1(1)-.北京:地质出版社,1936-.,83,连续出版物中的析出文献著录格式,析出文献主要责任者.析出文献题名文献类型标志.连续出版物题名:其他题名信息

29、,年,卷(期):页码引用日期.获取和访问路径.示例 :1李晓东,张庆红,叶瑾琳.气候学研究的若干理论问题J.北京大学学报:自然科学版,1999,35(1):101-106.2傅刚,赵承,李佳路.大风沙过后的思考N/OL.北京青年报,2000-04-12(14)2005-07-12.http:/ Bqb/20000412/GB/4216%5ED0412B1401.htm3莫少强.数字式中文全文文献格式的设计与研究J/OL.情报学报,1999,18(4):1-62001-07-08.http:/ :1姜锡洲.一种温热外敷药制备方案:中国,88105607,3P.1989-07-26.2西安电子科技

30、大学.光折变自适应光外差探测方法:中国,01128777.2P/OL.2002-03-062002-05-28.http:/211.152.9.47/sipoasp/zljs/hyjs-yx-new.a sp? recid=01128777.2&leixin=0.,85,电子文献著录格式,电子文献electronic documents:以数字方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机、网络或相关设备使用的记录有知识内容或艺术内容的文献信息资源,包括电子书刊、数据库、电子公告等。著录格式:主要责任者.题名:其他题名信息文献类型标志/文献载体标志.出版地:出版者,出版年(更新或

31、修改日期)引用日期.获取和访问路径.示 例 :1PACS-L:the public-access computer systems forumEB/OL.Houston,Tex;University of Houston Libraries,19891995-05-17.http:/info.lib.uh.e du/pacsl.html.,86,注意,按在论著中出现的先后用阿拉伯数字连续排序外国人名书写时一律姓前,名后,姓用全称,名可缩写为首字母(大写),不加缩写点作者为3人或少于3人应全部列出,3人以上只列出前3人,后加“等”或“etal”,87,参考文献类型及文献类型标识,88,电子文献载

32、体标志代码,89,文献标识码(WM),为便于文献的统计和期刊评价,确定文献的检索范围,提高检索结果的适用性,每一篇文章或资料应标识一个文献标识码。本规范共设置以下5种:A理论与应用研究学术论文(包括综述报告)B实用性技术成果报告(科技)、理论学习与社会实践总结(社科)C业务指导与技术管理性文章(包括领导讲话、特约评论等)D一般动态性信息(通讯、报道、会议活动、专访等)E文件、资料(包括历史资料、统计资料、机构、人物、书刊、知识介绍等) 不属于上述各类的文章以及文摘、零讯、补白、广告、启事等不加文献标识码中文文章的文献标识码以 “文献标识码:”或“文献标识码”作为标识,如:文献标识码: A英文文

33、章的文献标识码以“Document code:”作为标识,90,91,第一讲 信息检索的基本知识,信息信息源信息检索-信息检索语言-信息检索工具与检索系统-信息检索途径与方法-信息检索技术-信息检索策略*,92,三、信息检索,1、信息检索(Retrieval)就是运用科学的方法(信息检索语言、检索技术),借助于检索工具或检索系统,通过检索途径:如题名、著者、分类号、主题词、关键词、ISSN号、ISBN号等,从印刷型或数字型文献信息集合中查找所需文献信息的过程与方法,93,信息检索的类型,以检索内容区分:文献检索:线索检索与原文检索事实检索:通过百科全书、年鉴、手册、字词典等查询名词术语、概念、

34、定义、事件、事实、机构、人物、图谱等数据检索:统计年鉴、统计资料汇编、数值型数据库以检索方式区分:手工检索:利用印刷型工具书查找计算机检索:通过计算机及网络设备,利用光磁等媒介存贮、检索文献信息的过程,94,手工检索与计算机检索比较,95,信息处理人员,原始信息,信息分析、著录和标引,检索工具/检索系统,检索结果,用户,检索课题,课题分析,检索语言(主题词/分类号),存储过程,检索过程,存入,检索,信息检索原理示意图,96,2、信息检索语言,(1)信息检索语言:是信息检索系统存贮和检索所使用的共同语言,即在文献存储时,文献的内容特征(分类、主题、关键词)和外表特征(题名、著者、序号)按照一定的

35、语言来描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献存储(人工标引、索引)和检索过程中,共同使用、共同遵守的语言就是检索语言 作用:是沟通标引人员和检索人员的桥梁;它保证了文献存贮的集中化和系统化,使有规律的检索成为可能,97,常用信息检索语言,分类语言分类法主题语言主题法分类主题一体化检索语言自然语言关键词语言,98,(2)分类语言分类法,文献分类法是以科学分类为基础,结合文献内容性质及其他特征(如地区、时代、形式、体裁等),按照一定的逻辑体系,区分、组织和检索文献的一种方法。,99,世界三大图书分类法杜威十进分类法(DDC)(Dewey decimal Classificat

36、ion )国际十进分类法(UDC)(Universal Decimal Classification)国会图书馆图书分类法(LCC)(Library congress classification)中国图书分类法 中国图书馆分类法(中图法)中国科学院图书馆分类法(科图法)中国人民大学图书馆分类法(人大法),100,杜威十进分类法简表,000 Computers, information, & general reference電腦、資訊及總類100 Philosophy & psychology 哲學及心理學200 Religion 宗教學300 Social sciences 社會科學400

37、 Language 語言學500 Sciences 科學600 Technology 科技700 Arts & recreation 藝術及娛樂 800 Literature 文學900 History & geography 歷史及地理學,101,中图法,应用较多:全国报刊索引数据库中国学术期刊全文数据库“超星”数字图书馆方正电子图书等体系结构:大纲、基本类表、正表、辅助复分表(在分类表后附有六个供全表使用的辅助复分表:总论复分表、世界地区表、中国地区表、中国时代表、国际时代表和中国民族表),102,103,104,例:文学类的类目设置,105,106,对比:主题词检索,107,启示:对课题

38、/专业进行分类,以实现某些用关键词难以达到的检索需求,108,总论复分表,-0 理论与方法论-1 科学现状、概况-2 机关、团体、会议-3 研究方法-4 教育与普及-5 丛书、文集、连续性出版物-6 参考工具书-7 文献检索工具书,109,110,分类法组织与检索知识的优点:(1)分类法具有较强的系统性。分类法采用划分范畴的树状结构按事物或学科分类组织信息资源,层次清晰、体系稳定。(2)分类法便于浏览检索。分类法的等级结构便于用户在查找时进行浏览。当用户的检索目的不明确或检索词不确定时,分类浏览方式更有效率,它引导着用户按照初始的目标一步一步接近需求的信息,能保障查全率。(3)分类法提供对非文

39、本信息的组织。当前,网络信息资源中非文本信息占的比重越来越大,如:图形、图像、声音、动画等,分类法独有的聚类功能和代码标识在组织和揭示多媒体信息中占有极大的优势。(4)检索语言的通用性。分类法以知识分类为基础以符号为标识,具备成为不同语言转换中介的条件。(5)能检出检索词的上下文内容,消除同形异义词,111,112,缺点,不适用于特性检索,查准率比主题词低不能适应学科发展中的变化,难以反映新学科和新名词术语:如食品风险分析人们认识的不统一,往往造成分类不一致及排检的错误,不易反映边缘学科、交叉学科:如管理心理学注意:-应从几个类目入手查找并加以比较,才不致漏检和误检,如“人类学”-Q98人类学

40、 C912.4文化人类学、社会人类学 -还应注意类目间的交替和参照,113,(3)主题语言主题法,主题语言:一般指以表达文献主题内容的词语作标引对象,按主题词的字顺序列组织文献,并用参照系统显示概念之间相互关系的文献信息组织与揭示的方法主题词表对主题词的规范:对文献检索用语的概念加以人工控制和规范,对同义词、多义词、近义词等进行规范化处理,用一个词来表达一个概念,避免多词一义、一词多义、词意含糊如煤炭-煤;天然资源-自然资源;计算机-电脑;发动机-马达;贫铜矿-低品位铜矿;土豆-洋芋-马铃薯;玉米-corn(英语)-maize(美语)-Zea mays(拉丁文学名);激光-纳米-奈米-莱塞(台

41、湾翻译);世界贸易组织-世贸组织-WTO;X射线-爱克斯射线;弗里昂-弗利昂;Cell(细胞-电池);杜鹃(动物-植物),114,汉语主题词表,汉语主题词表是我国第一部大型综合性主题词表。1979年出版,自然科学部分1991年修订。其收录正式主题词91158条,非正式主题词17410条。全表共分3卷10分册,由主表、词族索引、范畴索引(可以用于从学科的角度确定主题词) 、英汉对照索引等组成。是我国应用最广的一部主题标引和检索的工具,115,汉语主题词表主表的示例:,Dian shi xian xiang guan电视显像管Y 显像管Xian Xiang Guan显像管 56CE Kinesco

42、pe Picture tube 电视显像管 彩色显像管 黑白显像管 电子束管 电子管 显示管,主题词汉语拼音主题词 范畴号 英文译名 代项(其后为被代替的同义词) 分项(下位词)属项(上位词) 族首词 参项符号(相关词) 用项(其后为正式主题词),116, 用项 Y 正式主题词 等同关系 代项 D 非正式主题词 分项 F 下位类主题词 分属关系 属项 S 上位类主题词 族项 Z 族首词 相关关系 参项 C 相关词,117,主题语言的特点和优势,特点:按文献主题集中文献;以规范化的词语作为文献主题概念的标识;用参照系统显示主题概念之间的关系;按主题词的字顺序列排列优势:直接性、专指性、集中性、(增删)灵活性,满足特性检索需求,查准率高非专业人士难以掌握,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报