1、第一讲 文献检索基础知识和理论,第一节 信息与信息检索 第二节 科技文献类型与识别第三节 文献检索工具第四节 文献信息检索原理第五节 文献检索的方法和途径第六节 信息检索效果的评价,第一节 信息与信息检索,一、信息的基本含义,1. 信息是世界上一切事物的状态和特征的反映 2. 信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性。,一个完整的信息传递过程必须具备信源(信息的发出体)、信宿(信息的接受体)、信道(信息的传递媒介)和信息四个基本要素。,从生产力的角度可以将人类社会划分为四个发展阶段: 原始社会、农业社会、工业社会和信息社会。 信息社会的主要标志是信息与知识成为社会最重要
2、的基础性资源。,(一)信息与社会,1.知识 知识是人们对客观事物的认识和经验总和。 知识与信息的关系:知识是信息的一部分,不直接等同于信息;知识是人类大脑活动的产物,是系统化、精炼化的信息。 2.情报 情报是传递中的有用的知识或信息,是为解决特定问题所需要的知识。,(二)与信息有关的基本概念,3.文献 文献是记录知识的一切载体。三个基本要素,1)文献含有知识信息 ;,2)负载知识信息的物质载体 ;,3)记录知识信息的符号和技术 ;,二、信息检索的定义及类型(一)信息检索的定义广义的信息检索: 是指将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储
3、与检索” 。 狭义的信息检索: 指该过程的后半部分,即从信息集合中找出所需要的信息的过程, 相当于人们通常所说的信息查寻。,(二)信息检索的类型1、按检索的目的和对象不同分为:书目信息检索、全文信息检索、数据信息检索、 事实信息检索2、按信息检索的手段和设备分为:手检、机检,什么叫文献信息检索?,三、文献信息检索的定义,文献信息检索:在文献信息资源中查找、获取所需的、有价值的信息的过程。它被人们喻为开启知识宝库的钥匙。,第二节 科技文献类型与识别,一、文献的主要类型,(一) 按载体类型分: 印刷型、缩微型、电子型、视听型(二) 按出版类型分: 图书、连续出版物、特种文献(三)按加工深度分:零次
4、、一次、二次、三次,(一) 根据文献的载体形式划分,印刷型,缩微型,电子型,视听型,图 书,连续出版物,资 料,缩微平片,缩微胶卷,缩微胶片,磁带、磁盘,光 盘,联机网络版,录音带、录像带,唱片、幻灯片,电影胶卷,按出版形式及内容的不同,图 书,连续出版物,特种文献,科技报告 会议文献 政府出版物 专利文献 标准文献 公司产品资料 学位论文 档案资料,期刊 报纸 年度出版物,(二) 根据文献的编辑出版形式划分,图书的含义,凡篇幅达48页以上并构一个书目单元的文献称为图书。,国际标准书号(ISBN),国际标准书号(ISBN) (International Standard Book Number
5、)每一种正式出版的图书的唯一标识代码,是专门为识别图书等文献而设计的国际编号。 例如:信息检索原理与方法教程,赵岩碧主编,化学工业出版社,2005年3月出版。其ISBN号为:7-5025-6431-4ISBN 7-5025-6431-4 (旧号)ISBN 978-7-5025-6431-5 (2007年后出版图书采用的新号)第一段:978是由国际物品编码(EANUCC)系统专门提供给国际ISBN管理系统的产品标识编码。 第二段:7 语区号,代表国家、地区、语种如0和1英,2法,3德,4日,5-俄,7中,88-意大利,9971-新加坡 第三段:5025 出版社代号,由国家或地区ISBN中心分配;
6、 第四段:6431 出版图书号,由出版社按出版顺序所给; 第五段:校验位,期 刊,期刊又称杂志,它是指采用统一名称定期或不定期出版的连续性出版物。,国际标准刊号( ISSN ),国际标准连续出版物号(ISSN)正式出版的期刊有ISSN代码,即国际标准连续性出版物编号,是国际连续出版物数据系统国际中心为在该系统登记的连续出版物分配的号码。 采用ISSN编码系统的出版物有期刊、会议录等。 如:中国图书馆学报 国际标准刊号:ISSN10018867 全长8位,前7位为刊名代号,末位为校验位,期刊的特点,A、期刊以品种为单位形成知识流; B、报道文献速度快,内容新颖,能及时反映世界科技水平,但不如图书
7、成熟; C、品种多,数量大,覆盖了人类所以知识领域及各学科专业,具有很强的容纳性。 D、科技期刊 是最重要的一次文献。,核 心 期 刊,* 少数刊载某一学科大量高质量专业论文的期刊。* 特点 (1)刊载专业文献密度高,信息含量高;(2)水平较高,代表本学科的最新发展水平; (3)出版相对稳定,所载文献寿命较长;(4)利用率和被引率较高。目前,许多单位核心期刊的判定是以中文核心期刊要目总览为标准,是以报道新闻及评论为主,出版周期比期刊更短,多为活页性连续出版物。其特点是内容丰富、信息量大、出版迅速、发行量大、读者众多。,报 纸,科 技 报 告,科技报告是科技工作者对科学、技术研究结果或研究进展的
8、记录。,科技报告的特点 (1)反映新的科研成果迅速; (2)内容多样化; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。,会 议 文 献,会议文献是指在各 种会议上宣读、交流的 论文、报告及其它有关 文献。,政 府 出 版 物,政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。,政府出版物的类型 (1)行政性文件 (2)科技文献,专 利 文 献,专利文献是指实行专利制度的国家申请、审批专利过程中所产生的专利申请书、说明书及官方文件或出版物。其中最重要的是专利说明书。,标 准 文 献,与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成
9、过程的各种档案、宣传推广标准的手册及其它出版物。,标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。,公 司 产 品 资 料,指厂商为推销产品而印制的各种宣传资料、技术资料。如公司介绍、产品目录、样本、说明书等,它反映厂家、公司及产品的有关信息,对产品采购,仪器设备的维护、使用及新产品开发具有重要价值。,档 案,档案是指国家、 机构和个人从事社会活动留下的具有历史价值的文献。,按文献 的加工 深度分,一次文献,二次文献,三次文献,零次文献,(三)不同加工层次的文献信息,* 指未经公开发表或未交流于社会的文献;* 论文草稿、谈话记录、实验记录
10、、书信,零 次 文 献,一 次 文 献,* 作者以自己的研究成果为基础创作或撰写,并通过某种渠道而公开的文献; * 对知识的第一次加工;具有创造性; * 大多数期刊论文、科技报告、学位论文、会议文献、专利文献、技术档案等。,* 对一次文献进行浓缩、整序及加工处理而成的具有报道和检索作用的文献;* 对知识的第二次加工;有序化;提供一次文献线索;* 目录、题录、文摘等检索工具。,二 次 文 献,* 指从一次文献中提取数据、事实和有关结论,并经过综合分析与重新组合而编写的文献。 * 对知识的再加工;提供文献检索; * 综述、专著;字词典、百科全书,三 次 文 献,一次文献是检索的对象(目标)二次文献
11、是检索的工具(手段)三次文献是情报研究的成果(检索目标+检索手段),从检索的角度来看,一次、二次、三次文献三者之间的关系,从知识加工角度来看,一次、二次、三次文献三者之间的关系,从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走想有序、由一种有序结构演变为另一种完善的有序结构的过程。,二、科技文献出版类型的辩识为了获取原始文献,应学会辨识科技论文后所附参考文献的不同出版类型。一般著录项目都包括篇名、著者姓名、文献出处,可以从文献出处识别各种文献的出版类型。(1)图 书: 有出版社名称和出版年份。(2)期 刊: 包括刊名、卷、期
12、、页码、月年。 (3)会议文献: 包括会议名称、时间、地址、会议录出版单位及其地址、出版年份、会议录提供单位及其地址、页码。(4)专利文献: 有专利国家名称或国家代号、专利号,有的还有出版时间。(5)科技报告: 最明显是出处中有报告号,有的有出版时间。(6)学位论文: 一般著录学位和学位论文的名称, 颁发的单位及地址、时间。(7)标准文献: 一般有标准编号。,第三节 文献检索工具,一、文献检索工具定义 定义:指人们用来报道、存储和查找信息线索的工具。基本职能:一方面是揭示信息及其线索,另一方面提供一定的检索手段,使人们可以按照它的规则,从中检索出所需信息的线索。,二、文献检索工具的类型检索工具
13、可以依据不同的标准来划分,根据著录内容可划分为以下四种: 1.目录 ( catalog )目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。目录类型: 馆藏目录:反映一个图书馆文献收藏情况的目录。中国国家图书馆 http:/ 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。CALIS联机公共数据库 http:/ 按物质形式划分:卡片目录、书本目录、机读目录
14、(MARC)。 联机公共查询目录(OPAC ,Online Public Access Catalog )等。,OPAC :是指以计算机编码形式存贮在计算机 系统内,供读者通过终端设备进行联机检索的 图书馆目录,即书目数据库的一种形式。,示例:,2. 题录 ( bibliography 、bibliographic、citation )题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。题录在揭示文献内容的深度方面
15、,比目录深入,但又比文摘简单。 示例:,示例:,3. 文摘 ( abstract ) 文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。,4. 索引 ( index )索引是将报刊书籍中某些重要的或有意义的信息,如书名、刊名篇名、主题、人名、地名等到分别择录出来,按一定方式编排,并注明出处,以供检索的工具。索引不仅为读者提供多种文献检索途径,并能通过检索词的使用,反映某一文献的主题内容以及关于某一学科或课题的最新观点和发展趋势。 最常用的索引是主题索引、分类索引和著者索引等。,索引示例:Ei CPX Web
16、(工程索引网络版索引显示格式),国内主要的检索工具,1、中文全文数据库 2、中国科技引文数据库 3、国内大学图书馆书目检索系统 4、国家科技图书文献中心 5、万方资源数据系统 6、各类印刷版文摘杂志,国外主要的检索工具,1、Web of Science(科学引文索引) 2、Proceedings-ISTP(科技会议论文索引) 3、Engineering Index (工程索引) 4、INSPEC (科学文摘) 5、 SSCI(社会科学引文索引) 6、CA-CD(化学文摘含14次累积索引) 7、OCLC firstsearch 8、 PQDD博硕士论文文摘数据库 9、 Encyclopaedia
17、、 Yearbooks (百科全书、年鉴、手册),第四节 文献信息检索原理,将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。,文献检索的原理,简而 言之,检索标识,存贮标识,匹配,检索命中,将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。,检索过程分析,检索者,检索系统,信息源(大量信息) 充分标注(检索语言) 可检索(检索技术、规则等) 可显示(屏幕显示或打印) 信息之间的连接等,表达需求,反馈结果,第五节 文献检索的方法和途径,(一)信息检索语言,检索语言主要有:
18、,1、 题名语言:按文献题名字顺逐字排检。2、 著者语言:按著者姓名的字顺排检。3 、号码语言:按文献代码,如专利号、 标准号、报告号等的顺序排检。,4、 分类语言:以学科体系为基础,将各种概念按学科性质进行分类和系统排列,并用分类号予以编排组织成一个完整的体系。,中图法体系结构:,基本部类(5个) 基本大类(22个)1马列、毛泽东思想: A 马列、毛泽东思想 2. 哲学 : B 哲学 3. 社会科学 : C 社会科学总论; D 政治、法律; E 军事; F 经济; G 文化、科学、教育、体育 ; H 语言、文字; I 文学; J 艺术; K 历史、地理 4. 自然科学 : N 自然科学总论;
19、 O 数理科学和化学; P 天文学、地球科学; Q生物科学;R 医学、卫生; S 农业科学; T 工业技术; U 交通运输; V 航空、航天;X 环境科学、劳 动保护科学(安全科学) 5. 综合性图书 : Z 综合性图书,中图法22大类是基础,每一大类下根据学科的具体内容层层细分为二级、三级、四级类目,这逐级划分下去就形成了等级分明的科学系统。如:O 一级类目数、理、化 O1 O3 O4 O6 O7 二级类目数学 力学 物理 化学 晶体 O11 O12 O13 三级类目古典数学 初等数学 高等数学 O121 O122 O123 O124 四级类目算术 初等代数 初等几何 三角,中图法全称为“中
20、国图书馆分类法”所有图书按中图法编制成相应的索书号进行排架,5 、主题语言:用语词来表达各种概念,即用规范化或未规范化语言中的名词、名词性词组或短语作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。现在常用有关键词与叙词。,什么是关键词直接选用文献中的自然语言作为基本的词汇,出现在文献标题(篇名、章节名)、摘要和正文中,能揭示和描述文献主题内容具有实质意义的的那些词语,且不加规范化处理。,什么是叙词(又称主题词)以自然语言为基础,经过标准化处理的词语。能够直接表达文献所论及或涉及的事物主题,是从自然语言的主要词汇中挑选出来并加以规范化了的词或词组。,国内外常用的叙词表主国有
21、:1、英国科学文摘使用的INSPEC叙词表 2、美国工程索引使用的COMPENDEX叙词表 3 、我国的汉语主题词表,(二)文献信息检索方法,工具法 追溯法 循环法,工具法(又称常用法),1.顺查法:由远及近,从后向前。,如:已知某研究课题的最初产生年代(1990),了解 发展过程,从最初的年代(1990)开始,逐步往近期查,2.倒查法:由近及远,从前向后。一般查1-5年,重点:在近期文献,只要查到基本满足需要为止。,3.抽查法:是抓住某学科发展迅速,研究成果发表较多的时期,进行重点检索。,前提:熟悉学科发展特点。,指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。
22、,追溯法(引文法),追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。,优点:,在没有检索工具或检索工具不全的情况下能借助一些引文索引,述评或专著的参考文献查找。,缺点:,查得的文献不全面,比较陈旧。,循环法(又称为综合法),它是把上述两种方法加以综合运用的方法,既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。,(三)文献信息检索途径,分类途径 主题途
23、径 著者途径 其他途径,1. 分类途径,分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去。,2. 主题途径,主题途径是指通过文献资料的内容主题进行检索的途径,它依据的是各种主题索引或关键词索引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索。主题途径检索文献关键在于分析项目、提炼主题概念,运用词语来表达主题概念。主题途径是一种主要的检索途径。,3. 著者途径,著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引
24、。,4. 其他途径,其他途径包括利用检索工具的各种专用索引来检索的途径。专用索引的种类很多,常见的有各种号码索引(如专利号、入藏号、报告号等),专用符号代码索引(如元素符号、分子式、结构式等),专用名词术语索引(如地名、机构名、商品名、生物属名等)。,(四)文献信息检索步骤,文献信息检索是根据课题的要求,利用检索工具,按照一定的步骤和方法查找文献信息的过程。完成这个过程一般需要经过五个基本步骤:,1. 分析研究课题,(1)明确课题要求 (2)明确待查课题的学科性质、技术内容和其它有关情况,明确检索要求和检索目的,确定学科范围,文献类型,回溯年限,语种,要求检出文献数量,输出方式,明确课题相关的
25、问题,明确课题相关的问题,例如课题:查找现代图书馆网络化建设与管理的研究。,分析课题:提取概念 :图书馆、网络化目的:文献检索学科:电子技术与信息科学文献类型:图书、期刊、学位论文、音 像回溯年限:10年语种:中文,2. 选择检索工具,根据课题的检索要求确定检索工具,如果是手工检索,确定具体的工具书;如果是计算机检索,则确定检索数据库。数据库一般按学科或年代分为几个子数据库,检索者根据需要选择子数据库。,3. 确定检索途径和方法,根据选择检索工具的编排方式或数据库的检索系统确定不同的检索途径和方法。如果是数据库检索,则必须经历以下几个步骤: 选择字段:选择检索词应出现的字段; 填入检索词:在输
26、入框中填入检索词; 选择逻辑算符:有几个检索词时,选择词与词之间的逻辑关系; 执行检索; 显示:一般有题录、题录+文摘、全文等几种输出格式,由检索者选择确定。,(1)试验性检索,分析,修改,调整检索策略,(2)正式检索,灵活的方法,途径,(3)辅助性检索,现有检索工具不能满足检索要求时,如浏览最新的期刊论文,边缘学科的文献,行业文献,内部报告等,以便将漏检的文献查全。,4. 检索策略的调整,5. 根据文献线索,查阅原始文献,如果是直接获得全文信息的检索,可以在输出时,选择打印、存盘或发Email等方式传递检索结果。 如果是只提供目录索引等线索性信息的检索结果,需要根据线索查阅原始文献。,查阅原始文献一般方法:,查找相关的全文数据库,看看自身馆是否收藏原始文献; 查找馆藏OPAC,看看自身馆是否收藏原始文献; 查找可以进行馆际互借或文献传递系统等,看看能否通过馆际互借或文献传递获得原始文献; 查找出版发行情况,能否通过购买获得原始文献。,第六节 信息检索效果的评价,查全率(检全率)查准率(检准率),一、信息检索效果的评价指标,漏检率误检率,二、影响检索效果的主要原因,信息系统组织结构、检索系统功能问题 检索策略、检索方法问题,三、提高检索效果的措施,熟悉各种信息系统特征 认真分析课题需求 灵活掌握检索方法和提高制定检索策略的能力,