收藏 分享(赏)

网络信息检索基础知识杨青兰州大学图书馆查新中心20113.ppt

上传人:天天快乐 文档编号:1461145 上传时间:2018-07-19 格式:PPT 页数:144 大小:1.78MB
下载 相关 举报
网络信息检索基础知识杨青兰州大学图书馆查新中心20113.ppt_第1页
第1页 / 共144页
网络信息检索基础知识杨青兰州大学图书馆查新中心20113.ppt_第2页
第2页 / 共144页
网络信息检索基础知识杨青兰州大学图书馆查新中心20113.ppt_第3页
第3页 / 共144页
网络信息检索基础知识杨青兰州大学图书馆查新中心20113.ppt_第4页
第4页 / 共144页
网络信息检索基础知识杨青兰州大学图书馆查新中心20113.ppt_第5页
第5页 / 共144页
点击查看更多>>
资源描述

1、网络信息检索基础知识 杨青 兰州大学图书馆查新中心 2011.3.15.,导 言,文献检索是一门既古老又年轻的学科 约4000年前,人类就开始有目的地组织信息,一个典型的例子就是图书中的目录。 随后,逐渐出现索引的概念,即从一些词和概念指向相关信息或者文档的指针。 到了1948年,C. N. Mooers在其MIT的硕士论文中第一次创造了“Information Retrieval”这个术语。,文献检索是一门既古老又年轻的学科,信息检索发端于19世纪前期,主要以手工检索方式为主,其发展速度较为缓慢,检索效率普遍不高。到20世纪50年代,1951年世界上出现了最早的计算机系统,这可称得上是信息检

2、索发展史上的一个里程碑。随着计算机技术的不断进步,进入 20世纪90年代,网络技术开始进入社会生活各个领域,计算机检索也逐步由脱机检索、联机检索发展到如今Internet环境下网络检索。,网络信息检索是文献检索面对的新课题,网络检索以其低廉的费用、迅速的存取等多种功能对传统的检索造成了强力的冲击,与此同时,一些新的理论、新的课题也应运而生,加速了现代情报学和信息学的发展。 网络信息检索是指对利用Internet信息发布技术,通过Internet发布的信息进行的检索,主要利用搜索引擎、网络机器人和门户站点等来完成。随着Internet的迅速发展,网上信息以爆炸性的速度不断丰富和扩展,其信息数量之

3、大、类型之多,已经给人们的工作、学习和生活方式带来了巨大影响。,网络信息检索是文献检索面对的新课题,为了充分发挥网络信息的重要作用,并能迅速在上百万个网站中快速有效地查找到想要得到的信息,必须对网络检索的特性进行研究分析,并掌握网络信息资源的特点、基本方法和检索技巧与检索工具等重要内容。网络信息资源的分布主要以网站为单位,数以千计的网站在Internet上形成了犬牙交错的信息资源库。,网络信息检索是文献检索面对的新课题,因特网的发展,逐渐改变了信息资源原有的属性,将文献信息数字化、应用环境网络化、技术手段多媒体化;运用情报学的理论与方法组织无序的网络信息,为用户服务;研究中文数据库的组织与检索

4、技术将是我国情报学界必须重视的问题。 网络信息资源开发利用是我国信息化建设的核心内容。在我国信息基础设施建设已初具规模的今天,网络信息资源建设显得极为重要与迫切。这需要情报工作者认真研究解决。,文献、信息基本知识 信息检索语言 检索工具 信息检索技术,文献检索概述,第一节 文献、信息基本知识,一、基本概念二、文献的构成要素三、文献的类型四、现代文献的整体特点五、文献检索的类型六、网络信息资源,一、基本概念1、信息:消除对客观事物认识的不定性的东西,是符号、信号或消息所包含的内容。2、知识:人们对自然和社会的认识和描述的总和。3、文献:记载有知识的载体。4、 情报:主要指“信息、资讯、消息”情报

5、是指被传递的知识或事实,是知识的激活,是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研,生产中的具体问题所需要的特定知识和信息情报应具有个基本属性:一是知识或信息;二是要经过传递;三是要经过用户使用产生效益情报不仅取决于情报源,也取决于情报用户,5、出版物:可以理解为文献的表现形式或承载物,大多 数情况下等同于文献。 6、信息源:产生信息的事物,在本课程中,指文献信息源。7、信息资源:可以理解为信息源所含的信息本身,是信息源的内含。在大多数场合,信息源、信息资源、文献信息资源是同义的。8、信息检索:利用一定的工具从大量的信息资源中迅速、准确地查找出与特定的要求有关的信息。本课程

6、中,信息检索、文献检索、文献信息检索视为同一概念。,情报,信息,知识,文献,信息、知识、文献 、 情报之间的关系,信息是生产知识的原料;知识来源于信息,是信息的一部分,文献是存贮、传递信息的载体。,二、文献的构成要素,知识内容,文献中记录信息和知识,这是文献的灵魂。,符号系统,表达知识信息的手段,包括语言、文字、图画、表格、公式、编码、音响、图象、声像等 。,文献载体,信息内容存储的依附体,包括印刷型文献、音像制品、机读资料等。,记录方式,刻划、手写、机械印刷、拍摄和电脑录入、扫描等生产方式。,三、文献的类型:按载体划分,按载体划分,印刷型文献,感光型文献,机读型文献,说明:多数著作把文献分为

7、印刷型、缩微型、视听型、机读型四种,而以甲骨、竹简、金石、帛等为载体的文献较少见,这里不讨论。,印刷型文献(纸本文献),载体:纸张实例:图书、杂志、报纸记录手段:印刷、抄写特点:可直接阅读,方便使用;不利于检索和保存;收藏文献占用空间大。,感光型文献,载体:感光材料 实例:缩微平片、电影胶片、幻灯片记录手段:缩微技术、摄影技术特点:体积小;价格低;不能直接阅读,机读型文献(电子文献),载体:磁性材料、光盘实例:磁盘、光盘、磁带记录手段:磁记录、编码技术特点:存储密度高、速度快;便于远距离传输;易复制;成本高;不能直接阅读。,按出版形式的不同,图 书*,连续出版物,特种文献,研究报告*会议文献*

8、专利文献*技术标准*学位论文*产品样本*技术档案*,期刊*报纸*,三、文献的类型:按出版形式划分 (十大信息源),图书的含义,凡篇幅达49页以上并构成一个书目单元的文献称为图书。未达到49页的,可称为小册子。,图书的特征,* 主题突出,内容系统全面,论述全面深入,知识成熟稳定。适合于学习型读者 * 出版的周期长,因而其内容一般就缺乏最新的研究成果。,期 刊,定义 期刊又称杂志,它是指围绕某个专题的定期或不定期连续出版的出版物。名称统一、开本固定、有连续的序号、汇集了多位作者分别撰写的多篇文章。,期刊的特点,A、期刊以品种为单位形成知识流;B、出版周期短,内容新颖、及时、广泛,专深;C、内容不全

9、面系统,不成熟,论题窄;D、文献中数量最多,使用量最大。,核心期刊,* 少数刊载某一学科大量高质量专业论文的期刊。 * 特点 (1)刊载专业文献密度高,信息含量高; (2)水平较高,代表本学科的最新发展水平; (3)出版相对稳定,所载文献寿命较长; (4)利用率和被引率较高。 目前,许多单位核心期刊的判定是以 中文核心期刊要目总览为标准,形式特征:有统一的名称,定期连续出版,每期汇集许多篇文章、报道、消息等,多为对开或四开,以单张散页形式出版。,报 纸,内容特征:时间性强,能以最快的速度报道国内外发生的最新事件和科学技术的最新研究成果,内容广泛。类型:按出版周期分,有日报、双日报、周报、旬报等

10、;按范围划分,有全国性报纸、地方性报纸、系统性报纸等;按内容划分,有综合性报纸、专业性报纸。,报 纸,研究报告,研究报告是单位和个人向上级或委托单位撰写的关于某个课题研究成果的正式报告。,科技报告的特点 (1)内容新颖,选题尖端实用; (2)不公开发行或少量发行; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。,会议文献,会议文献是指在各种会议上宣读、交流的论文、报告、会议录等文献。定期召开的会议录或论文集其实相当于连续出版物。,专利文献,专利的特点1、包括发明专利、实用新型专利和外观设计专利三种。2、内容比较具体,有的还有附图,通过它可以了解该项专利的主要技术内

11、容。 3、新颖性、创造性和实用性 ,有重大参考价值。4、经审核可向全世界发行,获取容易。,专利文献主要由专利说明书构成。所谓专利说明书是指专利申请人向专利局递交的有关发明目的、构成和效果的技术文件。,标准文献,标准具有一定的法律约束力,对技术的规定详尽、完整、可靠,更新频繁。检索时必须注意是否最新标准。,标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。,学位论文,学位论文是指高等院校和科研单位中的本科生、研究生为获得学位,在导师指导下完成的科学研究、科学试验成果的书面报告。 *学位论文一般不对外发行,印数少,不容易获得。 *质量参差不齐,

12、其中硕士、博士论文较为专深,对研究工作有较大参考价值。,按文献的级别,一次文献,二次文献,三次文献,零次文献,三、文献的类型:按文献级别划分,1、一次文献,*作者以自己的研究成果为基础创作或撰写的文献;*对知识的第一次加工;具有创造性;*大多数期刊论文、科技报告、学术论文,*对一次文献进行加工整理而成的具有报道和检索 作用的文献; *对知识的第二次加工;有序化;提供一次文献线索; *目录、题录、文摘等检索工具。,2、二次文献,* 利用二次文献系统地检索出一批有关的文献,对 其内容进行比较分析,综合述评而编撰的文献。 * 对知识的再加工;提供文献检索; * 综述、专著;字词典、百科全书,3、三次

13、文献,* 还未形成一次文献的非出版物; * 论文草稿、谈话记录、实验记录、书信,4、零次文献,一次文献是检索的对象(目标) 二次文献是检索的工具(手段) 三次文献是情报研究的成果(检索目标+检索手段),从检索的角度来看:,一次文献是对知识的第一次加工(创造性) 二次文献是对知识的第二次加工(有序化) 三次文献是对知识的再加工(有序化+创造性),从知识加工角度来看:,四、现代文献的整体特点,1、数量激增2、类型复杂3、文种多样4、内容交叉重复5、文献聚散有序6、新陈代谢频繁,五、文献检索的类型(一)按检索内容划分,文献检索,数据检索,事实检索,概念检索,信息检索的主要形式,通过二次文献,包括手工

14、检索工具和计算机检索系统,找出所需的一次文献或三次文献。,以数据为对象的检索,如查找数学公式、数据图表、某一材料的成分、性能等,是一种确定性检索。,是以特定的事实为检索对象。事实内容包括大量的科学事件和社会事件。,就是查找特定概念的含义、作用、原理或使用范围等解释性内容或说明。,全文检索,图像检索,多媒体检索,检索系统存储的是整篇文章或整本图书。还有另一层意义:即从文献的全文中进行某项检索。,即以图形、图像或图文信息为检索内容的信息检索。,是以文字、图像、声音等多媒体信息为检索内容的信息检索。,(二)按是否使用检索工具划分 1、直接检索 就是指利用一次文献进行检索,这是以前比较常用的一种查找方

15、法。所花时间多和精力大,检出文献少。 2、间接检索 就是指利用各种检索工具获得文献线索,再根据线索去查找原始文献线索的方法。,(三)按检索手段划分 1、传统信息检索 就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。 2、现代信息检索 现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。,第二节 文献检索语言,一、检索语言的含义及作用二、检索语言的类型,一、检索语言的含义及作用,检索语言:是根据检索需要而创造的一种人工语言。,检索语言又称标引语言、索引语言等,是信息检索系统存储和检索信息时共同使用的一种共同语言。即在文献存储时,文献的内容特征(分类、

16、主题)和外表特征(书名、著者)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵循的语言就是检索语言。,检索语言的含义,信息检索语言实质上是标引和检索之间的约定语言,是人与检索系统对话的基础。检索的匹配就是通过检索语言的匹配来实现的,使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。,检索语言的作用: 1、保证不同标引人员表征文献信息的一致性。 2、使内容相同及相关的文献集中化。 3、保证检索提问与文献信息标引的一致性。 4、保证检索者按不同需求检索文献信息时, 都能获得最高的查全率和查准率。,二、检索语言的类型,

17、检索语言的类型,表述文献外表特征的语言,表述文献内容特征的语言,题名责任者号码引文,分类法,主题法,标题词法叙词法关键词法,检索语言的分类,按文献信息的特征:描述信息内容特征的语言和描述信息外部特征的语言;按检索工具编排体系:分类语言和主题词语言;按词汇的类型:关键词语言、单元词语言、标题词语言和叙词语言。按其规范的情况:人工语言 (规范语言)和自然语言(非规范语言);代码语言按检索语言的词汇组配方式:先组式语言和后组式语言。,不同的检索语言构成不同的标目及其索引系统,提供各种检索点。,人工语言 (规范语言) 和自然语言(非规范语言),规范语言:人工语言的规范处理重在两个方面:一是使一个概念只

18、用一个词汇来表达,这样就避免了多词一义的情况;二是使一个标引词只能表达一个概念,这样就排除了一词多义现象。自然语言:自然语言是取其自然形态,不受控,使用非规范词或称自由词。自然语言极其丰富、复杂和多样,存在着一词多义、多词一义及词义交叉的现象。常见的有同义词、近义词、同型异义词等。,分类语言和主题语言,分类语言也属于主题语言。是按照一定的观点,以学科分类为基础,用逻辑分类的原理,结合信息的内容特征,运用概念划分的方法,按知识门类从总到分,从上到下,层层划分,由类目号码及名称作为检索语言,构成分类类目表,如图书分类表、专利分类表用的都是分类语言。 主题词语言包括:关键词语言、单元词语言、标题词语

19、言、叙词语言等,它们有不同的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词汇之间的关系。,目前,国际上通用的体系分类表有: 中国图书馆图书分类法(简称中图法)。 美国国会图书馆分类法 杜威十进位分类法 (简称UDC), IPC国际专利分类法,中国图书馆分类法 简介,中图法是我国当代具有代表性的图书分类法,是一部大型的综合性的图书分类法。它是根据文献各级类目之间的逻辑关系(如从属关系、并列关系、相关关系、交叉关系等)编排而成的一个逐级展开的排列表。中图法由五大基本部类和22个基本大类、简表、详表、通用复分表组成。中图法的标记符号,采用拉丁字母与阿拉伯数字相结合的混合号码制,拉丁字

20、母用来表示大类,其他各级类目则用阿拉伯数字表示。,基本部类,基本大类,基本大类,基本大类,例如:“网络浏览器”类号、类目展开示例T 工业技术TP 自动化技术、计算机技术TP3 计算技术、计算机技术 .TP39 计算机的应用 TP393 计算机网络 TP393.0 一般性问题 TP393.09 计算机网络应用程序 TP393.092 网络浏览器 网址资源、WWW、Netscape、主页制作等如此。,关键词语言,所谓关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表征文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词

21、语。也可看成是一种自然语言。即直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。例:“科技文献信息检索”中的关键词很多,它包括:“科技”、“科技文献”、“文献”、“文献信息”、“信息”、“信息检索”、“文献检索”和“检索”,叙词语言 是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语语言。,第三节 检索工具,检索工具:是在不同学科范围内对某阶段出版的有关文献进行收集、整理或对新文献加以及时报道的二次文献。,一、检索工具的作用二、检索工具的特点三、检索工具的类型,一、检索工具的作用,1、报道作用2、存储作用3、检索作用,二、检索工具的特点,

22、1、详细而又完整地记录了文献的外部特征和内部特征。2、对所著录的文献,标引了可供检索的检索标示。3、提供必要的检索手段,配备各种体系的索引。,三、检索工具的类型,1、目录,2、题录,3、文摘,4、索引,目 录 目录是著录一批相关文献并按照一定的次序编排而成的一种揭示与报道文献的工具。目录又称书目,目录的著录项目一般有:书、刊名、卷、期数、作者、出版年月、出版地及书、刊收藏情况等。按目录的编制目的可分为:登记书目、科学通报书目、推荐书目、书目之书目(指南)五种。按目录收录文献内容范围分为:综合书目,专题书目,地方文献书目和个人著述书目等。按照目录反映文献收藏情况,可以划分为:馆藏目录和联合目录。

23、按照文献的出版时间与书目编制的时间的关系可以分为:现行书目、回溯书目和与预告书目。,题 录 题录是将图书和报刊中论文的篇目按照一定的排检方法编排,供人们查找篇目出处的工具。它按照论文的篇名顺序排列,按“篇”报道,不论是否收藏原文,只要是已出版发行的文献都收录,具有“广”、“全”、“快”的特点。,文 摘 文摘是以简明扼要的文字摘述文献的主要内容,是文献资料的摘要。作为一种检索工具,它以精练的语言把文献的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用。按文摘的编写方式分为:报道性文摘和指示性文摘。按出版形式分为:期刊式文摘、单卷式文摘、附录式文摘

24、和卡片式文摘等。,索 引,索引将书刊内容中所论及的篇名、语词、主题等项目,按照一定的排检方法加以编制,注明出处,供读者查检使用的检索工具。索引是对文献内容较深入的揭示。索引的种类繁多,按照索引的对象可分为篇目索引、分类索引、主题索引、著者索引、引文索引等。常用的索引有:篇名索引、主题索引、辅助索引等。,第四节 检索技术,一、概念检索二、布尔逻辑运算符组配检索三、截词检索四、字段限制检索五、位置运算符六、检索技巧和方法,一、概念检索 检索标识是具体的检索词或词组,每个检索词表达一个概念,具体检索时,将检索词与数据库中的文献特征标识进行类比,两者相同,则该记录为命中文献。,二、 布尔逻辑算符组配检

25、索 布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,既为命中文献。,布尔逻辑运算符,1、逻辑“或”2、逻辑“与”3、逻辑“非”,1、逻辑“或”(和),用符号“or”或“+”表示,其逻辑表达式为: A or B 或 A+B 表示提问要求命中文献包含A、B两个特征中的任何一个即可 例:数据挖掘在信息检索与信息分析中的应用 提问式:数据挖掘 * (信息检索 + 信息分析),2、逻辑“与”,用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and

26、 B表示提问要求命中文献同时包含A、B两个特征。 例:图书馆信息资源建设 提问式:图书馆 *信息资源 * 建设,3、逻辑“非” ,用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B 其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。例:自由分配方面的文献(排除天水师范学院师生的著作)提问式:(关键词=自由分配) not (单位=天水师范学院),三、截词检索,截词检索主要是利用检索词的词干或不完整的词形进行检索。其方法是在词干后可能变化的字符处加上通配符,可减少检索词的输入量,简化检索步骤,提高查全率。 截词符一般用“?”、“ :”、“#”表示1、后方

27、截词:用于前方一致的派生词检索。 如:信息? 则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。如“apple?”可代替(apple + apples + apple-pie + applesauce);2、前方截词:用于后方一致的派生词检索。 如:?经济 则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。,3、有限截词 在检索词后面加上一个或一个以上(最多4个)的“?”,空一格,再加一个“?”。如: Comput? ? 可检索出: Computer,Computers,Computing,截词检索在不同的计算机检索系统中规定不同,请使用时注意。 注意:由

28、于文字结构方面的原因,中文检索系统极少使用截词检索和位置算符检索。,四、字段限制检索,为了缩小检索范围,在命令式检索中,通常要用字段代码来限定检索的字段,以提高检索速度和命中率。不同的数据库使用的字段代码略有不同。 如:rice in ti(表示只在题目字段中查找文献) rice in de(只在主题词中查找) rice in ab(只在文摘中查找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献),限制检索,“全国报刊索引”的字段标识为:A=分类 ,B=题名, C=著者 ,D=

29、单位, E=刊名, F=年份, G=主题, H=文摘 ,I=全字段 例:B=图书馆 * D=海南大学 “DIALOG”的基本索引字段标识为:AB(文摘),DE(叙词),ID(自由词),SH(分类标题),TI(题目), CO(公司),检索形式为“检索词/字段代码”。辅助索引有:AU(著作),JN(期刊),PY(年代),检索形式为“字段标识符=检索词”。例:(personal (w) computer/de or network/ti) and py = 2002或( personal (w) computer/de, ti, id or network/ti, ab) and la = engl

30、ish and py = 2002CNKI直接用字段名称标识,如:题名 = “计算机” and “机构”海南大学”,五、位置运算符,With:设定需检索的两个词或词组在同一字段中,但不限制位置的先后。Near:设定需检索的两个词或词组在同一语句中,相对于“with”更接近。此外,在使用“near”运算符时,还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度,如“near3” 设定需检索的两个词或词组在同一句子中且相隔不超过3个单词。,位置算符: 在检索词之间使用,规定算符两边的检索词出现在记录中的的位置,以提高检准率。,:,常见的位置算符如下,网络信息资源,一、网络信息资源的特点

31、二、网络信息资源的类型三、常见网络数据库检索系统,一、网络信息资源的特点,总体来讲,网络信息资源相比其他信息资源具有如下主要特点 :1.离散性与共享性2.动态性和及时性3.不均匀性4.潜在的失控性,网络信息资源的特点,1.离散性与共享性是受/支持的应用协议集,它采用,和进行信息定位、存取和显示。在静态上,是一个全球范围内的相互链接的多媒体信息网,同时在逻辑上它也可被看作是用书写的分布式超文本结构。这种超文本结构使得文档之间用热键连接,这种自由度使得信息交换与分享潜力无穷。也正是由于这种离散性,使得网络信息资源能为所有网络用户共享,这一优越性是其他信息资源所不具备的。,网络信息资源的特点,2.动

32、态性和及时性: 网上信息资源的瞬息万变,极其丰富,信息的更新也很迅速。 3.不均匀性有两重含义,一是网络信息的质量不均匀,二是网络信息分布不均匀。 4.潜在的失控性任何个人团体只需具备上网条件能够使用,就可以把任何信息放到网上,这种信息经过种种检索工具的标引,就可供用户检索,中间没有任何形式的质量控制,势必影响检索效果的查准率,从而导致检索效率的失控。,二、网络信息资源的类型,从文献信息检索角度看,我们可以把网络信息资源分成以下几种类型:1、网上图书信息2、电子期刊 3、专利信息 4、网上数据库 5、网上其它科技信息,1、网上图书信息,Internet上提供的图书信息主要包括书目信息和电子图书

33、这些信息我们可从以下几个方面来获取: (1) 出版商提供的书目信息。国内外许多出版社都有自己的网站, 通过Internet发布其出版物的目录、最新图书内容简介、价格等信息。(2) 数字图书馆提供的电子图书。数字图书馆是数字化生存时代的重要文化基础设施。利用这些图书馆,记载人类文明成果的图书资料就会方便地进入人们的生活,网上图书信息,(3) 图书馆、文献情报中心提供的联机图书馆馆藏目录。目前全球至少有15000个大型图书馆的联机目录24小时对外开放,通过OPAC我们可以查询到大量的书目信息,确定某本书是否在馆,能否通过馆际互借加以利用等,有些联机目录不但提供书目及摘要, 还提供其它的信息资源。,

34、2、网上电子期刊信息,电子期刊是非常重要的网络资源。网上电子期刊时效性强、内容丰富、检索途径多样,已成为利用率非常高的网络信息源,特别是免费的电子期刊。网上电子期刊包括与印刷版同时发行和仅在网上发行的两种,其主要来源渠道有: (1)出版商和文摘索引服务商提供的期刊检索服务。目前,国际上大多数主要的期刊出版都建立了全文数字化期刊数据库。并通过Internet提供其服务。,网上电子期刊信息,(2) 网络数据库信息服务商提供的服务。存储在网络服务器上的网络数据库品种多、质量高、大多由信息服务商或大型图书馆机构创建维护。(3) 网络版期刊提供的服务。目前,许多期刊正在网上建立自已的网站,便于读者上网检

35、索或提供免费的电子邮件现刊目录服务,网上电子期刊信息,(4) 文献情报部门或学术性机构提供的服务。文献情报部门或学术性机构通过自己的网站提供期刊或其它类型文献的网上检索服务,用户在有的网站检索二次文献信息的同时,还可以订购原始文献,原文可通过E-mail、传真、浏览、下载和联机打印等方式获取。,3、网上专利信息,网上的专利信息资源可从以下几个方面来获取: (1) 利用专利管理机构网站提供的信息。专利管理机构网站主要是指各国(地区)或地方专利局的主页或者由它们及其下属机构开发的网站。这类网站提供的专利信息全面、权威、新颖。例如美国、加拿大、日本等国的专利数据库在INTERNET上均可得到免费使用

36、。,网上专利信息,(2) 利用联机检索系统中的专利数据库。一些知名的联机检索系统中都包含与专利有关的数据库。如Dialog系统(http:/)、STN (www.cas.org/stn.html)系统等。(3) 利用数据库出版机构提供的信息。主要有Derwent公司、英国IEE公司(INSPEC)。,4、网上数据库信息,这是最有价值的信息资源之一,一般以商业性数据库或政务数据库的形式出现,需要通过购买或用户授权才能使用。网上数据库有全文型、文摘型、题录型、事实和数值型、多媒体型等。Internet上也有大量、有价值的免费数据库,只要我们要善于发现、搜集,往往会得到意外的惊喜。,网上数据库信息,

37、数据库可以分为五种类型 (1)文献书目数据库 :Bibliographic Database (2)全文数据库 :Complete Text Databases(3)信息指南数据库 :Dictionary Databases(4)数值型数据库 :Numeric Databases(5)其他类型的数据库,(1)文献书目数据库,文献书目数据库是存储某个领域原始文献的书目,即二次文献数据库,记录内容包括文献的题目、著者、原文出处、文摘、主题词等大多数是印刷本检索工具的机读版,如美国工程索引数据库(EI)英国科学文摘数据库(INSPEC)美国化学文摘数据库(CA),(2)全文数据库,全文数据库是存储文

38、献内容全文或其中主要部分的数据库,简称全文库.是将信息的全部文字和非文字内容转换成计算机可读形式. 全文数据库可以解决用户获取一次文献所遇到的困难,能向用户提供一步到位的查找原始文献的信息服务。据统计,在美国,全文数据库从1985年的28%增加到1995年的52%,其数量是书目型数据库的一倍,而书目型数据库则从57%下降到24% 我国已有中国学术期刊全文数据库、书生之家数字图书馆和超星数字图书馆等全文数据库产品,(3)信息指南数据库,信息指南数据库主要是记录一些机构、人物、产品、项目简述等事实数据,通过该类数据库可以查到公司、机构地址、电话、产品目录、研究项目或名人简历等信息,这类数据库也称为

39、事实数据库,(4)数值数据库,数值数据库是专门提供以数据形式表示信息的一种源数据库,主要记录科学研究中试验、测量、计算、工程设计、经济分析和工业规划等方面的数据这类数据库主要包含数值数据,有的也包含文字,文字是用来定义数据所需的最小量的文字,有时称为文本数值数据库(Textual-numeric Databases),(5)其他类型的数据库,除了上述四种基本的数据库类型之外,还有多种混合型的数据库形式特别是随着多媒体技术的迅速发展和广泛应用,将多媒体数据结构结合为一体,并统一进行存取、管理和应用的多媒体数据库已经问世.,5、网上其它科技信息,Internet上除了网上图书信息、电子期刊、专利信

40、息、数据库信息外,还有大量的会议信息、科技政策法规、学位论文、技术标准、产品样本目录、科技报告、统计数据、科技新闻、组织机构、电子论坛、通讯讨论组和数据库等,这些资源的实用性也很强。,三、常见网络数据库检索系统,1.Ei 美国工程索引2.SCI Expanded( 科学引文索引扩展)3.ISI Proceedings (科学会议录索引)4.CSSCI (中文社会科学引文索引)5.ASTP ( 威尔逊应用科学与技术数据库)6.CSA (剑桥科学文摘)7.OCLC First Search(联机计算机图书馆中心),常见网络数据库检索系统,8.PQDD(国际学位论文文摘) 9.USPTO(美国专利与

41、商标办公室) 10.CNKI11.维普信息资源系统12.万方数据资源系统13.其他数据库资源,七、 科技信息检索的基本流程,信息检索课程目的:让你以最有效的方法收集及筛选所需数据以提高科学研究能力,1.检索步骤 检索步骤:根据既定课题要求,利用检索工具查找有关文献资料的具体过程,实际是信息检索的具体化。主要有以下步骤: 1、分析检索课题 2、选择检索系统和数据库 3、确定检索途径和检索词 4、构建检索式 5、检索并调整检索策略,检索步骤,1.进行课题分析,明确课题需求。 检索文献信息前对课题内容进行分析,明确文献检索的目的。课题需求可以分为三种类型:a、普查型:需要全面收集有关某一主题的文献资

42、料,如以课题开题、教材编写等。具有普查、回溯的特点,要求尽可能高的查全率。b、攻关型:需要收集有关某一主题某一特定方面的文献,其目的在于解决科研、生产中的关键问题,这类需求不强调查询的文献数量,但需要查得的文献具有较强的专指性。c、学习型:需要了解掌握某一领域的研究动向、研究成果或相关知识,要求查到的文献具有新颖及时的特点,而对查全率和查准率不一定有很高的要求。,2、选择检索工具(系统)和数据库选择检索工具时要考虑是否与文献需求紧密结合、学科专业对口、覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的工具以及检索系统的检索功能是否完善等,主要有几个方面:全面性,即是否与课题相关的内容都要检

43、索,包括的工具有一次文献和二次文献数据库,以及网上相关资源等。针对性,保证选择的检索工具与检索课题的学科一致;专业性,即选择与学科专业相关的工具,特别注意跨学科领域内容;权威性,尽量选用该学科的权威性检索工具;了解检索工具收录的范围,包括时间跨度、地理范围、文献语种、类型等;检索工具的检索方法和系统功能是否全面有效。,选择检索工具,目前,检索工具和数据库的数量不断增多,每种检索工具和数据库均有自己的特色和侧重点,检索时,应根据课题需求加以选择。 对于工具书和数据库特点的了解,一是可以通过学习检索课了解和掌握自己专业的主要检索工具及数据库;二是通过相应的信息机构收藏的检索工具和数据库,直接浏览或

44、使用过程逐步了解和掌握;三是通过各种检索工具指南和数据库目录了解,只有在了解检索工具和数据库的基础上,才能有效地进行选择。,检索工具的选择通常有两种方法:,(1)从常用检索工具中选择 (2)从检索工具指南中选取 可利用中国科学技术情报研究所编辑出版的 国外科技文献检索工具书选介 国外科技文献单卷检索工具书简介国内科技文献检索工具书简介等选取。,重要专业信息资源选介,一、 公共学术站点1. 中国国家图书馆(2. 中国科学院文献信息中心()3. 万方数据资源系统()4. 国家科技图书文献中心()5. 中国高校科研网 ()6. 中国学术期刊网 ()二、专业学会、研究机构及专业站三、提供学术站点的导航

45、网站点,3、确定检索途径和检索词 检索途径的含义:检索途径也称检索入口,文献的特征是存储文献的依据,也是检索文献的依据,因此,文献特征便构成了检索途径。数据库由一条一条记录集合而成,而一条记录又划分为若干字段。如中国学术期刊全文数据库存贮了我国自1994年以来发表在近万种报刊上的文献。一篇文献用一条记录来揭示,一条记录又划分为分类、题名、著者、出处、年份、(题中)人名、主题等字段。其中大部分字段都是可检索字段,这些可检索字段,我们就称之为检索途径。 一般来说,每个数据库都有多个检索途径(入口),常用的有:篇名、作者、关键词、摘要、全文、出处、分类等。检索前用户要告诉计算机,以什么检索途径来进行

46、检索。如果要查找篇名中含有某个词的文献,则检索途径选择“篇名”;如果要按文献的分类来检索,则检索途径选择“分类”。,检索词的选择与确定要注意:根据检索课题所涉及的学科专业和技术内容选词;根据检索目的选词。如:“屠宰场含脂水的处理”,目的是富含脂肪的污水处理,因此并不在乎是屠宰厂还是肉联厂。再如:盐碱地改良。进一步和读者沟通后得知盐碱地改良是通过生物技术实现的,所以,加上生物技术更能体现出检索目的。考虑相应的同义词。对同一事物,人们对其有不同的称呼和表达,如“计算机”又称“电脑”、“图形图像与图形图象“,“污水处理、污水控制与水净化”,“电动机与马达“等。要用逻辑或进行检索,如(电动机 or 马达),( 图形图像 or 图形图象)。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报