1、1第 1 章 科技信息检索概述1、信息就是客观世界一切事物存在和运动所发出的各种信号和消息。2、情报是知识或信息经传递并起作用的部分,即运用一定的形式,传递给特定用户,并产生效用的知识或信息。情报具有三个要素:知识性、传递性、效用性。3、信息与情报的关系:信息是关于一切事物(物质的、精神的) 运动状态和运动方式的反映;情报是对搜集到的信息经过整序、分析与深化认识之后得出的解决特定问题的知识。信息可以告诉我们已经或将要发生的事态,而我们及时作出反应的能力则来自于对搜集到的信息进行分析研究所得到的可用于决策的情报。4、知识是人们在改造世界的实践中所获得的认识和经验的总和,是对客观世界物质形态和运动
2、规律的认识。知识是理性化、优化和系统化了的信息。5、文献是指用文字、图像、符号、声频、视频等技术手段记录在一切载体材料上的人类知识。6、存储信息、传递信息是文献的主要功能。知识是文献的实质内容,载体是文献的外在形式,而记录是联系知识与载体的手段。7、科技文献:文献记录的知识内容属于科技范围。8、文献信息:以文献形式被记录的信息。特点:记录下的信息;受到人工符号制约;相对固化;人类的反应;自然界信息可以转换为文献信息。9、信息、知识、文献之间的关系:事物发出信息;信息经人脑加工变为知识;知识被记录形成文献;文献经过传递、应用于理论与实践产生新的信息。10、信息、知识、情报、文献:信息是事物本质属
3、性的反应;知识来源于信息,是理性化、优化、系统化的信息;情报是解决特定问题所需的特定知识与信息;文献是信息、知识、情报的载体。11、信息检索(文献检索):是指将信息按一定的方式组织和储存起来,并根据信息用户的需要找出相关信息的过程。这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需信息的过程,相当于信息查询。12、数据检索:是将观察或实验得到的数据经过筛选、分析、整理和鉴定,以一定的顺序存贮在某种载体上,然后采用适当的方法或手段从中找出符合用户所需的数据的过程。检索结果:数据。13、例如某种金属的熔点,某种材料的电阻。另外,有关计算公式、数据图表、化学分子式等都属
4、于数据检索范畴。14、事实检索:将基本事实预先纪录于某种载体,当需要这种信息时再提取出来的过程。查询某一事物的性质、定义、原理以及发生的时间、地点、过程等,都属于事实检索的范畴。检索工具:字典、辞典、百科全书、年鉴手册、类书、政书、名录等参考工具书。检索结果:事实结论。例如某类产品由哪些厂家生产,哪个牌子最好等都属于事实检索。15、文献检索:是指从各种载体的文献群中查找出与特定的检索课题匹配或相关的文献线索或文献全文的过程。凡是查找某一课题、某一著者、某一地域、某一机构、某一事物的有关文献的出处和收藏单位等,均属于文献检索的范畴。检索工具:书目、索引、文摘等。检索结果:题录、文摘或全文及出处等
5、文献资料。16、文献检索可分为手工检索(简称手检) 和计算机检索(简称机检),手检是基础,机检是发展方向。在三种信息检索类型中,文献检索是最主要、最基本的形式,是信息检索中最重要的部分。数据检索和事实检索都是确定性检索,而文献检索只提供相关的文献供参考。科技信息检索1、科技信息检索就是应用现代信息检索理论并借助各种检索工具和技术,从浩如烟海的科技信息源中获2取所需信息的过程。2、科技信息的类型:按载体形式划分:主要有纸张型、缩微型、电子型、音像型等四种。 按加工层次划分:主要有一次文献、二次文献、三次文献。按出版形式划分:图书、期刊、科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物
6、、产品资料、科技档案。 除上述文献类型外,还有报纸、新闻稿、工作札记等。信息资源的组织管理1、信息资源:指人类经济社会活动中积累起来的以信息为核心的各类信息活动要素(信息生产者、信息技术等)的集合。信息是信息资源构成的核心部分。信息资源同物质资源、能源资源、一起构成现代社会经济与技术发展的三大支柱性资源。物质资源向人类提供材料,能源资源向人类提供动力,信息则向人类提供知识和智慧。2、构成信息资源的基本要素是: 信息、人、符号、载体。信息是组成信息资源的原料,人是信息资源的生产者和利用者,符号是生产信息资源的媒介和手段,载体是存储和利用信息资源的物质形式。信息资源与其它资源相比,具有可再生性和可
7、共享性的特点。可再生性是指它不同于一次性消耗资源,它可以反复利用而不失去其价值,对它的开发利用愈深入,它不仅不会枯竭,反而还会更加的丰富和充实。可共享性是指它能为全人类所分享而不失去其信息量。3、.信息资源分类:第一层次信息资源,即原始信息资源。其特征是未经加工的直接的信息资源。属于 0次信息。包括宇宙、自然界、人类社会、个人在自身运动和从事社会活动中所发出的所有信息。第二层次信息资源,是对处于自然状态的信息进行整理加工、控制转化、使其固化、量化、社会化,然后再进行传递的信息资源,如政府文件、商务资料、图书期刊、音像产品等。这些信息多以文献形式出现。包括一次信息和二次信息。第三层次信息资源,包
8、括报社、电视台、广播电台、邮局、书店、互联网等传播信息的机构和设施,这些机构和设施使信息的交流成为可能,也是一类重要的信息资源。第四层次信息资源,是存贮信息的信息库和资料库。如图书馆、情报所、档案馆、博物馆等。这些机构的特点是集聚着大量的经过人工加工的信息和以数字化形式存贮的数据库,可供人按需索取、利用。3.传统信息资源组织:形式整理:首先,将收集的信息按题名、编著者、信息来源出处、内容提要顺序进行著录;其次,按各条信息涉及的学科或主题进行归类,并著录分类号和主题词;第三,将著录和归类后的信息,按分类或主题进行编号、排序,使之系统化、有序化。内容整理:通读经过形式整理后的信息,从信息来源、发表
9、时间、理论技术水平及适用价值等方面进行评价鉴别,剔除实际意义不高和参考价值不大的部分。对选择出的各条信息中涉及到与研究课题有关的观点(论点、论据、结论等)和图表数据提取出来,对相同的观点进行合并,相近的观点进行归纳,各种图表数据进行汇总、编号、排序,供下一步分析利用。4、网络信息资源组织:网络信息资源的组织是一个复杂的过程,需要借助计算机处理,借助人工智能的强大支撑。网络信息的组织过程分为三个方面:数字化文件的收集。 数字化文件的处理。网络信息资源的服务构建。 5、信息资源组织的主要方法:分类法:分类法是一种从主题内容角度组织和揭示信息资源的方法,信息资源的分类是分类方法在信息资源组织中的应用
10、。主题法:主题法:一般是指就直接以表达主题内容的语词作检索标识、以字顺为主要检索途径、并3通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。按照主题法的选词方式,可以分为标题法、元词法、叙词法、关键词法;按照其使用时组配的先后,可以分为先组式主题法和后组式主题法。按照其使用时是否进行控制,可以分为受控主题法与非控主题法。信息检索原理与技术1、信息检索工具:文献信息库和逻辑语义工具2、文献信息库是检索工具的主体,在计算机、光盘检索中,也称为数据库。完整的文献库由说明、目录、正文、索引和附录五部分组成。3、逻辑语义工具即检索语言、规则等,是沟通文献标引人员与检索人员双方思想的媒介。它独立于
11、具体的检索工具之外,作为软件为若干检索工具所通用4、手检工具按出版形式分:卡片式,书本式(期刊,单卷,附录式) ;按收录范围分:综合性检索工具,专业性检索工具;按著录方式分:题录,文摘,索引。:5、题录:是描述文献信息外部特征的文献条目,并按一定的方式编排起来的集合体。6、文摘是除题录部分外还对文献内容作实质性描述的文献条目。7、索引就是将文献信息中某些具有检索意义的文献特征标识,按一定的顺序加以排列,并注明其所在文献信息中的位置(如文摘号、页码、版次等) ,以便检索相应文献信息的检索工具。8、机检工具是指检索者必须借助各种设备才能使用的检索工具。这类工具大多以缩微型和机读型的形式出现。机检工
12、具的类型:按容纳信息的载体来分:磁带、缩微制品和光盘等。按数据库类型划分:书目数据库、目录数据库、数值性数据库、全文数据库、多媒体数据库。9、信息检索原理:将特定的信息需求与检索体系中的信息线索进行有无、异同及大小的比较与匹配,选取两者相符或部分相符的信息予以输出。10、文献存贮过程:检索工具有存贮和检索两方面的功能。存贮,主要是对文献进行标引,形成文献的外表特征标识和内容特征标识,为文献信息检索提供有章可循的途径的过程。外表特征指标题、编著者、来源、卷期、页码、出版年月、文种等项目;内容特征指文献的学科分类、主题内容等。11、文献存贮过程:文献检索过程是根据读者需求,确定检索概念及其范围,然
13、后选择一定的检索语言,并将此检索概念转换成检索特征标识,按此到检索系统中查找文献线索,最后对其进行逐篇筛选,以确定需要阅读的文献。即提供一定的检索手段,按照一定的检索方法,根据读者需要,迅速全面地查出文献线索,这是文献检索输出的过程,可见存贮是检索的基础,检索是存贮的目的。第 2 章 信息检索技术1、位置检索是在检索词之间使用位置算符,来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。2、限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。3、
14、加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。科技信息检索的作用与策略作用(1) 、促进信息资源的开发和利用: 协助管理者做出正确的决策 便于继承和借鉴前人成果,避免重复研究走弯路 节省查找文献的时间 促进专业学习4、检索策略是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。具体包括:(1.)确定查找范围:根据第一步对检索的时间、地域、语种以及文献类型等的分析,确定一4个合理的检索范围。(2).选择检索手段:一般来说利用光盘检索系统,结合检索相应的网络数据库能满足多数检索要求;没有机检条件时则选用手工检索。如果光盘检索能满足要求,则不必选用其它检索手段。
15、(3).选择检索系统:选择合适的检索系统主要是选择检索工具/数据库,要根据检索课题的内容范围和要求来决定。(4).确定检索途径和检索词(5).构造检索式:检索式是机检中用来表达检索提问的一种逻辑运算式,又称检索表达式或检索提问式。它由检索词和检索系统允许使用的各种运算符组合而成,是检索策略的具体体现。科技信息检索的方法试验性检索、缩检、 扩检、正式检索5、信息检索效果评价:检索效果是指利用检索系统)开展检索服务时所产生的有效结果。评价的目的、范围评价检索系统的检索效果,目的是为了准确地掌握系统的各种性能和水平,找出影响检索效果的各种因素,以便有的放矢,改进系统的性能,提高系统的服务质量,保持并
16、加强系统在市场上的竞争力。检索效果包括技术效果和社会经济效果两个方面。查全率和查准率是判定检索效果的主要标准。6、影响检索效果的因素:查全率与查准率是评价检索效果的两项重要指标,查全率和查准率与文献的存储与信息检索两个方面是直接相关的,也就是说,与系统的收录范围、索引语言、标引工作和检索工作等有着非常密切的关系。1、科技查新作用:(1)为科研立项提供客观依据 (2)为科技人员进行研究开发提供可靠而丰富的信息 2、信息研究报告的目的一般是为领导决策部门、行业决策部门提供参考,是在占有大量信息的基础上,结合课题的研究目标与需求,对有关信息进行系统整理、分析、归纳综合叙述,并提出分析结论或建议。信息
17、研究报告根据研究的目标和使用的对象不同,主要以综述、述评和专题报告的形式再现。 3、学术论文是将新的学术观点或创造性研究成果或技术应用中新的发现等撰写成有论有据的、有所创新的科学记录,是将已有的信息和新获得的信息进行系统化处理并进行文字加工、科学编辑,实现信息再创造的过程。按论文层次水平的高低,有科技论文和学位论文之分。第 3 章 计算机信息检索1、计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。为实现这种信息检索,必须事先将大量的原始信息加工处理、存贮在各种信息载体上待用,所
18、以计算机信息检索广义上讲包括信息的存贮和检索两个方面。2、数据库,是计算机信息检索的重要组成部分。它是以二进制代码形式在计算机存贮设备上(如磁带、磁盘和光盘等)合理存放的相关数据的信息集合,通常由存贮信息记录及其索引的若干文档组成。3、数据库分为以下四种类型:文献型数据库、数值型数据库、词典型数据库、全文型数据库54、文献型数据库记录文档中主要存入的是原始文献的书目。包括原始文献的篇名、作者、文献出处、文摘、关键词,以及主要用于查询各种文献资料的书目性线索、文摘等。5、数值型数据库的记录包括各种调查数据或统计数据。它是一种以自然数值形式表示、计算机可读的数据集合,这些数据是从文献中分析、概括、
19、提取出来,或以调研、观测及统计工作中直接获得的数据。6、词典型数据库这类数据库的文献记录主要介绍一些有关公司、团体或名人的情况,供用户查询某一事物发生的时间、地点、过程或简要情况,或诸如化学物质名称、结构、俗称和化学物质登记号之类指南性信息,故又称之为指南型数据库。7、全文型数据库这类数据库的文献记录存入了原始信息的正文。通过它可以直接检索出原始信息的全文,从而大大方便了用户,也提高了信息的有效利用。8、数据库结构:数据库主要由记录、字段、文档三个层次构成。一个数据库一般都有数以万计的信息记录,每条记录都有不同的字段组成,一组相关记录组成一个数据库文档。通常,数据库的文档由顺排文档和倒排文档组
20、成。第 4 章 中文科技信息检索工具1、参考工具书是根据一定的社会需要,以特定的编排形式和检索方法,为人们迅速提供某方面的基本知识或文献资料线索,专供查询的特定类型的图书。如辞典、年鉴、百科全书等。 2、参考工具书的特点:查考性、概括性、完整性、易检性3、参考工具书的作用:1.指示读书门径:参考工具书中一般附有大量的参考文献目录,可以帮助选择图书,搜集资料,辅导自学。2.解决疑难问题:在实际工作和学习中遇到的疑难问题,无论是文字、内容、年代、地点、事实、人物等,都可以借助参考工具书来解决。3.提供参考资料:年鉴、手册等参考工具书,经常登载有价值的综述、数据、统计资料,知识系统全面,内容成熟可靠
21、,很具参考价值。4.提供丰富知识,便于掌握学术信息:经常翻阅一些工具书,可获取本专业和相关专业的大量知识,开阔视野,了解当代研究动态和最新技术研究成果。5.传播思想、文化知识:在古今中外文化遗产的保留和文化交流上,参考工具书起了不可磨灭的作用。许多珍贵的古籍内容,由于辑录在工具书上才得以保存。4、参考工具书的结构:序、凡例说明、正文、辅助索引和附录5、参考工具书正文的排检方式:字顺法、分类法、主题法、时序法、地序法6、参考工具书的类型及使用:按收录内容的不同,可分为综合性参考工具书与专业性参考工具书;以使用语种的不同,可分为中文工具书和外文工具书;按规模大小的不同,可分为大型工具书、中型工具书
22、与小型工具书;依功能和编排方法的不同,可分为辞典、百科全书、年鉴、手册、名录等。7、百科全书是集各类工具书之大成,被称为工具书之王,它收集了社会科学和自然科学的专门术语,重要名词,并加以详细的叙述和说明,提供定义、原理、方法、历史及现状、统计和书目等多方面的资料。8、词(辞) 典是词语的汇集,提供词语的词意、来源、读音和用法等。语文词典包括:成语词典、谚语词典、方言词典、词源词典、引语词典、同义词典、反义词典等等, 名目繁多。科技词典主要是提供学科领域的专业词汇及其对它们的注释、说明,包括:科技术语词典、科技缩略语词典、科技百科词典、科技语源词典、科技术语分类词典、科技用语搭配词典等。科技术语
23、词典还有不同语种的出版物。9、辞典分类语文性字典、词典,专科性的字、词典, 综合性字典、词典,10、手册是一种便捷式参考书,它是多面收集某一范围最常用的文献资料、基础知识、基本数据的汇编。其特点是简明扼要、全面概括、资料准确、实用性强。手册大致可分为以下四种:数据手册、条目性手册、611、年鉴是汇集一年内的重要时事文献、学科进展与各项统计资料,并按年度出版的连续出版物。所收集资料主要依据政府公报、文件和重要报刊以及经济资料。具有信息密集,资料新颖详实,连续出版等特点。12、年鉴的主要用途是:(1)可供查找国内外概况及各种会议的资料;(2)检索各学科、部门的动态信息及有关学科的新发现、新动向;(
24、3)检索一年内的大事、要文集有关人物传记资料、机构名录等;(4)提供可靠的经济数字及回溯性资料;(5)大部分年鉴都编有与本学科有关的原始文献;(6)含有综述性资料,对科研人员的攻关课题有着重要的参考作用;(7)可供读者浏览;(8)可供查找半年度的科技新成果及推广项目。13、年鉴分为综合性和专科性两类14、综合性检索工具:全国报刊索引 中国科学引文索引 中文科技资料目录 中文科技资料馆藏目录 科学技术研究成果公报 中国标准化年鉴 全国总目录 全国新目录15、专科检索工具:中国化工文摘 电子科技文摘 中国机械工程文摘 自动化仪表中文文献文摘 环境科学文摘 中国生物学文摘第五章网络科技信息资源检索1
25、、网络信息资源是指以电子数据的形式将文本、图象、声音、动画等多种形式的信息存放在光、磁等非印刷质的载体中,并通过网络通信、计算机或终 端等方式再现出来的信息资源2、网络信息资源的类型:按照信息的表现形式和用途,通过网络可检索到的信息资源,可划分为:1)全文型 2)事实型 3)数值型 4)书目文献型 5)实时活动型3、网络信息资源的的特点:网络资源的内容丰富性、 数量巨大,增长迅速、 信息资源存储的分布式、 网络信息资源的多样化、网络信息资源离散性和任意性、交互性、以数字信息为主的管理对象4、搜索引擎种类:Text Search 全文搜索引擎、目录索引类搜索引擎、元搜索引擎5、期刊检索工具:中文
26、科技期刊全文数据库 (维普) 、 中国期刊网全文数据库 (CNKI ) 、 中国数字化期刊群 (万方) 、中国国家科技图书文献中心(NSTL)的期刊数据库联机检索系统、EBSCO、Elsevier SDOL(ScienceDirect Online )、ProQuest6、科技报告检索工具:万方数据库、中国公众科技网7、专利文献是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。包括专利说明书、专利公报、专利分类表、专利检索工具以及与相关的法律性文件。8、学位论文检索工具:中国学位论文全文数据库(万方) 、中国优秀博硕士学位论文全文数据库(CNKI) 、CALIS 学位论文库国家科技图书文献中心 nstl 的中文学位论文数据库、国外学位论文检索工具PQDD。9、产品资料:是厂商为推销产品而印发的介绍产品情况的文献,包括产品样本、产品说明书、产品目录、厂商介绍等。【特点】反映的技术比较成熟,数据也较为可靠,内容具体、通俗易懂,常附较多的外观照片和结构简图,形象、直观。但产品样本的时间性强,使用寿命较短,且多不提供详细数据和理论依据。【用途】作为技术人员设计、制造新产品的一种有价值的参考资料。了解各厂商出厂产品现状、掌握产品市场情况及发展动向。