1、第四章 计算机检索基础知识,第一节 概述,一、计算机检索的发展,1、 脱机批处理检索,2、 联机检索,3 、光盘检索,4、Internet网上检索,19541964,19651972,1985,1973,三、计算机检索系统的组成,硬件、软件、数据库,二、计算机检索的服务方式,1、追溯检索(Retrospective Search,简称RS),2、 定题服务(Selective Dissemination of Information,简称SDI),3、联机订购原文,4、电子邮件服务,四、 数据库类型,数据库类型,数据库是至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数
2、据集合.,根据载体的不同,可分为:联机数据库(online database) 、光盘数据库(CD-ROM database) 和网络数据库(networked database).,根据内容与功能可划分为:指南数据库(directory database) 、交易(执行)数据库(transactional database) 、全文数据库(full text database) 、书目数据库(bibliographic database) 、 字(词)典数据库(dictionary database) 、数值数据库(numeric database)与统计数据库(statistical da
3、tabase) 、图像数据库(image database,graphic database)等,第二节 计算机检索方法,一、逻辑提问式(检索式)的基本要素,1、检索词:用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录,2、布尔逻辑运算符,(1)逻辑“与”:运算符为“AND”或“*”,(2) 逻辑“或”:运算符“OR”或“+”,(3) 逻辑“非”:运算符“NOT”或“”,检索算符 在输入检索表达式的过程中,可根据检索符号简化检索的过程,以达到快速检索的目的:运算顺序依次为:NOTANDOR(非与或) 可灵活运用括号“()”改变优先级,括号内的逻辑式优先执行 检索代码 检索词
4、前面的英文字母是各字段的代码,可在检索入口选择框中查看。 代码字段:U任意字段 S机构 M题名或关键词 J刊名 K关键词 F第一作者 A作者 T题名 C分类号 R文摘,逻辑运算符的表达方式,1、布尔逻辑检索功能:用布尔逻辑算符来组配检索词以确定文献的命中与否。其算符的相互匹配方式一共有8种。逻辑与(逻辑乘) 逻辑或 异或关系 “逻辑非”的“逻辑或”关系“逻辑或”的“逻辑非”逻辑非被标引在该词下的,(1)逻辑与(逻辑乘),用运算符号:AND 或 * 连接检索词例查 “有关计算机在图书馆中的应用”的文献, 检索式=计算机 * 图书馆例查 “猪的饲养” 检索式=猪 * 饲养 用文氏图表示:图1-1,
5、(2)“逻辑或”,用运算符号 “OR” 或 “+”连接两检索词例1 查“苹果或梨”方面的文献 检索式=苹果 + 梨它在同义词检索中使用,能提高查全率。例2 查“计算机或机器人”方面的文献 检索式=计算机 + 机器人 用文氏图表示如下:,A OR B,( 3)“逻辑非”,用运算符号“NOT”或“”连接两检索词 A AND NOT B有的书上也称为“与非”关系,即“逻辑乘”与“逻辑非”例1 查“玉米但不是甜玉米”方面的文献。检索式=玉米甜玉米例2 查“不是铬合金”方面的文献。检索式=合金铬 用文氏图表示: 图1-3,A NOT B,(4)“异或”关系,(A OR B )AND NOT (A AND
6、 B )“异或”排除掉的是A AND B部分例 A=水上运输工具,B=陆上运输工而“异或”的关系则排除了A AND B的那部分,即“水陆两栖运输工具”不能被命中。这同A OR B 是有区别的。用文氏图表示如下:,(A OR B)NOT(A AND B),(5 )“逻辑非”的“逻辑或”关系,即: NOT A OR NOT B 两检索词的。例:查除俄文、法文两种文字之外的其它各语种的文献。用文氏图表示:图1-5,NOT A OR NOT B,(6)“逻辑或”与“逻辑非”,即:A OR NOT B 检索A 但否定B后的逻辑或, 例:检索焊接(A)方面的资料,但不要技术标准(B)。这样,结果是“焊接标
7、准”的资料被排除了。但是其它一切课题的资料(除标准外)的资料均被命中。用文氏图表示:图1-6因此,A AND NOT B(即逻辑非) 和A OR NOT B是不同的其效果相差很远。,A OR NOT B,(7)A即标引在A检索词下的文献,(8)NOT A检索不是检索词A下文献。总结: 布尔逻辑检索是把任何检索课题加工成可以进行逻辑运算的表达式, 这是计算机检索的一种被广泛采用的匹配方式。布尔逻辑运算的优 点是简单明确、易于理解、符合人们的思维习惯,A,A,NOT A,A,3、位置逻辑检索符,(W)算符:“with”的缩写,例:? SELECT CD()ROM相当于检索CD ROM或CD-ROM
8、,(N),(nN)算符:“Near“的缩写,(nW)算符:“n Words”的缩写例:electronic(1w)resources,可检出electronic resources 和electronic information resources,例: Railway (2N) Bridge 表示Railway Bridge, Bridge of Railway, Bridge of the Railway等等。,(F)算符:“Field”的缩写,(S)算符:“subfield”的缩写,(L)算符:“Link”的缩写,4、截词检索符,中间截词 Wom?n相当于查找woman和women。,后
9、截词 如输入stud?,表示截三个字母,可检索出带有study, studies, studied和 studing等的文献。,无限截词符 在检索词根后加一个“?”,表示该词后带任意个任何字母的词均为相匹配的词。,5、限制检索符,编写逻辑提问式举例:,1.高层建筑抗震结构设计,(tall+high rise)*building*earthquake resistance*structural design,2.加拿大酸雨造成的污染(要求语种为英文),acid( )rain*Canad?*pollution*LA=English,3.核测量数据处理软计算方法研究,(nuclear measure
10、ment? ? + nuclear data)*(soft()comput?+algorithm)*(on real-time + on-line + dynamic),二、短语检索(phrase search) 短语用“ ”表示,检索出与“ ”内形式完全相同的短语,以提高检索的精度和准确度,三、括号检索(parentheses) 用于改变运算的先后次序,括号内的优先进行,四、自然语言检索(natural language search) 直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样,五、多语种检索(multilingual research)提供多种语言的检索环境供用户选择,
11、系统按用户选定的语种进行检索并反馈结果,六、模糊检索(fuzzy search) 当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来了与关键词意义相近的内容,七、区分大小写的检索(case-sensitive research),第三节 检索策略,所谓检索策略,广义地说,就是在分析课题内容实质的基础上,选择检索系统、检索文档、检索途径、确定检索词相互间的逻辑关系,直到给出检索顺序的最佳实施方案等一系列的科学措施,是就一个问题检索一个(或多个)数据库所输入的全部检索式的集合。狭义的检索策略,是指填写的“检索提问单”。,检索步骤,分析课题,选择信息资源,构造检索式,制定检索策略,调整检索策略,下载、保存检索结果,确定检索课题,数据库检索的一般方法,分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息,得到一组主题词(关键词)和一些限定要求(如年限、学科领域等),数据库的基本情况和检索功能、检索途径,逻辑检索 逻辑算符 逻辑组配,检索途径 检索项 题名|主题,浏览模式 分类|主题| |文献类型,匹配模式 精确|模糊 |截词检索,检索模式 初级检索| 高级|专家,结果处理 排序|选择| 获取|使用,特色功能 与 拓展服务,