1、第三章 数据库检索通讲,3.1 信息检索技术及相关,信息检索的含义与实质 通常是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。实质是将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。提问特征是对信息的需求进行分析,从中选择出能代表信息需求的主题词、分类号或其他符号。,信息检索的类型,书目信息检索 全文信息检索 数据信息检索 事实信息检索,信息检索效率,信息检索效率是研究信息检索原理的核心,是评价一个检索系统性能优劣的质量标准,它始终贯穿信息存储和检索的全过程。衡量检索效率的指标有查全率、查准率、漏
2、检率、误检率、响应时间等。,查全率利用检索系统进行某一课题检索时,检出的相关信息量(w)与该系统中存储的相关信息量(X)的比率再乘以100,称为查全率(R),用公式表示如下:R= ( W/X ) 100%,查准率利用检索系统进行某一课题检索时,检出的相关信息量(w)与检出信息总量(M)的比率再乘以100,称为查准率(P ),用公式表示如下: P=( W/M )100%,信息检索技术,布尔检索 截词检索 邻近检索(短语检索) 字段检索,布尔检索,所谓“布尔检索”是指通过标准的布尔逻辑关系词来表达检索词与检索词之间逻辑关系的检索方法。主要的布尔逻辑关系词有:AND或OR或+NOT或-,AND关系称
3、为逻辑与(逻辑乘),用关系词AND表示。表示它所连接的两个检索词必须同时出现在结果中才满足条件。A AND B,例如: 二氧化碳超临界在皮革、食品行业中的运用。二氧化碳 and 超临界 and 皮革 carbon and dioxide and supercritical and leather二氧化碳 and 超临界 and 食品 carbon and dioxide and supercritical and food,OR 关系称为逻辑或(逻辑加),用关系词OR表示。表示它所连接的两个检索词中任意一个出现在结果中就满足检索条件。A OR B,例如:二氧化碳超临界在皮革和食品行业中的运用。
4、二氧化碳 and 超临界 and (皮革 or 食品),NOT关系称为逻辑非(逻辑减),用关系词NOT表示。表示它所连接的两个检索词中应从第一个概念中排除第二个概念。A NOT B,例如:二氧化碳超临界在皮革以外行业中的运用。二氧化碳 and 超临界 not 皮革,截词检索,所谓“截词检索”是指在检索式中用专门符号(截词符号)表示检索词的某一部分允许有一定的词形变化。检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词。目的:提高文献信息的查全率,左截词:又称前端截词、后端一致。允许检索词的前端有若干变化形式。例如:*physicsphysicsastrophysics
5、biophysicschemophysicsgeophysics,中截词:允许检索词中间有若干变化形式例如:wom?nwomanwomen,右截词:又称后端截词、前端一致。允许检索词尾部有若干变化形式。例如:tan*tantannagetannertannintanning,邻近检索(短语检索),通过检索式中的专门符号来规定检索词在检索结果中的相对位置。注:邻近检索目前只应用于光盘检索和联机检索。(nW)(nN),(nW)关系词序不能颠倒。要求它所连接的两个检索词在检索结果相互距离不超过n个词。例如:carbon(w)dioxideshortwave(w)communicationsoftwa
6、re(w)radio,(nN)关系词序可以颠倒。要求它所连接的两个检索词在结果相互距离不超过n个词。例如:检索式:environment(2N)protectionenvironment protectionprotection of the environmentprotection of water environmentprotection of forest environment,网络数据库的分类,中文、英文数据库文摘型数据库:化学文摘(CA)、工程索引(EI)、剑桥科学文摘(CSA)全文数据库:维普、中国全文期刊、万 方、IEEE(美国电气电子工程师学 会)、Kluwer、Spri
7、nger,相关说明,图书馆资源(网络数据库)只有在校园网IP范围内才能使用,建议网络设置为单IP。所有数据库的检索原理和方法都是近似的,且每个数据库都提供相应的“帮助”。,数据库检索具体操作方法,按照数据库检索的特点由浅入深分四个层次进行介绍 以CNKI数据库为例,第一层次(入门级),第一层次(入门级),傻瓜式操作:将数据库当成搜索引擎来使用即可,摆动活齿传动理论和性能研究 google翻译:Swing movable teeth driveSwing live transmission gear 爱词霸英语(iCIBA) :Swing movable teeth drive 雅虎翻译:swi
8、ngs the live tooth transmission 金桥翻译:Lively swing tooth drive 网络中国在线翻译: swings the live tooth transmission CNKI(篇名;精确;核心期刊)Swing movable teeth drivesSwing tooth movable transmission Swing movable teeth transmission,第二层次:关于检索字段,第二层次:关于检索字段1、为了提高准确性,原则上检索词应与检索字段一一对应;2、同样的检索词在不同的检索字段中进行检索得出的结果不同,重要性和意义
9、也不同。,第三层次:各种小设置,第三层次:关于检索范围等小设置1、期刊范围2、年限3、学科导航范围4、同义词:仅“关键词”入口有效 5、同名作者:仅“作者”、“第一作者”入口有效6、“模糊”、“精确”设置;7、词频 8、排序,第四层次:高级检索,第四层次:二次检索,高级检索,专业检索,期刊导航1、二次检索、高级检索:可提高查准率;不同的检索词可以选用不同的检索入口;注意检索词之间逻辑关系的选择。2、专业检索即直接输入复合检索式:涉及*、+、()等和字段代码的使用。注:专业检索中的*,+,()等逻辑关系运算符仅支持半角输入。不同的数据库对专业检索检索式的写法有不同的要求。,英文数据库检索的4个层
10、次,第1层次:当成英文搜索引擎来用 第2层次:关注检索入口 第3层次:其它检索小设置 第4层次:专业检索,第1层次,第2层次,第3层次,第4层次,关于英文数据库,1.数据库的并发用户限制;2.使用截词符以提高查全率;3.复合检索式的写法;4.英文人名的写法;5.从题录信息中获取全文线索。,有关英文人名写法,例如:何有杰 He you jie写法有:he,youjiehe you-jiehe yjhe yyoujie heyj hehe-yjhe-youjie 等等,关于检索策略,1.明确检索目的 2.选择数据库 3.确定检索方法 4.确定检索字段和检索词 5.编写检索式 6.检索,关于检索式,课题:二氧化碳超临界在食品行业中的应用研究检索式:K=二氧化碳 and K=超临界 and K=食品A=廖隆理 and K=二氧化碳 and K=超临界R=二氧化碳 and R=超临界 and J=四川大学学报,THANKS FOR YOUR ATTENTION,