1、DIALOG联机检索基础知识,山东省科技情报研究所 李莎 2010.8 烟台,DIALOG系统概述,DIALOG于1972年正式开始提供商用联机服务,是世界最大、历史最悠久的联机检索系统,已有30多年的全球联机检索服务历史。目前有600多个数据库,内容涉及科学技术、专利与商标、法律法规、社会科学、新闻与传媒、商业与金融、参考信息等各个领域,是以综合性的信息检索系统。 DIALOG公司网址:http:/,DIALOG提供的专业信息范围,科学技术 化学工程、机械与民用工程、航空技术、计算机科学和软件学等应用科学领域; 知识产权 专利、商标和版权信息 能源与环境 石油、天然气、电能、原子能、环境污染
2、与保护等; 医学 生物医学研究、医学实践、医疗仪器、药物相互影响和治疗方法等; 制药 追踪药物的发展,包快正在开发中的药物和新药;药物等级、许可证、临床试验等。 化学 化学物质的合成、最新发现以及商业开发;,DIALOG提供的专业信息范围,食品和农业 农业、营养学、食品科学、包装技术、食品立法和食品与饮料市场等信息; 社会科学 教育、信息科学、心理学、社会学、政治等; 政府和法规 立法和法规信息; 商业与金融 市场份额、销售指标、竞争情报、公司财务、商业目录等; 新闻 报纸、专业时事通讯、商业杂志等; 参考信息 在印书籍、书评报道、名人录;基金、助学金;标准、规范等信息。,供专业检索人员使用的
3、检索方式,1.通过Internet检索DIALOG (1)DialogClassci http:/ (纯文本界面) (2)DialogWeb http:/(WEB界面) 指令检索方式(Command Search) 供具有检索经验的中高级检索人员使用。 引导检索方式(Guided Search) 供专业检索人员、非专业检索人员和初学者使用。,供专业检索人员使用的检索方式,2.通过Internet远程登录方式检索DIALOG DialogLink通讯软件,可免费下载 纯文本界面 主机域名 ,检索费用 包括三部分:,数据库检索费有两种计费方式,用户可自行选择:(1)按用机时间计费即机时费。发生的费
4、用与联机时间的长短有关,与所用检索词的多少无关。每个数据库收费标准有所不同。(2)以DialUnits计费它与使用系统资源数量的多少有关,而与用机时间无关。不同的数据库其DialUnit有所不同。,检索费用,记录输出打印费以显示或打印的记录篇数计算。不同数据库每篇记录的打印费不同;同一篇记录,显示的内容不同,打印费也不同。 通讯费是指与DIALOG系统联机时所占用的通讯网络的费用。取决于采用何种通信方式与主机联机。,DIALOG系统数据库类型,书目型数据库(Bibliographic Databases) 全文型数据库(Full-Text Databases) 名录型数据库(Directory
5、 Databases) 数值型数据库(Numeric Databases) DIALOG系统中,每个数据库均有相应的名称或数字代码(文档号),供用户选择数据库或检索数据库时使用。,记录、字段,数据库中的每个记录都有一个存取号(AN),用该号就可以区分不同的记录。在书目型数据库中,一个记录就相当于书本式文摘索引中的一个完整的著录款目,含有与其对应的若干著录项目,如文献的题目、作者、文献出处、出版年、语种、分类号、主题词和文摘等。记录中的这些著录项目就成为字段,它是构成记录的最小信息单元。字段中所含的信息称为数据。,DIALOG数据库的基本索引,基本索引含有所有与主题内容相关的词,如书目型数据库中
6、的题目、文摘、规范词和自由词等字段中的词,而题目字段(/TI)、文摘字段(/AB)、规范词字段(/DE)和自由词字段(/ID)就称为基本索引字段。不同类型的数据库其基本索引字段不完全相同。,DIALOG数据库的辅助索引,辅助索引包括了除基本索引字段以为的所有其他可检字段,即与主题内容无关的字段,如作者字段(AU=)、出处字段(SO=)、刊名字段(JN=)、出版年代字段(PY=)、分类号字段(CC=)等。这些字段随数据库的不同而有所不同。,DIALOG基本指令,一个最基本的DIALOG系统联机检索流程: 与主机系统联机,并输入用户名和密码 明确查找范围,选库并开库(Begin) 构建准确检索式并
7、检索(Select) 按需输出合适格式记录(Type或Print) 结束检索(Logoff),DIALOG基本指令:逻辑运算符,是用来规定检索概念或检索词之间相互逻辑关系的运算符,也称作布尔运算符。 可以对记录集或者检索关键词进行或、与、非的逻辑运算从而扩大、减小或者是排除检索范围。,DIALOG基本指令:截词符,用于解决一些词干相同、词义相近、但词尾或词头不一致的派生词(如由同一词根派生出的名词、动名词、动词、形容词、副词等),或名词的单、复数形式,或同一词的英美不同拼写形式等词的一次输入。,DIALOG基本指令:截词符,截词方式: 按截断的位置分: 右截断(前方一致) 左截断(后方一致)
8、中截断(中间屏蔽) 按截断的字符数量分: 有限截断 无限截断,DIALOG基本指令:截词符,有限截,DIALOG基本指令:截词符,无限截,DIALOG基本指令:截词符,中间屏蔽,DIALOG基本指令:位置算符,用于限定词与词之间的位置关系,以提高查准率。 当检索词为词组形式时,或两个检索词之间可能被禁用词或标点符号隔开时,均应使用位置算符。,DIALOG基本指令:位置算符,位置算符,DIALOG基本指令:位置算符,衍生用法,DIALOG基本指令,9个禁用词:an and for by from of the to with 逻辑算符的运算顺序:NOTANDOR 同时含有位置算符及逻辑算符时:(
9、w),(n),(s)notandor 用括号改变运算顺序例:(blue or red or yellow) and cloth,DIALOG基本指令:检索指令,DIALOG系统指令的输入格式: ?指令 数据,DIALOG基本指令:检索指令,DIALOG基本指令:打印格式,预定义格式,DIALOG基本指令:打印格式,自定义格式用户根据自己的特定需求而自行定义打印格式。如:题目 TI作者 AU文摘 AB,DIALOG基本指令:检索指令,P.S. 在同时打开多个文档进行多库检索时,可在打印指令输入项的最后用FROM指定某个或某几个数据库。例:t4/5/all from 5,155t s5/ti,ab
10、/1-2 from each,DIALOG基本指令:检索指令,关机指令 LOGOFF 暂时关机指令 LOGOFF HOLD,DIALOG基本指令:检索指令,暂时保存检索策略指令 SAVE TEMP 调用保存检索策略指令EXS 例:EXS tb035,DIALOG基本指令:检索指令,叠加指令 ;多次输入:?b 2,8 ?s laser()printer? ?/ti and py=2003?rd?t/6/1-5 from each一次输入:?b 2,8;s laser()printer? ?/ti and py=2003;rd;t/6/1-5 from each,DIALOG基本指令:检索指令,回
11、顾检索过程指令 DISPLAY SETS 或 DS 去重指令 REMOVE DUPLICATES 或 RD 专利文献去重指令 IDPAT(同时检索多个专利数据库时使用),数据库的选择方法,使用DIALOG数据库目录选择数据库Dialog Database Catalog网络版地址: http:/ 输入用户名及密码,点击LOGON 进入指令检索模式,点击Databases按钮,进入主题分类与数据库选择页面。 从八个大类中选择一个与检索内容相关的类。 在所选择的大类下,进一步选择相关的主题类目,以缩小要查询的数据库数量。 在指令框中输入检索式,然后点击Search或直接按回车键,开始在指定的数据库
12、中进行扫描检索。,数据库的选择方法,使用DIALOG数据库说明书选择数据库DIALOG Bluesheets 即蓝页印刷版 活页型联机版 DIALOG 415文档(免费)网络版 http:/ Begin 411 b 411 Set files或sf sf 2,6,8sf patents Select 或 s s discriminators su=(lee r?+lee,r?),DIALINDEX总索引数据库检索方法,Save temp save temp B N1,N2,N3 b 2,6,8b hits Execute steps或exs exs tb123 Remove duplicate
13、s或rd rd(idpat) Type或t t s2/6,k/allt1/5/1-5 from each,检索策略的编制及优化,检索策略是指为实现检索目标而制定的检索计划和方案。检索式是检索策略的具体体现,是指计算机检索中用来表达用户提问的逻辑表达式,通常由检索词和各种逻辑算符、截词符、位置算符以及系统规定的其他连接符号等构成。,检索的基本步骤,分析检索课题,明确检索要求,确定检索的主题内容 确定检索概念 选择表达概念的检索词 选择所有不同的能够表达检索概念的词 使用截词检索各种词尾变化的词 使用位置算符指定词组或词间的相对位置关系 使用逻辑算符组配检索概念,拟定检索表达式 选择恰当的数据库
14、上机检索(见前面介绍的“联机检索流程”),检索实例分析,1.分析检索课题,明确检索要求,确定检索的主题内容、范围等例:检索国外有关灌溉用橡塑多孔管的工艺技术主要技术内容:灌溉用橡塑多孔管也称为橡塑渗灌管,其主要原料为橡胶粉(由废旧轮胎制得)和塑料(如粉状聚乙烯)。该产品主要用于农林业、园艺等方面的农作物灌溉。,检索实例分析,2.确定检索概念例如:“灌溉用的橡塑多孔管”(Rubber-Plastic Porous Pipe For Irrigation),制造该多孔管的主要原料是橡胶粉(由废旧轮胎制得)和塑料(如粉状聚乙烯)。经过分析,其主要的检索概念是:“橡胶”、“塑料”、“多孔管”、“灌溉”
15、。,检索实例分析,检索概念:灌溉 多孔管 橡胶 塑料轮胎 聚乙烯注意:相同概念之间应使用逻辑算符or来连接,不同概念之间应使用逻辑算符and来连接。,检索实例分析,3.选择表达概念的检索词 灌溉 irrigation;watering 多孔管 porous pipes;porous tubes;porous hoses; porous piping;porous tubing; porous drip irrigation tubing 橡胶 rubbers 轮胎 tyres;tires 塑料 plastics 聚乙烯 polythylene;polythene;PE;9002-88-4,检索
16、实例分析,使用截词: 灌溉 irrigat?;watering 多孔管 porous pip? ?;porous tube? ?;porous hose? ?; porous pip?;porous tub?; porous drip irrigat? tub? 橡胶 rubber? ? 轮胎 tyre? ?;tire? ? 塑料 plastic? ? 聚乙烯 polythylene;polythene;PE;9002-88-4,检索实例分析,使用位置算符指定词组或词间的相对位置关系: 灌溉 irrigat?;watering 多孔管 porous(2w)pip?;porous(2w)tub?
17、; porous(2w)hose? ? 橡胶 rubber? ? 轮胎 tyre? ?;tire? ? 塑料 plastic? ? 聚乙烯 polythylene;polythene;PE;9002-88-4,检索实例分析,4.使用逻辑算符组配检索概念,拟定检索表达式: (1)分步输入s irrigat? or waterings porous(2w)pip? or porous(2w)tub? or porous(2w)hose? ?s rubber? ? or tyre? ? or tire? ?s plastic? ? or polythylene or polythene or PE
18、or 9002-88-4s s1 and s2 and s3 and s4,检索实例分析,(2)一步输入 s (irrigat? or watering) and (porous(2w)pip? or porous(2w)tub? or porous(2w)hose? ?) and (rubber? ? or tyre? ? or tire? ?) and (plastic? ? or polythylene or polythene or PE or 9002-88-4),检索策略的优化方法,使用DIALOG蓝页检索基本索引字段(使用后缀限制)/ti 将检索词限制在题目字段中/de 将检索词
19、限制在规范词字段中/ab 将检索词限制在文摘字段中,检索策略的优化方法,DIALOG书目数据库基本索引字段:/TI Word索引类型/AB Word索引类型/DE Word & Phrase索引类型若不指定字段,即在基本索引的所有字段中检索,为Word索引类型。,检索策略的优化方法,Word索引类型:检索时必须使用位置算符指定词与词之间的位置关系。 Phrase索引类型:按照短语的形式输入(包括空格和标点符号等),不能使用位置算符。,检索策略的优化方法,使用DIALOG蓝页检索基本索引字段 例:s bioengineer?(4n)food?/tis bioengineer?/des (heal
20、th()effect? and pesticide?)/ti,de,检索策略的优化方法,使用DIALOG蓝页检索辅助索引字段(使用前缀来指定查找的字段)au= 作者字段jn= 期刊名称字段py= 出版年字段cs= 机构名称字段dt= 文献类型字段la= 语种字段,检索策略的优化方法,检索辅助索引字段au= Phrase索引类型jn= Phrase索引类型py= Phrase索引类型cs= Word 索引类型dt= Phrase索引类型la= Phrase索引类型,检索策略的优化方法,使用DIALOG蓝页检索辅助索引字段例:s au=hollander,ws py=1998:2007,检索策略的
21、优化方法,检索辅助索引字段如果所检索的辅助索引字段属Word索引类型,则检索时必须使用位置算符限定词的位置关系,同时要使用括号将所有的词限定在所指定的辅助索引字段中进行检索。如:s cs=stanford(w)(univ or university)s cs=(stanford(s)(univ or university),检索策略的优化方法,扩大命中文献量的方法 选择其他的同义词、相关词或上位词 去掉一个不太重要的检索概念 将限制严谨的位置算符改为较宽松的位置算符,或用AND算符代替位置算符 取消某些限制过严的后缀符、限制符等 利用截词技术,检索所有相同词干的词 选择其他数据库进行检索,检索策略的优化方法,缩小命中文献量的方法 提高检索式的专指度,增加或换用下位词和专指度较强的词 增加一个检索概念 将检索式中的AND算符改为位置算符;或将较宽松的位置算符改为更严谨的位置算符 使用后缀限制,将检索词限制在基本索引的“重要”字段中,如规范词字段或题目字段 用辅助索引字段与主题检索相结合限制检索范围 截词使用不当,进行修改,一些特殊情况的特定检索方法,