1、计算机检索,教师:付开远 电话:8609709 邮箱: Q Q:121336354,今日内容,第一节 计算机检索与数据库 第二节 如何制定检索式,第一节 计算机检索与数据库,第一节 计算机检索与数据库,一、 计算机检索的定义及其优点 二 、计算机检索的发展史 三、 计算机检索原理 四 、数据库结构与类型 五 、计算机检索途径及步骤,一、 定义及优点,(一)定义:计算机检索就是通过计算机及与其相连的通讯设备和线路在存储文献的数据库中查找信息的过程。,应具备三个条件,检索系统,数据库,计算机,(二) 计算机检索的优点,一、 定义及优点,信息容量大,资源可共享,资源更新快 效率高,速度快 检索途径多
2、 检索灵活,适合检索复杂课题 检索结果存储和传递便捷 入手容易,跨越时空的限制,二、计算机检索的发展史,三、计算机检索原理(略),(1)实质:信息检索标识和存储标识的匹配过程。 (2)图示:,(一)数据库的结构,文档记录字段 文档(file):数据库中一部分记录的有序集合(顺排文档,倒排文档) 记录(record):描述原始信息的外部特征和内部特征。数据库中一条记录代表一篇文献 字段(field):比记录更小的单位,是组成记录的数据项目(如TI、AU、 SO、AB),四 、数据库结构与类型,一个数据库一般由多个文档组成,每个文档有多条记录,每条记录有多个字段,(二)数据库类型,书目数据库 数值
3、数据库 全文数据库 事实数据库 多媒体数据库,四 、数据库结构与类型,书目数据库(bibliographic database),存储某学科或主题领域各类文献资料的书目信息,属于二次文献,即文献的题录或文摘。例如:MEDLINE、CBM、CMCC等。,四 、数据库结构与类型,数值数据库(numeric database),存储原始文献中可重复测量的数据、可观察到数据以及统计和预测的数据等。例如:美国国立医学图书馆编制的化学物质毒性数据库RTECS,包含了10万多种化学物质的急慢性毒理实验数据。,四 、数据库结构与类型,全文数据库(full text database),存储的是原始文献的全文,
4、有的是印刷版的电子版,有的则是纯电子出版物例如中国学术期刊全文数据库 nature ,四 、数据库结构与类型,事实数据库(fact database),存储的是经过加工的三次文献信息或某一事物或事件的有关数据,事实等。如名人录、产品目录、大事记等参考工具书的信息例如:医用数据咨询库PDQ(Physician Data Query)。,四 、数据库结构与类型,多媒体数据库,能够管理数值、文字、表格、图形、图像、声音、视频等多种文件类型的数据库。例如:美国的蛋白质结构数据库PDB,该数据库可以检索和观看蛋白质分子的三维结构。,四 、数据库结构与类型,五、计算机检索途径及步骤,检索途径,外部特征 篇
5、名 作者 单位 引文 ,内部特征 关键词 主题词 分类号 摘要 ,五、计算机检索途径及步骤,检索步骤,第二节 如何制定检索式,第二节 如何制定检索式,一、检索式与运算符的定义 二、运算符类型及其应用 三、检索效果评价,检索式:用运算符将检索词连接起来构成的计算机可识别的式子。,运算符和检索词是构成计算机检索式的关键要素,运算符:又称逻辑算符,是表达检索词之间各种关系的有一定运算能力和级别的符号,它是组成检索式不可缺少的因素。,一、 检索式与运算符的定义,二、运算符类型及其应用,(一)布尔逻辑运算符 (二)位置符 (三)截词符 (四)限定符,又称为“布尔算符”,由英国数学家 乔治布尔提出,(一)
6、布尔逻辑运算符:,作用:用来连接两个或多个检索标识的符号,(一)、布尔逻辑运算符,(一)、布尔逻辑运算符,常用的布尔逻辑运算有三种:逻辑与、逻辑或、逻辑非,1、布尔算符 AND 的含义及应用,(1)含义:AND又称为逻辑“与”,表示“相交”关系,用于缩小检索范围(查准率),例如:用CBM查找干扰素治疗白血病的文献检索式为:干扰素 AND 白血病,(2)应用:表示形式:A AND B,(一)、布尔逻辑运算符,例1 在CBM中干扰素治疗白血病的结果,2、布尔算符 OR 的含义及应用,(1)含义:“OR”又称为逻辑“或”,表示“并列”关系,扩大检索范围(查全率),例如:用CBM查找有关干扰素的文献检
7、索式为:干扰素 OR IFN,(2)应用 表示形式:A OR B,(一)、布尔逻辑运算符,例2 用CBM检索有关干扰素的所有文献,21805+10016-7473=24348,要点:提高查全率如何确定检索词归纳成 以下几个方面,全称、简称及缩写同时使用;规范词兼顾自由词(其中勿忘了 同义词、近义词);查上位词时勿忘下位词; 注意外来词译写变化。,(一)、布尔逻辑运算符,例1:用CBM查找白介素-2的相关文献,例2:用CBM查找有关艾滋病的文献,例3:在PUBMED数据库中检索有关乳腺肿瘤的文献,例4: 用CBM查找脑血管疾病的有关文献,例5 用CBM查找拉米夫定的有关文献,(1)含义:NOT又
8、称为逻辑“非”,用于排 除不需要的检索结果(2)应用 表示形式:A NOT B,3、布尔算符 NOT 的含义及表示形式,例如:白血病治疗 NOT 放疗,A,B,(一)、布尔逻辑运算符,例1、用CBM查找除放疗外的有关白血病治疗的文献,4、运用“布尔算符”的注意事项,1)运算符遵循数学运算法则 布尔逻辑运算符运算顺序:NOTANDOR 2)变运算顺序,应将先运算的部分加上括号 3)在检索式中只有AND、OR前后的检索标识可以交换;NOT前后检索词不能交换 4) “( )”必须在半角或英文状态下输入 5)运算符与检索词之间前后要空一格,(一)、布尔逻辑运算符,WITH: 要求左右两个检索词出现在同
9、一个字段中。,(二)、位置符,作用: 表示两个检索词之间位置的检索符。用于缩小检索范围。,位置符,NEAR: 1、表示左右两个检索词出现在同一个句中; 2、near后加正整数N时,表示左右两个检索词之间最多可插入N-1个词,应用举例(一),WITH 形式: A WITH B 实例:Leukemia with complications,应用举例(二),NEAR 形式: A NEAR(n) B 实例:检索乳腺肿瘤的检索式可简化为:breast near1 (cancer or neoplasms or Tumor or sarcoma or carcinoma),作用:表示不确定字符的检索运算符
10、,用于扩大检索范围,(三)、截词符,截词符,任意截词(用%、$ 、*等符号表示),有限截词(用?表示),应用举例(一),任意截词的应用 1、急性%胰腺炎:可检出急性胰腺炎、急性重症胰腺、急性出血性胰腺炎,急性坏死型胰腺炎、急性胆源性胰腺炎等急性胰腺炎的所有文献。2、immun*: 可检出immune、 immunity、immunology、 immunohistochemical等所有含immun前缀的检索词的文献。,检索结果,急性胰腺炎、急性重症胰腺、急性胆源性 胰腺炎、急性出血坏死型胰腺炎等急性胰腺炎,使用MEDLINE(06/7-06/10)查找免疫相关的文献结果,应用举例(二),有限
11、截词的应用 例如:拉米?定可检出含拉米夫定和拉米呋定的文章;Protein?:可检出含 Proteins和 Protein的所有文章注:“?”必须在半角或英文状态下输入,检索结果,(四)限定符,作用:对特定字段的限定检索,提高查准率 包括:in、=、等 表现形式:检索标识 限定符 字段名 实例:在MEDLINE和PUBMED中检索石京山院长发表的文章 shi j s in AU shi j sau,要点:提高查准率从以下几个方面着手,检索结果多时采用“AND”缩小检索范围 检索下位词时不使用上位词 使用 “NOT” 将不需要的检索标识排除 将“AND”改为更精确的狭隘的位置符 使用限定符限定检
12、索标识所在字段,要点:提高查全率从以下几个方面着手,全称、简称及缩写同时使用;规范词兼顾自由词(其中勿忘了 同义词、近义词);查上位词时勿忘下位词; 注意外来词译写变化;用截词符表示不确定字符,扩大检索范围。,影响查全率的因素,1、文献存储:收录不全;词汇缺乏控制和专指;词表结构不完整;标引不详或遗漏等。2、信息检索:策略简单;逻辑组配不当;途径和方法太少;业务不熟;系统不具备截词功能等。,1)检索词准确性不够;2)组配不严密或错误;3)选词及词间关系不正确;4)检索式专指不够;5)面宽于检索要求;6)系统不具备逻辑非;7)截词位置不当等。,影响查准率的因素,干扰素联合白介素-2治疗白血病的有关文献(请写出检索式) 儿童患甲肝或乙肝的有关文献 CD24在大肠息肉中的表达的相关文献,思考题,