1、计算机信息检索策略,主讲人:朱末霞,计算机信息检索策略与技巧,关系到对各种数据库进行具体操作的指导思想及其操作过程;关系到用户在完成具体课程时应注意的方方面面;是解决用户从“什么”到“哪里”(what where)提问的整个计算机信息检索的全过程。,计算机信息检索的基本构成课题分析 选择检索系统及数据库检索词的确定编制检索式,计算机信息检索策略与技巧,(一)课题分析,(1) 分析课题的主要内容和所涉及的学科范围 (2) 明确所需文献的类型、语种、年代等 (3) 查新、查准、查全的指标要求及其侧重,(二)选择检索系统及数据库,数据库的选择可概括成“4C”原则,它们是:Content,指数据库的内
2、容、学科范围、类型、数据来源;Coverage,指数据库的规模、时间范围、机构来源、文献量等;Currency,指数据库更新的及时性、频率、周期;Cost,指数据库的收费标准和方式。,选择数据库应该以专题数据库为主,综合数据库为辅。此外,收集信息质量高的各学科专题网址可以起到事半功倍的效果。,(三)确定检索词,1、使用专指性强的主题词作检索词,例如 :跨国公司经营管理研究,2、选择有实际意义的检索词,例如:大学生心理障碍因素分析成因及对策, 少用或不用对课题检索意义不大的词,1、词义泛指度过大的词,如: “展望”趋势、现状、近况、动态等 “应用”作用、利用、用途、用法等 还有如“开发”、“研究
3、”、“方法”、“影响”、“效率”等 2、词义延伸过多的词,如: “制造”制备、生产、加工、工艺等 “提炼”精炼、提取、萃取、回收、利用等,如:天然植物茶叶中提取茶多酚作为食品防腐剂,植物*茶叶*提取*茶多酚*食品*防腐剂,茶叶*提取*茶多酚*食品*防腐剂,茶叶*茶多酚*食品*防腐剂,茶多酚*食品*防腐,茶多酚*(食品+防腐),少用无法定性定量的词,冷、温复合挤压连续成型技术 (冷挤压 or 温挤压) and 连续 and 成型() (冷 or 温) and 挤压 and 连续 and 成型() 冷= 常温以下 温=450C6000C or 8000C 处理结果:取消:冷、温二词 深化处理:增加
4、:挤压对象的词。如塑料、金属等词或其他有助于限制范围的有效实词如:挤压时用的润滑材料:石墨。,3、充分运用与选定检索词概念相同或相近的词,如:高等教育,大学教育、高校教育、高教 、高等教育,又如:土豆栽培技术,(土豆+马铃薯+洋芋+洋蕃芋)*(栽培+栽植+培养+培育),土豆*栽培*技术(),查外文文献选择同义词和近义词应主要考虑以下几点, 同一概念的几种表达方式,如MEMS(Micro Electromechanical System),微电子机械系统,美国一般就称为MEMS,而欧洲的惯用称法为Microsystem(微系统),日本的惯用称法为MicmMachine(微机器)。 化学物质用其名
5、称也要用其元素符号,如硅,Silicon和Si。,同一名词的单、复数、动词、动名词、过去分词形式等,如生产有product, produce ,production,producing,productive等,词根相同时,可用截词符解决,“*”为无限截词符(替代多个字母),“?”为有限截词符(替代一个字母)。 异称词的选取,异称词即不同地区、不同时代、不同场合下对同一东西的不同的称呼,例如电磁阀门(electromagnetic valve)也称螺线管阀门(solenoid),又称线圈(coil)。,4、运用主题概念所表达的上位或下位概念,课题(1):话语语用分析研究(主要指祝贺话语和冲突话语
6、 ),(祝贺话语+冲突话语)*语用,话语*语用,中国期刊网,5、多主题概念的课题应以简为主,如:利用基因工程的手段提高植物中 淀粉含量,基因工程*淀粉,基因*淀粉,(四)编制检索式,一个好的检索式是最终实现检索策略是否达到预想结果的具体表现形式。 1、影响查全率的种种因素:检索词是否已扩大到穷尽;是否合理应用逻辑“或”来优化检索;是否对课题检索策略作了必要的扩大。 2、影响查准率的因素:是否尽量选用了专指度较高的检索词;是否尽量采用了逻辑“与”逻辑“非”和位置算符进行优化检索;是否对所检课题作了范围的有效限制等等。,三、检索策略实例,课题1:论企业生产线的优化,(企业+工厂+公司)*(生产线+流水线)*(优化+计算机控制+在线控制+智能控制),企业 * 生产线 * 优化,三、检索策略实例,课题2:建筑楼盘三维动画展示设计,课题3:花盆和花架创意设计,课题4:基于物联网的配电网监控系统研究与开发,课题5:全自动水电站库区清漂船,