收藏 分享(赏)

西华师范大学信息检索的方法.胡晓.第二章.ppt

上传人:fmgc7290 文档编号:6521362 上传时间:2019-04-14 格式:PPT 页数:112 大小:2.72MB
下载 相关 举报
西华师范大学信息检索的方法.胡晓.第二章.ppt_第1页
第1页 / 共112页
西华师范大学信息检索的方法.胡晓.第二章.ppt_第2页
第2页 / 共112页
西华师范大学信息检索的方法.胡晓.第二章.ppt_第3页
第3页 / 共112页
西华师范大学信息检索的方法.胡晓.第二章.ppt_第4页
第4页 / 共112页
西华师范大学信息检索的方法.胡晓.第二章.ppt_第5页
第5页 / 共112页
点击查看更多>>
资源描述

1、二、 主题语言构成 在信息检索过程中,查询信息是用各种检索语言的语词(标识)来表达的。它们存在这样三种关系: 1.等同关系 2.从属关系 3.相关关系1.等同关系 指两个或两个以上的词所表达的概念完全相同或基本相同。A B同义关系 :所表达的概念完全相同。同义词的形式 :规范词和俗称、全称与简称、新词与旧词、正式译名与其它译名等。 准同义关系 :所表达的概念基本相同或相近。 形式主要有 : 近似词之间 (实验、试验 ) 泛指词与专指词之间(法律制度、司法制度)2.从属关系 (上下位关系 ) 在两个概念中,一个概念被包括在另一个概念的外延里,是另一个概念外延的一部分。 外延较大的称为上位概念。

2、一系列从属关系的概念,总称为一个 概念系 。A B例:经济 贸易关系 商品学 食物商品学,就是一个概念系。3.相关关系 概念间关系密切,又不同于等同关系和属分关系的一种关系。有三种类型: 交叉关系 (部分重合关系):一部分外延相重合的概念间的关系。 两个交叉概念外延的重合部分往往形成一个 新概念 。这个新概念对原来两个概念中的任何一个来说,都是下位概念。 例: “ 技术 ” 与 “ 经济 ” 。外延的重合部分是技术经济学。BA C 矛盾关系 :外延上互相排斥,而外延之和等于其上位概念总和的概念间的关系。 例: “ 黑 ” 与 “ 白 ”。其外延之和表示 “围棋子颜色 ” 。A B 并列关系 :

3、也称同位关系。是指同一个上位概念之下的几个下位概念间的关系。例: “ 外国语言 ” 概念下的有 “ 英语、日语、法语 ” 等。A C B 选取最专指的主题词 在使用关键词检索信息时,除了使用常用的关键词外,还应当使用同义词、近义词作为检索入口,这样才能保证查全率。 避免使用 “ 研究 ” 、 “ 探讨 ” 、 “ 论述 ” 、“ 中国 ” 、 “ 世界 ” 等词作为主题词。 尽量使用名词、物体、人名、地名、机构名等作为主题词。三、使用主题语言规范四 检索途径和检索字段 信息检索系统和检索工具所提供的检索入口。常用的包括 : 分类途径 主题词 /关键词途径 题名途径 著者途径 代码途径 出处途径

4、 时间途径 任意词途径常用检索途径 1题名途径:根据文献篇名检索文献的途径。 2著者途径:根据著者姓名检索文献的途径 3关键词途径:利用关键词索引,根据关键词字顺检索文献的途径。 4主题途径:通过文献的内容主题检索文献的途径。主题词是规范化的名词术语,其规范工具是主题词表。 5. 分类途径:依照规定的分类表,按文献学科属性查找文献的途径。检索字段 不同类型的数据库,检索字段不尽相同。不论电子图书、电子期刊及学位论文数据库、还是书目数据库、题录数据库及全文数据库 ,还是中文数据库、外文数据库。其检索字段都各有特点。 下面列出的检索字段是它们共同的检索字段。 由 ISBN号可知该书的语种区、出版社

5、、流水号等。 如: ISBN 7-5383-0276-X 地域号 (国家、地区、语言区 )。其中 7代表中国, 0和 1表示英语区、 2是法语区、 3是德语区、 4是日语区、 5是俄语区等。 是出版社编号 是该出版社出版的图书种数的流水号 计算机检验位 作用:具有可识别可检验的功能。用加权因数 10-2分别与ISBN的 1-9行数对应相乘,将乘积与校验数值相加,再以模数“ 11” 相除,如被整除就是正确的编号,否则为错误编号。如: ISBN 7 5 3 8 3 0 2 7 6 X加权 10 9 8 7 6 5 4 3 2乘积 70+ 45+ 24+ 56+18+ 0+ 8+ 21+ 12 总和

6、 264/11=24(被整除 )五、检索效果 1.主题词 (关键词 )检索及其效果 用主题词 (关键词 )检索是最常见的做法,简单易行。由于用户和检索员想出的主题词极其有限,难以企及众多作者使用的丰富多样的主题词。因此使用主题检索很难取得高的查全率和查准率。 可以借助主题词表等工具。例:计算机信息检索的理论与实践 主题词 计算机 信息检索 检索 以 “ 检索 ” 为前缀 检索策略 检索决策 检索方法 检索方式 检索途径 检索技巧 检索效率 检索效果 检索费用 检索法 检索词 检索式 检索工具 检索系统 检索语言 检索技能 以 “ 检索 ” 为后缀 光盘检索 计算机检索 微机检索 机器检索 联机

7、检索 联机目录 国际联机 信息检索 文献检索 数据检索 事实检索 逻辑检索 含 “ 检 ” 的主题词 机检 缩检 漏检 误检 含 “ 查 ” 的主题词 查全 查准 查新 查找 含 “ 词 ” 的主题词 主题词 关键词 规范词 原文词 入口词 表达检索途径和检索字段的主题词 分类法 分类检索 主题法 主题检索 主题查找 主题索引 著者索引 与逻辑组配有关的主题词 组配 位置组配 逻辑算符 由此可见用主题词检索很难取得很高和查全率和查准率。 2.分类检索及其效果 从检中文献的绝对数量、查全率、查准率来看,切题文献特别集中于核心分类号。可以说,无论从相对效率还是从绝对数量来说,从分类号途径进行检索的

8、效果较好。 3.字段检索效果 作者检索及其效果 从作者姓名可以估计误检率的大小 作者的研究兴趣与特定用户的情报需求很难完全吻合 作者队伍宏大,多产作者少 题名检索及其效果 如果用刊名检索,希望从专业刊物上找有用的文章,即使往前追溯好几年,找到几篇有用的文章就很不错了。思考:何种检索途径效果更好 在较多的情况下,无论从相对效率还是绝对数量来说,用分类号检索效果较好。对一个数据库来说,它采用一个统一的分类法对收录文献进行分类,内容相同或相近的文章被赋予一个统一的分类号。单击此处编辑母版标题样式单击此处编辑母版副标题样式* 22第二节 信息检索方法及步骤1.直接检索法 不依靠检索工具,通过浏览或查询

9、原始文献直接获取信息。 优点:能明确判断文献所包含的信息是否需要 缺点:内容较少,难以获取全面的文献,费时费力 适用于:课题单一,文献相对集中的信息检索。(不适合多个主题,文献离散度大的)一、信息检索方法 3.工具法 利用检索工具查找信息的一种方法,目前是查找信息中最常用的。亦称常用法。 顺查法 :按年代由远及近地普查一定时间全部文献、查全率高,但费时。 例:查检 “ 汶川地震 ” 这一课题 弄清起始时间,即 “ 地震 ” 的产生具体时间 查起,一直查到当前的相关信息为止。 倒查法 :按年代由近及远的查找方法。这种方法省时,但不易把握全程,易漏检。 抽查法 :这是一种针对学科发展特点,抓住该学

10、科发展迅速、信息发表最多的年代(信息高峰期),抽出一段时间(几年或几十年),再进行逐年检索的方法。例:现当代武侠小说的研究工具法 小结工具法主要依赖检索工具,而未收入检索工具的信息就不能获取。运用此法的关键是选好检索工具,否则影响检索效果。4.交替法 :上述各种检索方法的相互交替使用过程。 二、信息检索的步骤结果Y初步检索结果分析课题 分析研究课题 选择合适搜索引擎或数据库拟定检索式和检索策略获取原始文献 (一次信息 )确定检索词N分析研究课题 明确检索目的。 分析信息检索的特点。重点分析信息的内容包含几个主要概念,哪些是次要的概念。 选择信息检索范围 明确学科或专业的范围 时间范围 地域范围 语言范围 信息类型

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报