1、,目次,第1章 绪 论 第2章 信息检索基础 第3章 搜索引擎 第4章 事实和数值型信息检索 第5章 图书信息检索 第6章 期刊信息检索 第7章专利信息及商标信息检索 第8章 其他信息检索 第9章 检索案例选编 第10章 检索效率 第11章信息的分析利用,第1章 绪 论,1.1 基本概念 1.2 文献的类型 1.3 信息检索与利用的哲学与法律问题 1.4 信息检索和利用的意义,第1章绪论,1.1基本概念,1. 信息 (information)2. 文献 (literature/document)3. 情报 (intelligence)4. 信息、情报和文献之间的关系5. “信息检索与利用”课程
2、,第1章绪论,1.1基本概念,1.信息(information)自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达 2. 文献(document)记录有知识的一切载体。3. 情报(intelligence)对人提供的有用的知识。,第1章绪论,1.1基本概念,4. 信息、情报和文献之间的关系 1)包含关系信息包含知识,知识包含情报。 2)转化关系文献是记录有知识的载体,当文献中记录的知识传递给用户,并为用户所利用时,就转化为情报 。 3)交叉关系情报虽大多来自文献,但也可能来自口头和实物,所以情报与文献存在交叉关系。,第1章绪论,1
3、.1基本概念,5. “信息检索与利用”课程 1) 包括信息的“检索”和“利用”两部分内容。 2) 检索”部分介绍信息检索的原理、方法步骤。 3) 信息的“利用” ,即对检索出的信息去粗取精,去伪存真,进行统计分析和竞争情报的分析,适应市场竞争。 4) 针对大学生,还要学会利用文献跟踪学术动态、寻找科研课题、撰写毕业论文、科技论文,申请专利。,第1章绪论,1.2 信息的类型,1.2.1 按物质载体和记录形式划分1.2.2 按出版形式和内容划分,第1章绪论,1.2 文献的类型 1.2.1按物质载体和记录形式划分,1.印刷型 主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上。 2.缩微型
4、以感光材料为载体,以光学缩微技术为记录手段 。 3.声像型 以磁性、感光材料为载体,直接记录声音、图像的一种文献。 4.机读型 利用计算机进行存储和阅读的一种文献形式。 5.手写型古代各种非印刷型文献如甲骨、简策、帛书等以及还没有正式付印的手稿。,第1章绪论,1.2 信息的类型 1.2.2 按出版形式和内容划分,1. 图书 2. 期刊 3. 报纸 4. 专利 5. 标准 6. 学位论文 7. 科技报告 8. 会议论文 9. 政府出版物 10.产品样品资料 11.技术档案,第1章绪论,1. 图书,按照联合国教科文组织的定义,图书是指50页以上的以印刷方式单本刊行的出版物。包括专著、汇编本、多卷本
5、、丛书等。 1.形式特征 图书的著录格式反映其形式特征 见表1-1 【实例】在参考文献列表里,图书的著录格式是:美R.霍克著.Internet通用搜索引擎检索指南.沈阳:辽宁科学技术出版社.2003.2.ISBN 7-5381-3849-8,表1-1,第1章绪论,1.图书,2)内容特征 优点:图书的内容全面系统,基础理论性强,论点成熟可靠。 缺点:图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,内容相对陈旧。 适用范围:如果需要对大范围问题获得一般性知识,对陌生问题进行一般了解,对熟悉问题进行历史 性的全面系统的回顾,查阅图书一般来说是行之有效的办法。,第1章绪论,1.图书,3)图书类
6、型图书按其用途可分为三种类型: (1)阅读用书 (2)参考工具书 是供人们释疑解难、翻检查考的出版物。【实例】参考工具书中国大百科全书是我国现阶段最大的一部综合性百科全书,主要用来检索中外百科知识和当代科学发展水平。 (3)检索用书 是以图书形式刊行的书目、题录、文摘等,是供人们查找一定范围内信息线索的出版物。【实例】我国历史上最大的一部官修目录四库全书基本收入了我国先秦至清代传世的重要古典文献。四库全书编纂时,存目和著录的书都在各书卷首写上一篇提要,后将这些提要汇集起来,加以审改,辑成四库全书总目提要一书,分经、史、子、集四大类,下分细目,具有检索作用。,第1章绪论,2.期刊,期刊也称杂志,
7、是“一种以印刷形式或其他形式逐次刊行的,通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物” 1)形式特征有相对固定的名称和版式、有连续出版的时间顺序标识即出版年、月、卷、期号。 【实例】图1-1所示期刊中国科学论坛有固定的ISSN号“1883-036X” ,国内统一刊号(C N 号)“62-3699”。,图1-1,第1章绪论,2.期刊 期刊论文的著录格式,【实例】在EBSCO数据库的期刊论文著录格式如下:China Investment:Which Way To Profit? By: Wang Yong; Chen WenBeijing Review,11/6/2003,Vol4
8、6 Issue 45,p10,4p, 1c;(AN 11588866)【实例】在参考文献列表里,期刊论文的著录格式是:刘志强我国农业生态环境可持续发展评价及对策J农业系统科学与综合研究,200l,17(3):24-26 【实例】英文参考文献格式:Fan LJ and BM Hu. 2000. A comparative study on three methods of estimating discrimination of test sites for the best genotypes. J.Biomathematics(China), 15(2):175-179(in Chinese
9、)其中“J.”是“Journal of”的缩写。“J.Biomathematics”是生物数学杂志。因此需要检索J of Biomathematics获取原文。,第1章绪论,2. 期刊,2内容特征 (1)内容新颖,能及时反映最新研究成果和动态。 (2)信息量大,发行与流通面广,便于获取。 (3)按期连续出版,便于研究者长期跟踪研究。,第1章绪论,2.期刊,3)类型 期刊按其性质和用途不同,可分为: (1) 学术性与技术性期刊主要刊登科学研究和生产方面的学术论文、研究报告、会议论文、实验报告等原始文献。 (2) 检索性期刊以期刊的形式出版的专供人们用于查找文献线索的一类刊物。 (3) 其他期刊
10、包括快报性刊物、资料性刊物等。例如:The Kiplinger Agricultural Letter。,第1章绪论,3.报纸,1)定义以刊载新闻和评论为主的出版周期较短的定期连续性出版物。 2)特点传递信息快,信息量大,现实感强,传播面广,具有群众性和通俗性,是重要的社会舆论工具和情报源。 3)分类按出版发行周期分为:日报、双日报、周报等按内容分为:时事政治类、科技类、商业类、文教类等。,第1章绪论,4. 专利,专利是专利制度的产物,广义上是指所有与专利有关的资料。狭义上的专利文献仅指专利说明书 1)形式特征 【实例】图1-2是一篇中国专利信息的著录格式: 2)内容特征内容新颖、技术性强、实
11、用性强并具有法律效力等特点。它是寓技术、法律和经济于一体的带有启发性的一种重要文献信息。,图1-2,第1章绪论,5. 标准,标准又称为规范 1)形式特征标准编号(标准号)是由“标准代号+顺序号+年代号”组成。2)内容特征 (1)法律约束力 (2)从技术的新颖程度看,当前的标准往往是5年前最新的专利。也有少数专利很快成为标准。,GB 7907-87 (核桃丰产与坚果品质)标准名称标准发布年号标准顺序号 标准代号,第1章绪论,5. 标准,3)类型 (1)按照使用范围划分中华人民共和国标准化法将我国标准分为国家标准、行业标准、地方标准、企业标准四级。【实例】标准号“GB/T 15310.3-1994
12、”表示1994年的国家推荐性标准。 (2)按照内容特点划分 方法标准【实例】 GB/T 19497-2004 农业车辆牵引车上钩型机械连接装置试验方法和要求。 术语标准 【实例】 GB/T 167861997 术语工作 计算机应用 数据类目,第1章绪论,6.学位论文,学位论文是高等院校或研究机构的学生为获取某种学位而撰写的学术论文。按学位的不同分为学士论文、硕士论文和博士论文。 形式特征 【实例】 图1-3是学位论文数据库收录的湖南大学的一篇硕士论文首页,图1-3,第1章绪论,6.学位论文,【实例】参考文献列表中的学位论文著录格式:熊回香.网络信息检索及其发展趋势研究(全文);硕士;华中师范大
13、学;20030501【实例】外文印刷型学位论文文摘的著录格式: 122:229172tSynthesis and Characterization of magnesium aluminum phosphates, and related compounds. Shea, Wei-Lu (Texas A and M Univ., TX USA)1994. 156PP. (Eng) Avail, Univ, Microfilms Int., Order No. DA 9432768. From Diss. Abstr. Int. B 1995, 55(7): 2726 注释说明:卷号;文摘号;论
14、文题目;著者姓名;著者工作单位和地址;出版年份;论文总页码;原文文种;学位论文出版发行单位;学位论文订购号;刊载学位论文摘要的刊名(本例为国际学位论文Dissertation Abstracts的B辑)、年、卷(期)、页码2)内容特征 (1)内容比较系统和完整 (2)学术性和独创性 (3)保密性,第1章绪论,7.科技报告,科技报告是指某项科研成果的立项报告、中试报告、中期阶段性报告、结题报告,或鉴定报告,是关于某项研究的阶段性进展总结报告或研究成果的正式报告。 1)形式特征 一般不是正式出版物,每件报告单独成册,有机构名称和统一的编号。 【实例】信息网络技术发展综述北京图形研究所 段米毅 张炜
15、清(中国公众科技网2001-11-12 14:56:55),第1章绪论,7.科技报告,【实例】美国能源部DOE科技报告的著录格式:120:229588sDOE complex buried waste characterization assesment: Buried Waste Integrated Demonstration Program.Kaae, P.S.; Holter, G.M.; Garrett, S.M.K.(Pac. Northwest Lab, Richland, WA USA). Report1993,PNL-8390; Order No.KE93007616,108
16、PP.(Eng)L Avail.NTIS.From Energy Res. Abstr. 1993, 18(4), Abstr. No. 7975注释:卷号;文摘号;论文题目;著者姓名;著者工作单位和地址;文献类型标志:本例为报告;报告时间;报告编写与订购号码报告总页码;原文种,英文;科技报告收藏单位。全称在化学文摘CA第1期文摘前可查到,收藏单位NTIS全称是美国科技信息服务局(National Technical Information Service);刊载报告摘要的刊名、年、卷(期)文摘号。2)内容特征内容较为成熟,专深具体,第1章绪论,8.会议文献,会议文献是指在各种学术会 议上发表
17、的论文、报告及其 他有关资料。 1)形式特征 (1)图书形式【实例】著录格式示例:122:234009eMethods for analysis of deamidation and isoaspartate formation in peptides and proteinsAswad,Dana W.; Guzzetta, Andrew W.(Department Molecular Biology and Biochemistry, University california, Irvine, CA USA).Deamidation/soasparate Form. Pept. Prote
18、ins 1995,7-29,(Eng).Edited by Aswad, Dana W. CRC: Boca Raton, Fla. 注释说明:卷号;文摘号;论文题目;著者姓名;著者工作单位和地址;会议录名称;会议时间:如无此项,表示会议录出版时间与会议召开时间年份相同;起止页;原文种;会议录汇编者。一般列主编,最多只列3名;出版社:所在城市、州或国家名。,第1章绪论,8.会议文献,(2)期刊形式【实例】下面是发表在期刊Journal of Pharmaceutical Biomedical Analysis的会议文献的著录格式示例:6742 PAVLI,V.;KMETEC,V.Optimiz
19、ation of HPLC method forstability testing of bacitracin. In 11 th International Symposium on Pharmaceutical Biomedical Analysis(PBA 2000),Basel,Switzerland,1418 May 2000.Edited by Francotte,E.R.;Lindner,W.Journal of Pharmaceutical Biomedical Analysis 2001 24(5/6)977982En,12 ref.Department for Stabil
20、ity Testing,Krka Pharmacerticals, Bbogisiceva 8,Novo mesto,1000 Ljublijana,Slovenia. (3)科技报告形式:部分会议论文被编入科技报告。 (4)视听资料形式:在开会期间进行录音、录象,会后以视听资料的形式发表 2)内容特征内容新颖,及时性强;学术水平高,专业性强,可靠性高 . 3)类型 会前信息、会中信息、会后信息,第1章绪论,9. 政府出版物,政府出版物是指政府部门及其所属机构所颁发出版的文献。1)内容特征政府出版物对于了解某国的科技、经济等方面的政策和事件有一定参考价值。2)类型(1)行政性文件(2)科技文件
21、,第1章绪论,10.产品样本资料,产品样本资料是指厂商或贸易机构为宣传和推销其产品而印发的免费赠给消费者的资料。 【实例】在Google检索到的“无荧光润滑剂”的产品资料简介产品名称:无荧光润滑剂 产品型号: (NF-2) 产品简介: NF-2 是由多种有机物精制而成。在钻井液中用作低荧光润滑剂使用。 具有加量少、效果好、不起泡、不提粘等优点。 产 品 指 标项 目 指 标 外观 白色或淡黄色油状液体 水份, 5.0 密度, g/cm3 0.90.05 荧光强度,级, 6.0 润滑系数降低率, 60.0 1)内容特征(1)形象直观(2)数据较为可靠 2)类型(1)根据出版形式划分 (2)根据其
22、内容划分,第1章绪论,11. 技术档案,技术档案是指在生产或科研活动中形成的有具体工程和研究对象的技术文件的总称。【实例】福建省科技档案馆的一个档案的简要资料是: 中亚热带常绿阔叶林生态采伐作业系统研究 时间:2005年9月8日 来源:科技档案馆 主要完成单位:福建农林大学主要完成人员:周新年、邱仁辉、杨玉盛、游明兴、潘仁钊省级成果登记号:200100741、主要内容选择皆伐作业的5种集材方式与采伐强度为30%的择伐作业,进行土壤理性质指标变化程度的比较。经主成分分析得出不同采伐、集材方式对林地土壤理化性质的干扰程度,并作出科学排序。2、技术特点(1)前期准备充裕,文献资料翔实,研究基础坚实。
23、(2)研究路线正确可靠。(3)充分利用已建立的长期定位基地,将其研究成果迅速大力推广。3、在国内外相关领域的作用、影响发表论文56篇,其中一篇被EI收录,26篇被其它国际权威文献收录,被国内外同行引用66次。产生间接经济效益6000万元。,第1章绪论,1.3 信息检索与利用的哲学与法律问题,1.3.1哲学问题 1.3.2法律问题,1.3.1哲学问题,树立对立统一的哲学观,全面认识信息检索过程中遇到的矛盾,找到正确的思路。 主要矛盾 1.信息资源的集中与分散矛盾 2.检索的简单化与复杂化的矛盾 3.用学科分类的检索途径与用词汇表达主题的主题检索途径的矛盾 4.检索效率的查全率与查准率的矛盾 5.
24、手工手段检索与计算机手段检索的矛盾 6.传统的实体图书馆与虚拟的网络化图书馆的矛盾 7.统一格式的信息检索与个性化检索服务的矛盾,第1章绪论,1.3.2法律问题,信息检索与知识产权 【例题】为何Google等网上搜索引擎不能检索到可以免费阅读的大学教材、专著、学位论文、期刊论文的原文?但是却能在专利局数据库免费检索到专利文献原文?,第1章绪论,1.4 信息检索与利用的意义,1.4.1与时俱进,跟踪学术最新动态 1.4.2节省科研时间,提高工作效率 1.4.3避免重复研究 1.4.4搞科技创新更要检索文献 1.4.5挖掘分析文献制定高明的市场谋略,第1章绪论,经典【案例】,日本是一个信息大国,善
25、于利用信息。20世纪60年代的中国对外严密封锁大庆油田的信息,地图上没有大庆。日本人无法获得大庆油田的信息,于是开始研究所有关于大庆的零星情报。仅靠当时中国的人民日报和人民画报的几段报道和几幅图片,就获得了深层次的信息。步骤如下: 1确定大庆的大概位置。看到画报封面王进喜(王铁人)的照片,王进喜身穿大棉袄,天下着鹅毛大雪,还有一幅照片的背景是广袤的黑色土壤的平原。日本人据此分析:大庆应该在东北,否则不会下这么大的雪,土壤不会是黑色。但是还是不知道大庆确切在哪里。人民日报有一个报道说:王进喜同志到了马家窑,说了一声好大的油海啊!我们要把中国石油落后的帽子扔到太平洋里去。日本人分析,马家窑就是大庆
26、的中心;“好大的油海”暗示油田的储油量很大。 2确定大庆的中心位置。 人民日报报道说,中国工人阶级发扬了一不怕苦二不怕死的革命精神,大庆的设备不用马拉车推,完全是肩扛人抬。 日本人分析:油田不会远离火车站,远了就拉不动设备。 后来日本派了一个经济间谍以游客身份到东北,研究铁路线,发现了油罐车,顺着铁路找到了离马家窑不远的车站。,第1章绪论,经典【案例】,3推算产油量和石油需求量。 1966年,王进喜同志光荣地参加了全国人民代表大会。 根据这一消息,日本人说大庆一定出油了,假如不出油,王进喜当不了人大代表。 根据人民日报上一幅钻塔的照片,以钻台上手柄的架式与几位操作工人手臂的对比,算出油井的直径是10多厘米,根据直径推算每天产油量。 结合中国国务院的政府工作报告公布的数据,把该年产油量减去上一年产油量,就得出大庆的石油产量,算得很准。 日本还预测,大约在1980年以后中国的工业将有较大发展,需要大量石油。 4提前设计适合中国专用的石油设备。 日本人根据中国当时的工业水平预测,中国无法自行设计制造石油设备,必然会向世界公开招标。 于是决定根据中国的需求特点预先设计石油化工设备。 果然,大庆油田出油后我国向世界很多国家征求设计都不成功,于是日本人说早就为中国设计好了! 结果日本人赚了我们不少钱。,第1章绪论,