1、信息检索与利用,刘林荫 Mail:lly_ 电话:15981917205 办公室:电气楼205,21世纪,是“知识爆炸”的时代,信息就像潮水向我们袭来,如何才能不被信息淹没,成为信息的主人呢?信息检索从本质上说是一个交流与学习的过程,既包括通过查询别人的或已有的历史成果与文献来寻求答案或者激发灵感,也包括通过向别人学习,请教来释解疑惑。,前言,定义:信息检索(information retrieval)是指从信息集合中迅速,准确地查找出所需信息的程序和方法。信息集合:有组织的信息整体。 1)数据库的全部记录2)某种检索工具3)图书馆的全部馆藏,那么,文献与信息纷繁复杂,浩如烟海, 对大学的用户
2、来说,但你是否知道有哪些资源是你需要的?又如何使用这些资源呢?,这门课的目的(Perpose)是什么?,目的:介绍文献信息及网上各类电子资源的内容,系统了解和较为熟练地掌握各类文献资源和网络数据库、电子期刊、图书、报纸的检索、浏览和下载方法,充分掌握从各种不同类型文献信息(纸质文献、电子文献和网络资源)中分析、滤选和检索技能。,下面从四个层次了解信息检索的作用:,通过信息检索,可以快速了解所参加的工作、生活、业务、设计等的基本知识。 通过信息检索与分析,一方面可以继承和借鉴他人的研究成果,避免重复或少走弯路。另一方面,可以开拓思路、提高效率、节省时间、减少人力或投资方面的费用。 通过信息检索,
3、建立跟自己密切相关的行业动态信息的获取渠道与范围,随时收集与掌握相关信息,培养行业信息的敏锐性。目前,各个行业的技术更新与市场变化都很快,要立足于某行业,就必须了解行业的发展变化。 通过信息检索,可以帮助识别信息。,课程教材:信息检索与利用邓发云,杨忠编著,科学出版社。 作业:实习题;要求:课后一周交作业,文本格式。 学生成绩评定方法:考勤、作业、考试相结合。 考勤占20%,作业占30%,期末考试(检索报告)占50%。,课程内容,第一讲 信息检索基础知识及搜索引擎(14章) 第二讲 中外文专业检索系统及数据库(58章) 第三讲 参考工具书及考试信息检索与利用(812章) 第四讲 信息检索综合应
4、用(1316章),第一讲 信息检索基础知识及搜索引擎,第1章 信息素养,第2章 信息源,第3章 信息检索基础,第4章 搜索引擎,第1章 信息素养,信息资源,生产要素,无形资产,社会财富,企业成功要素,技术,资金,人才,可以说:是否具有信息素养?,衡量一个人是否具有学习、创新和创业能力的标准。,1.1 数据、信息、知识、情报、文献的概念,1.1.1 数据(Data) 定义:泛指所有描述事物的形貌、特征、状态和任何其他属性的数字、文字或符号。 一般指原始的没有处理过的数据。 1.1.2 信息(information)现代汉语词典中的“信息”泛指一切音信和消息。 美国学者从管理学和计算机应用相结合的
5、角度来研究信息资源及管理问题,认为信息是有意义的数据,是经过收集、记录、处理和存储的可供检索的事实与数据 国内学者从哲学的角度定义信息。认为信息是普遍存在于自然界、人类社会和人类思维活动中的一种现象。 定义:信息是事物运动的状态和方式,是物质的一种属性,一般指数据、消息中所包含的意义。 信息定义多样化原因:复杂性,新兴学科,分支多等。,定义:知识是人们在改造世界的实践中所获得的认识和经验的总和,是人类的主观世界对客观世界的概括和反应,是大量有组织的信息,是关于事实和思想的有组织的陈述。信息是知识的原材料,知识是信息加工的抽象化产物。,1.1.3 知识(Knowledge),原苏联情报学家米哈依
6、诺认为:情报是作为存储、 传递和转换对象的知识。我国著名科学家钱学森认为:情报就是为了解决一个特定问题所需要的知识。现代汉语字典中的“情报”,特指关于敌情的报告。定义:“情报”可以理解为传递着的有特定效用的知识或信息。三要素:知识性、传递性和效用性。,1.1.4 情报(information),定义:记录有知识和信息的一切载体。三要素: 载体(文献的物质形式)知识(文献的内容)记录(信息的一种人工编码,通过人工,机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,即将内容固化在载体上的手段或方式)文献对人类文明进步具有重大的意义: 知识的积累、传播和创新; 研
7、究成果的确认和评价。文献信息:具有文献特征的信息。,1.1.5文献(literature),1.1.6 信息、知识、文献和情报的关系,注意:,文献只是载体,信息链:数据,信息,知识,情报的关系,被赋予现实意义,物理属性,表现、反应、转化,事实,情报,知识,信息,数据,认知属性,加工、吸收、提取、评价,信息和实践结合,被大脑激活,作用于人原有的那部分知识,举例说明:,数据:数值1,上课时间45分钟等 信息:1袋氯化铵肥料信息=数据+背景 知识:氯化铵肥料能使小麦高产知识=信息+经验 情报:为提供小麦高产选择施肥方式 情报=知识(信息)+大脑认知(激活),相互转化:,上面的例子中,“氯化铵肥料能使
8、小麦高产”这一表述,对于一位正在决定是施农家肥还是施氯化铵肥料的农民来说,无疑是一种情报,而对于一般的大学生来说可能仅是一种知识,对于城市的纺织工人或许只是一条一般的信息。,信息环境及其认识,信息环境的变化 20世界90年代中前期 书本时期手工检索 微缩时期微缩检索 20世界90年代后期 光盘时期单机检索 网络初期联机检索 21世纪 网络兴盛网络检索,教育的未来(视频),我们所处的信息环境是不断变化的 信息技术条件对信息环境的变化是革命性的 信息环境影响、催化或在一定程度上决定了人们的信息需求,你的信息环境和信息资源,图书馆印本资源(学校图书馆,其他图书馆) 图书馆网站及其服务 数据库(仅仅处
9、于你信息环境中的信息才方便使用) 网络信息资源 泛信息环境:人、通讯(手机)、传统媒体(广播、电视),1.2 信息素养概述,可以说,具备信息素养的人是一个有能力觉察信息需求的时机并且有检索、评价以及高效地利用所需信息的人,是一个知道如何学习的人,是一个道德品质高尚的人。,信息思考力,信息技能,信息道德,对信息的敏锐,时刻追求新知识的热情,对获得的信息进行鉴别,辨识,选择,创新知识的能力,获得,处理信息的能力,包括“检索,组织,使用”等技能,继承已有研究成果,尊重知识产权,不抄袭剽窃,信息有各种来源和形式,如打印文本、电视、视频、图书馆数据库、网站等等。一个具备“信息素养”的人能够知道自己为什么
10、、什么时间和如何使用这些信息来源,并且对信息源提供的信息质量有敏锐的洞察力。,“信息素养”教育是国内外教育发展的另一个重要趋势,这种教育并不是单一的信息获取能力的培养,而是认识各种信息源,检索,评价和使用信息的综合能力教育。你不可能一夜之间就具备信息素养。象培养阅读,写作能力一样,你需要不断地从课题检索过程中获得经验,在寻找,选择和评价你遇到的信息和思想中,你的信息素养 就逐渐提高了。,小结,信息是事物的运动状态和方式的反映 知识是大量有组织的信息 文献是记录有知识的一切载体 从信息到知识到情报是不断深化的过程 信息,知识和情报之间在一定条件下是可以相互转化的 信息知识文献 文献信息:具有文献
11、特征的信息,通过学习,我们应该知道:,第2章 信息源,信息源是人们为满足信息需求而获得信息的来源。在各类信息源中文献信息源是人们记录信息和交流信息的首要选择。 工作和学习中获取及时又准确的信息是很重要的。信息源可以是不同类型的文献,也可是政府、行业协会、公益信息服务部门(公共图书馆等)、媒体、中介咨询机构、居民个人等。熟悉信息源分布情况,有利于信息用户高效得获取信息。,在学习下面内容的同时,请思考一下以个问题:1.哪些资源你可以通过网络在线找到?2.哪些资源可以引导你获得自己想要的信息?3.哪些资源是你写研究论文所必要的?,文献信息源(信息资源)划分示意图,2.1 按出版形式划分(文献信息源)
12、,2.1.1科技图书 科技图书 是单册出版的正式公开出版物,是对某一知识体系进行阐述或对已有研究成果、技术、经验等体系进行归纳、概括而形成的出版物,是含有独创性内容的专著。图书是最常见的文献形式。图书可以包含任何内容,学习、研究、消遣都可以找到适合的图书。网络时代,电子图书也很流行,电子图书也称为e-book,可以在线付费阅读或者从图书馆网上免费获取。,下列情况下会用到图书: 1.系统地学习知识; 2.了解关于某知识领域的概要; 3.查找某一问题的具体答案。,又称连续性出版物(serials),是一种定期或不定期连续出版的文献载体,它一般有同样的名称,按一定事件编定卷好,每一卷又分若干期。其类
13、型有:1.学术型,例如中国科学、科学通报等。2.快报型,例如Chinese Chemical Letters等,这类期刊不刊登研究性论文,而仅仅是有关某一领域的发展动态、前沿报道、综述等文章;3.资料型,例如国际资料信息等;4.休闲型,又被称为“杂志”。例如时装、读者等。,下列情况会用到期刊: 1.当做学术研究时,了解与自己课题相关的研究状况,查找必要的参考文献; 2.了解某学科水平动态。,2.1.2 期刊(periddical),杂志,像期刊和报纸一样,是连续出版物的一种,但是它的内容一般都是通俗的,或者娱乐、新闻等。电子杂志,又叫e-zines,可以从网络上或者图书馆的电子资源收藏中得到。
14、,1.寻找关于流行文化的信息和观点; 2.得到当前事件的实时信息; 3.找寻供某一领域非专业人士阅读的文章。,学术期刊和流行杂志都被称为连续出版物,因为他们是有规律或定期出版的,但是他们之间存在许多不同之处。了解这些区别对学习和研究时很重要的,下面说明两者的不同之处。,下列情况会用到杂志:,2.1.3杂志,学术期刊和杂志的区别,杂志适合普通读者阅读,内容涉及到生活的方方面面,体育或电影明星,生活、娱乐、故事等 杂志往往有许多照片和广告 杂志上刊登的文章一般不长 杂志的出版周期通常比学术性期刊短,学术期刊适合学者、研究人员及教授阅读 刊物名称中一般有“学报”等字样,容易辨认 学术期刊中较少照片和
15、广告 学术期刊刊登较长、有深度的研究文章 学术期刊通常由学术或专业机构主办,数据库是数字化图书馆主要的资源形式,全文数据库是目前最常见、也最受读者欢迎的数据库,比如中文的有“中国期刊”、“万方数据资源库”、“维普中文期刊全文数据库”,英文的有“ScienceDirect OnSite(SODS)全文电子期刊”、等。除了全文数据库以外,文摘型数据库在学习与研究中也必不可少,如著名的工程索引(EI)、科学引文索引(SCI)等。,在哪里能找到这些图书库呢?我校图书馆购买了大量的数据库供本校范围内的用户使用, 在http:/:12000/上可以找到。,2.1.4 数据库,1.当你要完成一篇论文,写文献
16、综述时; 2.了解某学科领域或某一问题的研究现状,发展趋势时; 3.当你知道一篇文章的简单信息,想要了解更多或希望找到全文的重要线索时; 4.当做学术研究时,了解与自己课题相关的研究状况,查找必要的参考文献; 5.了解某学科水平动态; 6.当你想获得一篇文章全文时,全文数据库是你最理想的选择.在第2讲中我们将详细介绍检索数据库方面的知识。,下列情况会用到数据库:,2.1.5 报纸,通常每天或每周发行,它收集了时事和新闻的各种文章,所以阅读报纸是为了了解时事与新闻的最佳途径。许多报社在它们的网站上发布最近的新闻和相关评论。所以报纸的最大优势是时效性强。,下列情况下会用到报纸:1.为了找到关于国际
17、、国内和本地事件的最新消息。2.为了找到社论、评论、专家或者大众的观点。,2.1.6 会议论文,会议论文是指在各种学术会议上宣读的论文、产生的记录及发言、论述、总结等形成的文献,会议论文的形式与期刊文章基本相同。会议论文一般以会议论文集的形式出版发表。有很多学会的会议论文集逐年连续出版,已形成类似于期刊的连续出版物。很多文章都是最先以会议文献的方式公开,会议文献是了解世界水平动向的重要途径和获取科技情报的重要来源。,以下情况会用到会议文献: 1.当做学术研究时,了解与自己的课题相关的研究状况,查找必要的参考文献; 2.了解某学科水平动态。,2.1.7学位论文,学位论文是高等学校和研究机构的学生
18、在学业结束时,为取得学位资格向校(院)方提交的学术性研究论文。博硕士论文大多质量较高,有新的消息,是一种很有参考价值的文献。,下列情况会用到学位论文: 1.科学研究开题前的文献调研; 2.博硕士生撰写开题报告时。,专利文献是实行专利制度的国家及国际性专利组织在专利申请、授权等过程中产生的官方文件出版物,包括专利的各种说明书、专利公报、专利文献出版物和专利索引等,专利说明书:主题和对象。全世界发明创造成果约90%-95%首先出现在专利文献中,而且一般80%以上的专利文献不会再以其他形式(论文、会议等)发表,专利文献对于了解各个领域的最新技术水平非常有价值。各国专利法还明确规定,申请专利的发明创造
19、必须具备工业实用性。因此,专利文献比一般的科技文献更有实用性。,2.1.8 专利文献,下列情况会用到专利文献: 1.在申请专利前,检索相关的专利文献,确定该项发明创造是否能被授予专利权。 2.开发新产品,投入新项目,先查专利文献,寻找技术方案。 3.从专利文献中了解某领域的技术水平及发展的最新动态。 4.开发新产品前,检索专利,了解现状,避免侵权。 5.利用权力情报,参谋进出口业务 6.专利诉讼时,帮助寻找证据,处理专利纠纷,标准文献是按照规定程序编制并经过一个公认的权威机构批准的,对工农业新产品、工程建设、对外贸易和文化教育等领域的质量、规格、参数及检验方法所所的规定。 标准文献中记录的数据
20、,是经过严格的科学验证取得的,并且随着科技发展和时间的推移,不断修订、补充和废除。按标准的使用范围,中国习惯上将标准分成四级:国际标准、国家标准、部颁标准和企业标准。按标准的成熟程度,可分为:强制标准、推荐标准、试行标准和标准草案。我国标准结构形式为:标准代号+标准编号+发布年份,如GB3935-1-83。,2.1.9 标准文献,1.产品设计、生产、校验2.工程设计、施工3.进出口贸易4.写作、文献著录等,下列情况下会用到标准文献:,科技报告是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门汇报其研究设计和项目的成果或进展情况的报告。内容大多专深、
21、新颖、详细,涉及尖端学科或最新研究课题。科技报告会在一定时期内保密。,2.1.10 科技报告,1.当做学术研究时,了解与自己的课题相关的研究状况,查找必要的参考文献 2.研究尖端学科或某学科的最新研究课题,下列情况会用到科技报告:,2.1.11技术档案,指科研生产活动中形成的,有具体事物的技术文件、图纸、图标、照片和原始记录等。详细内容包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、设计资料、试验和工艺记录等。这些材料是科研,生产过程中用于总结经验,吸取教训的重要文献。技术档案一般为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少使用。,
22、2.1.12 产品资料,指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。产品样本一般对定型产品的性能、构造、用途、用法和操作规程等作具体说明,内容成熟,数据可靠,有的有外观照片和结构图,可直接用于产品的设计制造。 产品技术资料著录的特点是:产品技术资料著录的特点是:通常有表示产品样本一类资料的词,如Catalog,Guide book,Master of,Databook of等;有公司名称。产品技术资料一般向厂商直接索取,在情报所可以查到一部分,有些以汇编形式正式出版的可以在图书馆查到。 如网易电子样本服务:http:/ 百科全书,百科全书是知识的总汇,是一切知识门类广泛的概述
23、性著作,收集了大量简短的、事实性的记载,有来自不同领域的有权威的学者撰写。有两种类型的百科全书综合性、专业性。综合性百科全书:中国大百科全书大英百科全书;专业性百科全书:计算机科学百科全书经济学百科全书。查找百科全书地方:图书馆、互联网。当你对一个知识点需要有概括的,全面的了解时,百科全书是最好的选择。,2.1.14 网络,www上的信息内容广泛,无所不有,出了文本信息,还包括图像、声音、视频信息,它的主要特征是超文本,从一个信息快速链接到另一个信息。 网上发布信息有这样一些群体: 大学每个大学都在互联网上建立了自己的站点,通过某个大学的主页,可以了解他们院系和学科设置,了解他们科研和教学的实
24、力,找到各职能部门的联系方式。通过您使用的计算机在某大学的IP范围内,你可以免费获得他们的教育资源,如制作精美的课件,图书馆购买的数据库、电子图书等。 政府机构为了大范围的信息资源共享和政府政策的公开和透明,政府机构把许多政策性文件与相关法律法规条文、数据等发布到网上,你不需要缴纳任何费用,也无须任何注册便可以看到这些信息。,公司网络是公司进行商业宣传与广告的最佳空间,也可以通过网络了解一家公司的人员、规模、联系方式等信息。 学术组织许多组织建立自己的网站,通过他们的网站可以了解他们的议程和观点。通过学术性组织的网站,还能找到高质量的学术论文。 图书馆图书馆是网络上优质信息的主要提供者,他们购
25、买许多价格不菲的数据库,学术期刊、会议论文、电子图书、学位论文等,几乎涵盖了你做科学研究和学习知识的所有的文献形式。图书馆必须授权自己的用户,用户才能使用购买的资源。,下列情况下会用到www资源: 1.了解时事新闻 2.获得公司或各级政府的信息 3.免费获取的学术资源 4.参与BBS论坛,发表对某一问题的看法,了解别人的意见。,2.1.15 Email,特点:方便快捷,适用于学术交流,请教问题等。好地利用电子邮件会给你的学习与研究带来及时的信息,这些信息是通过其他信息渠道无法获得的。,下列情况会用到Email: 1.为了得到在某个领域的专家的意见,与他们交流; 2.向图书馆的咨询官员请教有关文
26、献信息获取与利用方面的问题; 3.享受信息推送服务:图书馆有了新的资源或新的服务,往往通过e-mail发给它的用户; 4.通过e-mail去实现数据库的个性化服务。,以上的介绍使你了解了各种各样的资源信息,那么,如何选择你需要的信息呢?,下面的图标显示了信息资料类型与你的信息需求的关系。,注意,不要过多地依靠单一的信息源,这样你可以得到更充分,更有利的观点。,1)零次文献零次文献是一种特殊形式的情报信息源,包括两个方面的内容:一是形成一次文献以前的知识信息,即未经记录,为形成文字材料,是人们口头交谈,是直接作用于人的感觉器官的非文献型的情报信息;二是公开与社会,即未经正式发表的原始文献,如书信
27、、手稿、记录、笔记等 2)一次文献一次文献也称为原始文献,一般指知识的直接生产者记录的最初发现、发明、新理论、新方法、新见解为原始内容出版的原始文献,包括期刊论文、研究报告、会议记录、专利说明书、学位论文等。,2.2 按信息内容的加工深度划分,3)二次文献二次文献是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼、著录其特征(著者、著录、分类号、出处、文摘)等,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。其主要类型有目录、索引、文摘等。 4)三次文献三次文献是围绕某个专题,在二次文献的基础上,选用大量相关一次文献,并对内容进行综合、分析、研究而编写出来的文献。这
28、类文献有综述、评论、评述、进展、动态等。,信息处理级别(加工深度)示意图,2.3 按载体形式划分,1)印刷型文献印刷型即书本型,也称纸介型,是一种以纸介质为载体,以书写或印刷方式为手段而形成的文献类型。它是一种技术含量低,对个人使用非常方便的一种文献,人们对它司空见惯,是最常用的一种文献载体。上千年来它在人类的阅读,流通中功不可没。优点:易携带、易阅读、可做标记、个人可支付、可存档、可占有、可保存。缺点:信息密度低、容量小、加工,整理需要人力,体积庞大,不易长期保存。 2)缩微型文献以光学材料和技术生成的文献形式,经历了一百多年的历史,在全息照相技术出现之前,一般只是将文字,图像等信息符号进行
29、等比的缩放。如缩微胶卷、缩微平片。特点是存储密度大、体积小、便于保存和传递,但必须借助专门的设备才能阅读。,声像型文献是采用录音、录像、摄影、摄像等手段,将声音、图像等多媒体信息记录在光学材料、磁性材料上形成的文献,也称视听型文献,如音像磁带唱片、幻灯片、激光视盘等,特点是形象,直观,尤其适于记录用文字、符号难以描述的复杂信息和自然现象,但其制作、阅读需要利用专门设备。,3)声像型文献,也称为电子型,所谓“机”现在就指计算机,微机,通过计算机对数据的存取和处理,完成文献信息的数字化,形成电子型文献及形形色色的电子出版物。包括“电子图书、电子报刊、电子新闻、电子会议录等等”,机读型的版本有磁带版,磁盘版,光盘版,联机版以及最新的网络版。特点是信息存储量大、出版周期短、易更新、传递信息迅速,存储速度快,可以集文本、图像、声音等多媒体信息于一体,信息共享性好、易复制,但必须利用计算机才能阅读。,4)机读型文献,小结,信息源的三大划分标准:编辑出版形式,处理级别,载体形式。其中前两种及其重要。 不同的需求选择不同的信息源。 哪些信息源是你撰写学位论文所必须的。 网络资源和数据库涉及到各种类型的信息资源。 根据“信息源划分示意图”理解不同信息源划分之间的关系。 根据“信息处理级别示意图”理解不同形式的信息源之间的关系。,