1、信 息 检 索,张 怀 涛2013-11,人一出生就生活在信息的海洋里,人的一生都离不开信息。在人类生存和发展的过程中,信息是人们进行沟通、交流的纽带。自从20世纪40年代人类发明了计算机、创造了信息论之后,就开始逐步进入了信息社会。信息社会是一个需要不断学习和创新的社会,因而信息对个人的成长、组织的发展、社会的进步,更为至关重要了。1972年5 月,联合国教科文组织国际教育发展委员会在学会生存教育世界的今天和明天一书中说:“特别在现代社会中,我们通过变化日新、数量日多的渠道接受了大量的信息。如果我们要确切地处理这些信息,我们就要具备系统的知识、才智和技能。”,我国高等学校在20世纪80年代就
2、把大学生信息素养的培育放在了显著地位,教育部曾几次下文提倡开设“信息检索”有关课程:教育部1984年印发了关于在高等学校开设(文献检索与利用课)的意见;1985年又印发了关于改进和发展文献课教学的几点意见;1992年再次印发了文献检索课教学基本要求。2010年7月第四次全国教育工作会议召开,在随后颁布的国家中长期教育改革和发展规划纲要 (2010-2020年)中指出:“鼓励学生利用信息手段主动学习、自主学习,增强运用信息技术分析解决问题能力。”,我们开设“信息检索课”,正是为了增强大学生的信息意识,提高大学生获取信息、利用信息的能力,从而提高大学生自主学习、独立研究、勇于创新的良好品质。“信息
3、检索课”的三个特点: (1)方法性:科学方法课,重在规律把握,不同的检索系统有不同,也有相同。师父领进门修行在个人。 (2)实践性:拳不离手,曲不离口。 (3)发展性:多变常变,注意动向。,第一讲信息资源与信息素养,信息检索初步,一、信息学习一种知识,探讨一门学问,都要有有一个相应的逻辑起点,“信息检索”这门学科的逻辑起点就是“信息”。1.信息的概念“信息”一词大家都不陌生而且,古已有之。很多专著和工具书都认为“信息”一词在汉语中最早出现在南唐诗人李中(约920974年在世)的暮春怀故人一诗中:“梦断美人沈信息,目穿长路倚楼台。”实际上在此之前,唐代建中年间(780783年) 中进士第的诗人崔
4、备在清溪路中寄诸公一诗中就有“别来无信息,可谓井瓶沉”的诗句。,我国台湾学者用 “资讯”。英、美、法等国使用Information一词。日本用“情报”。“信息”一词的使用虽然已相当普遍,但到底什么是“信息”,众说纷纭。目前其定义有几十种,这些定义从不同侧面反映了信息的属性和特征。,日常用语,信息就是人们熟知的“音信、消息”。亲友书信、朋友电话、报刊新闻、电视报道、单位通知等,均会给我们带来有关的信息。科学术语,则有狭义于广义之分。 广义指“事物属性的表征”,包括事物表现出的各种各样的性质和特点,如状态、外形、构造、成份、声音、滋味、运动、变化、与其他事物的联系等。 狭义指“系统传输和处理的对象
5、”,如通信系统传递的信号、计算机系统输入输出的数据、企业管理系统使用的资料、大众媒介系统采播的新闻等。,实际上,任何一种音信和消息,任何一个系统传输和处理的对象,都不外乎是关于某一事物或某些事物的本质属性或非本质属性的反映,因此,信息的日常用语含义与科学术语含义、狭义含义与广义含义是相通的。,二、信息的特点(1)普遍性。信息广泛存在于自然界、人类社会及思维领域之中,人之间、机器之间、人机之间、动物之间、植物之间、细胞之间等,都可以进行信息交换。处处留心皆信息,欧元、钱包。(2)客观性。信息虽然看不见、摸不着,但是它对于人类,确实是可以被人感知、被人处理、被人利用的,它对于自然界确实是可以被信息
6、接受体所接受、可以对接受体产生作用的,所以信息是客观存在的。,(3)无限性。事物的存在方式是多样的,事物的发展变化是永无穷尽的,因而信息也是无限的。就浩瀚的宇宙太空而言,物质是无限的,信息是无限的;就无始无终的时间长河而言,物质的更替和人事的代谢是无穷无尽的,信息因而也是无限的;即使在有限的时空中,由于物质的多样性和物质运动的连续性,信息也是无限的。(4)动态性。信息随着客观事物的不断变化而不断更新,信息从信源、经过信道、传递到信宿也是一个动态过程。客观事物本身都在不停地运动变化,信息也在不断发展更新。信息只有被传递才能发挥作用,传递的速度越快,发挥的作用也就越大。,(5)异步性。一般包括滞后
7、性和超前性两个方面。信息脱离源物质后需要经过输入、处理、传递和输出等过程才能为人们所理解和掌握,而此时源物质往往发生新的变化、这些信息因而就成为“过时”的信息;人们在掌握大量信息的基础上,又可以通过计划、预测等方式测知未来的信息,超前于现实。(6)寄载性。信息必须依附于一定的物质形式(如声波、电磁波、纸张、化学材料、磁性材料等等)之上,不可能脱离物质单独存在。信息没有语言、文字、图像、符号等记录手段便不能表述,没有物质载体便不能存储和传播,但其内容并不因记录手段或物质载体的改变而发生变化。,(7)相对性。信息使用价值的实现相对于不同的信息使用者是不同的。同一个信息,不同的使用者由于其自身的素质
8、、修养、认识能力、认识目的、所储备的先验信息以及所处的环境的不同,因而获取的内容及信息量也不相同。(8)可塑性。信息可以被感知接受和加工处理,可以进行各种载体的转换。人类可以通过自己的感觉器官去感知信息,进而识别信息的内容,并接受它。感知后的信息,可以由认识主体进行加工处理成自己所需要的形式,既可以进行各种表意型载体的转换(如将一篇中文论文翻译为英文),也可以进行物质型载体的转换(如将自己唱的一首歌录入磁带。,(9)易扰性。信息是通过信道进行传递的,而信道在信息传递时会产生干扰和阻碍作用,如信息传输系统中产生噪声就是一种典型的干扰。信息脱离源物质后则相对独立,人们容易凭主观想象来理解它,往往会
9、产生虚假信息;或由于人们的动机不纯而产生作伪信息。“三人成虎”、“谎言重复一千遍就变成真理”。(10)共享性。共享性是信息区别于物质、能量的重要特征。英国作家萧伯纳关于“苹果和思想”的名言形象地说明了信息的共享性:你有一个苹果,我有一个苹果,交换之后双方各有一个苹果;你有一个思想,我有一个思想,交换之后双方就都有两个思想了。开玩笑:牛顿的苹果,乔布斯的苹果,萧伯纳的苹果。,二、信息资源1信息资源的概念“信息资源”的概念产生于20世纪60年代末、70年代初。世界资源可简要分为物质资源、能量资源、信息资源三部分。信息资源:经过人类选取、组织、序化的有用信息的集合。,2信息资源的特点(1)社会性。信
10、息普遍存在于自然界和人类社会,而信息资源则是人类社会的产物,它通过特定的符号表述和传递,可以在特定的社会条件下广泛地往复地为人类所利用。信息资源不仅是社会生产力的反映,而且任何一类信息资源,都几乎不是孤零零存在的,而是与诸多的社会条件密切联系。(2)人工性。信息作为物质或事物运行的状态与方式,无论人类是否感知它,它都自然客观存在的。信息的资源化离不开人类的参与。信息资源的生产、形成乃至组织、建设、开发、利用,无不打上人类加工的烙印。信息资源的人工性特点正是我们建设、开发、利用信息资源的理论依据。,(3)稀缺性。信息是无限的,有物质的地方就一定有信息存在。物质取之不尽,信息就用之不竭。信息资源仅
11、是信息中的一部分,是经过人类选择的有用的那部分信息,是有限的。从人类对信息资源的需求来看,是无限的,与这种无限的需求相比,人类拥有的信息资源则永远是有限的。(4)有序性。信息浩如烟海,且杂乱无章,处于一种混沌无序状态。而信息资源则是人类按照一定次序组织起来的信息,具有序列性。就既定的信息资源而言,它必定是不同内容的信息集合,集合中的每一信息都具有独特的性质。,(5)再生性。信息资源在满足社会需求和利用的同时,不仅不会被消耗掉,还会生产出新的信息资源,而且信息资源利用得越多越广,其效用发挥得就越充分,创造出的新信息就越多。发明家利用专利信息设计出新的产品,学者查考大量书刊资料创作新的专著,均说明
12、信息资源利用的结果是再生新信息。(6)累积性。一条信息构不成信息资源。只有经过一定时间积累使信息达到一定的丰度和凝聚度,才能成为信息资源。正是这种积累性,才使不断流散在空间和时间中的信息,能够汇集到信息机构,跨越时空限制从不同角度、不同方向满足人们特定的信息需求。日记,(7)价值性。传统的物质经济活动主要依赖于物质原料、劳动工具、劳动力等物质资源和能源资源的投入,现代的信息经济活动则主要依赖于信息、信息技术、信息劳动力等信息资源的投入。正确而有效地利用信息,可以在同样的条件下创造出更多更好的物质财富,可以开发或节约更多的能量,可以节省更多的时间。(8)多用性。信息资源与经济活动相结合,使信息资
13、源具有很强的渗透性,可以广泛渗透到经济活动的方方面面。同一信息资源可以作用于不同的作用对象上,并产生不同的作用效果。对信息资源的使用方向进行选择,这样就产生了信息资源的有效配置问题。,(9)不可分性。信息资源在生产过程中是不可分的。信息生产者为某个用户生产一组信息与为许多用户生产同一组信息比较起来,二者所花费的努力(如费用、难度等)几乎是一样的,如个人计算机应用软件包,当其被开发出来以后,生产一个拷贝与生产多个拷贝在工作量以及费用上的差别是微不足道的。(10)非消耗性。物质资源和能源资源是可消耗的,在消费和使用中最终消灭其独立的物体形式和使用价值,因此物质资源和能源资源不会在使用中再生,也不会
14、表现为任何方式的积累。而信息具有共享性,信息资源则具有非消耗性。当物质资源或能源资源一定时,甲乙双方在资源利用上就存在着竞争关系,即若甲多则乙少,反之亦然。物质经济以大量消耗物质、能源为代价,建立在信息资源基础之上的信息经济则完全不同,它使人们的眼光转向了信息。,3信息资源的类型体载信息资源实物信息资源文献信息资源网络信息资源,(1)体载信息资源 以人体为载体并能为他人识别的信息资源。按其表述方式又可分为:口语信息资源是人类以口头语言表述出来但未被记录下来的信息资源。如谈话、授课、讲演、讨论、唱歌等。体语信息资源是以人的体态表述出来的信息资源。如表情、手势、姿态、舞蹈等。,(2)实物信息资源
15、指以实物为载体的信息资源。依据实物的人工与天然特性又可将实物信息资源分为:天然实物信息资源:以自然物质为载体。人工实物信息资源:以人工实物为载体 (如产品、样品、样机、模型、雕塑等)。,(3)文献信息资源以文献为载体的信息资源。依据其记录方式和载体材料可分为五大类:刻写型文献信息资源包括:手稿、日记、原始档案、碑刻等;印刷型文献信息资源包括:图书、报刊、特种文献资料、档案、图片、舆图、乐谱等;缩微型文献信息资源包括:缩微胶片、缩微胶卷、缩微卡片等;机读型文献信息资源包括:磁带、磁盘、光盘等;视听型文献信息资源包括:唱片、录音带、电影胶带、胶片、幻灯片等。,图书具有独立的内容体系、相当篇幅和完整
16、装帧形式的文献。图书包括单卷书、丛书、专著、教科书、工具书等。美国各大学的科学家和英国电气工程师阅读的文献中,图书分别占19%和14%。,依据其出版形式可分为三大类:,连续出版物 有统一的题名,有数序或时序标识,计划无限期分期连续刊行的文献。 报纸:逐日或逐期,以大版面、散页形式刊行,主要刊载新闻和评论的连续出版物。,期刊:按相对固定的出版周期成册刊行,有卷期或年月等标识,每年不少于两期的连续出版物。在科研人员利用的各类文献中,科技期刊占65%以上。,特种文献 出版形式较特殊的文献的总称。,科技报告:科研工作成果的系统总结,或是研究过程中课题进展情况的实际记录。内容专深具体,数据完整;往往是最
17、新成果。,会议文献。各种会议上发表的文献。其特点是内容观点新。会议文献分会前文献和会后文献。,专利文献:广义指专利局出版的与专利有关的各种文献如专利公报、分类表、索引、说明书等。狭义仅指专利说明书。专利说明书具有新颖性、创造性和实用性等特点,是专利文献的主要部分。,政府出版物:各国政府部门及其专设机构所发表出版的文件。可分为行政性文件(国会记录、政府法令、政策、统计等)和科技文献。有助于了解一个国家的政策及其变化情况。,标准文献:由标准及其它具有标准性质的类似文件组成的一种特定形式的文献体系。可靠性和针对性强;具有法律约束性。,产品资料:各国厂商为推销产品而出版发行的各种商业性宣传资料,如公司
18、介绍、产品目录、产品样本、产品说明书等。,技术档案:生产建设和科学技术部门在技术活动中针对具体工程对象所形成的技术文件的总称。包括任务书、协议书、技术指标、审批文件、研究计划、实施方案、技术措施、技术调查材料、设计计算、试验项目、设计图纸、工艺记录等等。,(4)网络信息资源 从计算机技术、通信技术、多媒体技术相互融形成的网络上可查找到的信息资源。可分为:非正式出版信息,指流动性、随意性较强的,信息量大、信息质量难以保证和控制的动态性信息。如电子邮件、专题讨论小组和论坛、电子会议、电子布告板新闻、博客等方面的信息。,半正式出版信息,又称“灰色”信息,指受到一定产权保护但没有纳入正式出版信息系统中
19、的信息。如各种学术团体和教育机构、企业和商业部门、国际组织和政府机构、行业协会等单位介绍宣传自己或其产品的描述性信息。,正式出版信息,指受到一定的产权保护,信息质量可靠,利用率较高的知识性、分析性信息,用户一般可通过万维网查询到。如各种网络数据库、联机期刊和电子期刊、电子图书、电子报纸等。,三、信息需求1.信息需求的概念 信息需求是人们在从事各种社会实践活动的过程中,所产生的获取信息的需要和要求。 用户的信息需求是其产生获取信息积极性的原动力。 如同生物界的生物生存需求一样,人存在于社会之中也必然产生各种各样的社会需求。信息需求是人类社会总需求中的一部分。人们在政治、军事、经济、科学、文化、教
20、育等社会活动中,会遇到各种各样的问题,为了很好地解决这些问题,需要了解前人、今人对这些问题所做过的努力,这就产生了一种对信息的需求。正是这种需求才推动人们去积极地获取和利用信息,进行发明创造,推动社会进步。,美国心理学家AH马斯洛进一步提出了“需求层次论”,他将人的需求归纳为五个方面:生理需求;安全需求;社会需求;尊敬需求;自我实现的需求。事实上,人类的需求可进一步概括为两大类:一是物质需求,如马斯洛说的生理、安全需求;二是精神需求,如马斯洛说的社交、尊敬、自我实现需求均属此类。显然,人类的信息需求属精神需求,而且还是一种高层次、高级别的精神需求。随着社会的变革、经济的发展和科技的进步,人类的
21、总体需求在不断扩大,人类的信息需求亦将日趋大量化、专深化和高级化。,2.信息需求的类型人们的信息需求千差万别。(1)按需求主体划分 社会需求。即一定时期全社会对某类信息的需求。 团体需求。即不同类型用户群对信息的需求。 个体需求。指单个用户对信息的需求。(2)按需求表现划分 现实需求能以提问的形式表现出来,容易被用户自己和别人识别; 潜在需求虽被意识到了但还没有或无法用语言表述出来,但在别人或别的客观条件的提醒和刺激下会被表达出来,成为现实需求。讲座、课程。,(3)按需求目的划分 娱乐型需求。主要指借助信息进行消遣和欣赏的需求。学习型需求。指为应付某种考试或为系统学习某专业的理论而提出的信息需
22、求。释疑型需求。指为解决工作中的各种疑难问题而产生的信息需求。研究型需求。指为研究某一课题而产生的信息需求。,3.信息需求的内容构成(1)对信息内容的要求。信息的内容反映信息所属的学科、主题,如“生物信息”、“经济信息”、“环保信息”等;(2)对信息形式的要求。信息的形式是多方面的,比如,是“知识型信息”还是“消息型信息”,是“政策信息”、“市场信息”还是“产品信息”等。(3)对信息来源的要求,包括信息来源范围和载体形式等。用户对这些方面都会有不同的要求。,(4)对信息获取方式的要求。主要有正式途径与非正式途径,或称“直接交流与间接交流”、“组织化的有序交流与非组织化的无序交流”之别。用户会因
23、所需信息类型的不同而选择不同的途径。(5)对信息获取方法的要求。对“怎么要”(查寻方法)提出具体要求。查寻方法的要求主要是对信息检索工具和检索方法的要求。,4.信息需求的特点(1)多样性与层次性。由于用户类型复杂多样,再加上各自在年龄、性别、职业、文化程度、个性心理等方面存在着差异,使得不同的用户有着不同的信息需求,导致了信息需求的多样性。信息需求又是可划分为一定层次的(摘要、全文;生活的、学习的)。(2)动态性与转移性。用户的信息需求不是静止、固定的,而是不断发展、变化的。一种需求满足后,会出现另一种需求;原有的需求满足后,会产生新的需求;低层次的需求满足后,又会产生高层次的需求。,(3)社
24、会性与时代性。用户的信息需求常受社会环境、时代风尚的影响,表现出很强的时代感。社会提倡什么,流行什么,都会影响或强化用户的信息需求。如古代的科举取仕使得“四书五经”成为当时知识分子的必读之书;20世纪90年代的“股票热”、“期货热”、“房地产热”、“网络热”等,又使这方面的信息成为热门。 (4)从众性与逆反性。从众性与逆反性是人类普遍具有的一种心理现象,这种心理现象在用户的信息需求方面表现得也很突出。作为用户应自觉克服这种心理偏差;作为信息服务机构应对这种需求加以帮助和引导,使用户的信息需求转移到正确的、积极的、健康的轨道上来。,四、信息素养信息素养是指人们在获取、利用信息的过程中,自身必须具
25、备的基本条件及其有机构成。在信息需求增长、信息传递渠道畅通的情况下,能否很好地开发利用信息资源,用户的信息素质是一个非常重要的因素。用户的信息素质主要取决于以下四个方面。,1.信息意识 意识是人脑对客观现实的自觉反映。生活在一定环境中的人,必然对其周围的事物产生某种反映或判断。信息意识就是信息和信息活动在人们头脑中反映的总和,即人们对信息的认识程度和获取利用信息的自觉性。用户的信息意识直接影响其信息需求。意识越明确,需求就随之增加,动机就越持久稳定,努力程度就越高,行动就越有效。一个人的信息意识强,就会主动利用信息并充分发挥其功能作用,从一般人难以发现的迹象、动向、苗头中看到事物的发展趋向,透
26、过现象,抓住本质,取得事半功倍的效果。,2.信息能力 信息能力是指人们获取、利用信息的本领。用户信息能力直接影响其获取、利用信息的效率和质量。事实证明,需要信息的人总是远远多于获得信息的人,许多人之所以在无信息或信息不足的情况下开展工作,并不是他们对信息的重要性没有认识,而是他们不知道或不完全知道如何去获取和利用信息。用户的信息能力包括一般能力和特殊能力两个方面。一般能力主要指:观察能力。没有敏锐的观察能力,就不可能见微知著,就获取不到自己所需要的信息。思维能力。没有敏捷的思维能力,就不能入木三分地看待一些现象,就抓不住信息的实质。想象能力。没有丰富的想象力,就不可能由此及彼地创造性地利用信息
27、。记忆能力。没有良好的记忆能力,就不能很好地继承和综合信息,就不能很快地加以判断和分析。,特殊能力主要指:信息获取能力。即搜集检索信息的能力。信息整理能力。即将获取的信息进行筛选、加工、建立起个人信息库的能力。信息分析能力。即对信息进行归纳、辨别、推理、评价、分析其间的相互关系,使之系统化、综合化、准确化、适用化的能力。信息表达能力。即能用语言或文字,准确地表达自己的信息需求,反映自己研究成果中信息的能力。开发利用能力。即将获取的信息,经过研究,为自身的学习、工作、研究所吸收,或传递出去形成社会财富的能力。,3.知识水平 知识是形成信息意识、提高信息能力的基础,是检索、利用信息的前提。信息用户
28、知识水平的高低也是影响其信息需求的重要因素。作为一个用户,只有具有一定的信息知识水平、专业知识水平、相关知识水平、语文知识水平,才有资格参与检索信息、利用信息的活动。信息知识,对信息的概念、特征、规律、方法的掌握。专业知识水平指用户的专业知识深度而言,它在用户理解与吸收信息过程中起关键作用。本专业需要什么信息,哪些信息的内容是先进的、适用的、可行的等等,都需要用专业知识加以判断。,相关知识水平指用户的知识宽泛程度,由于学科之间的相互交叉、渗透和影响,产生了不少交叉学科和边缘学科,用户具有较广阔的跨学科的知识视野,可以不断地将其它学科的思想、方法、成果为己所用。语文知识水平指用户的本民族语文水平
29、和外文水平,它对用户阅读、理解信息,表达信息需求,总结自己的成果,撰写文摘、综述、研究报告、学术论文等均十分重要。外文水平对用户了解国外最新成果不可缺少。,4.信息规范这是指用户在利用信息时应当遵循的行为规范,包括信息道德与法律。信息道德是用户在长期利用信息的过程中形成的约定俗成的行为规范,如提供的信息应当真实、网络文明公约等就属于具体的信息道德规范,它依靠行为主体的自律和社会舆论保证其实现。信息法律是指由国家制定或认可,并由国家强制力保证实施的信息行为规范,它具有引导、评价、教育、强制、预测、管理公共事务和实现社会管制作用,内容包括信息产权、信息安全、信息市场、信息产业等方面的法律。宪法、基
30、本法(如中华人民共和国专利法)、信息法规、地方性法规中均是信息法律的来源。,在上述四个方面的素质中,知识水平是基础,信息能力是骨架,信息意识是灵魂,信息规范是保障,四个方面相辅相成,缺一不可。加强信息教育,增强人们的信息意识,提高其信息能力,对人们不断吸收新知识,改善知识结构,提高自学能力和研究能力,发挥创造才能都具有十分重要的意义。有着高信息素养的人,就是“信息人”。在信息社会中,“搜商”与“智商”、“情商”作为人的素质构成在一定程度上比掌握某种具体知识更有价值。一个人要想有所成,就要成为“信息人”,就要做到5W:确定何时(When)、何因(Why),通过何种方式(Where)、利用何种资源(Which),获取何种信息(What) 。,思考: 1.什么是信息,它有哪些特征? 2.什么死是信息资源?它有哪些类型? 3.什么是信息需求?如何激发自己的信息需求? 4.什么是信息素养?如何使自己的g成为“信息人”?,