1、第一章 信息检索基础,南京医科大学图书馆 周晓政,目录,第一章 信息检索概论,1. 信息概论 11 信息(information)的概念 自古以来,人们随时都在有意识或者无意识地接收、传递、存储和利用信息。人类的信息活动从来没有间断过。围绕信息定义所出现的流行说法已不下百种。例如,信息是用以消除随机不定性的东西 (Shannon,1948);信息是控制的指令 (Wiener,1950);信息是加工知识的原材料 (Brillouin,1956);英国信息学家布鲁克斯(B.C.Brookes)认为,信息是使人原有知识结构发生变化的那一小部分知识。信息就是指以声音、语言、文字、图像、动画、气味等方式
2、所表示的实际内容等等。1988年,我国信息论专家钟义信教授在对各种说法进行分析之后,在其信息科学原理一书中把信息定义为:事物的运动状态和状态变化的方式。并通过引入约束条件推导了信息的概念体系,被国内多数教材接受采用。,第一章 信息检索概论,1. 信息概论 12信息的特性(1) 普遍性信息是事物运动的状态和状态变化的方式(本体论,的反映认识论),因此,只要有客观事物的存在,只要客观事物在不断地运动,就会有它们运动的状态和状态变化的方式,也就存在着信息,所以信息是普遍存在的,信息具有普遍性。(2)传递性 信息在事物之间的相互联系必定在信息流动中发生。信息的传递性表现在人与人之间的消息交换,人与机器
3、、机器与机器之间的信息交换,动物与植物的信号交换。信息的传递和流通过程是一个重复使用的流通过程,在这一过程中,信息的占有者不会因传递信息而失掉信息,一般说来,也不会因多次使用而改变信息的自身价值。,1. 信息概论,12信息的特性(3) 依存性 信息总是依附于一定的物质载体而存在,需要某种物质承担者。信息必须依附于一定的物质形式(如声波、电磁波、纸张、化学材料、磁性材料等等)之上。 (4)相对性 客观上信息是无限的,但相对于信息用户来说,人们实际获得(实得信息)总是有限的。并且由于不同的信息用户有着不同的感受能力、不同的理解能力和不同的目的性,因此,同一信息对不同认知水平的用户所产生的作用和有效
4、性也不相同。,1. 信息概论,12信息的特性(5) 可加工性 信息可以加工处理,可以压缩、扩充和叠加,也可以变换形态。在流通和使用过程中,经过综合、分析、再加工,大量的原始医药信息可以变成医学文摘数据库和Cochrane Library的系统评价。 (6)时效性 现代社会中,信息的使用周期迅速缩短,信息的价值实现取决于及时地把握和运用信息。信息是活跃的,不断变化的,及时地获取有效的信息将获得信息的最佳价值,如时效性很强的天气预报、经济信息、交易信息、科学信息等。不能及时地使用最新信息,信息的价值就会随其滞后使用的时差而减值或贬值。,1. 信息概论,12信息的特性(7) 可共享性 与物质、能量不
5、同,信息没有排他性,它可以共享。,1. 信息概论,13 信息的作用 (1)信息是人类认识客观世界及其发展规律的基础人类的认识器官,包括感觉器官和思维器官,对各种渠道的信息进行接收,并通过思维器官将已收集到的大量信息进行鉴别、筛选、归纳、提炼、存贮而形成不同层次的感性认识和理性认识。,1. 信息概论,13 信息的作用 (2)信息是科学研究的必要条件 人类的知识具有继承性和共享性。任何一位科学家在从事科学研究时,都不能不借鉴前人的成果和依靠同时代其他人的帮助,也就是说,他同时需要在时间上和空间上的信息传递。在这个问题上,自然科学家和社会科学家各具特色。自然科学研究是一个比较严格的循序渐进过程,其每
6、一个成果都是在前人建立的基础上发展起来的,由于自然科学研究的抽象性、准确性和严格性,独立研究是非常困难的,因此,信息交流就十分必要,并且对信息的数量和质量等都有较高的要求。对于社会科学而言,其研究成果不具有像自然科学研究成果那样的准确性,但在多样性上远远超过前者,并更多地受社会政治和人为因素的影响,其不同观点和理论的统一,较之自然科学也往往更困难和更需要时间,因此,需要更多地占有信息资源,充分地认识和把握各种不同的信息观点。,1. 信息概论,13 信息的作用 (3)信息是管理和决策的主要参考依据 从广义上讲,任何管理系统都是一个信息输入、变换、输出的信息与信息反馈系统。这是因为,管理者首先要知
7、道被管理对象的一些基本情况。在一定程度上消除对管理对象认识的不确定性后,制定相应的对策,进而实施管理。更进一步讲,任何组织系统要实现有效的管理,都必须及时获得足够的信息,传输足够的信息,产生足够的信息,反馈足够的信息。只有以一定的信息为基础,管理才能驱动其运行机制,只有足够的信息,才能保证管理功能的发挥。从某种意义上讲,信息都是为决策服务的,是为人们未来行动服务的。正确的决策与多种因素有关,如决策体制、决策方法、领导者的能力和素质等,但决定性的因素,还是取决于对客观实际的了解,对未来行动及其后果的正确判断,而正确的判断又主要依赖于全面、及时和准确的信息。,1. 信息概论,13 信息的作用 (4
8、)信息是社会发展的资源 信息作为一种资源,可以创造财富,通过直接或间接参与生产经营活动,为国家经济建设的各个方面发挥出重要的作用 。,1. 信息概论,2 知识、情报和文献21 知识(knowledge)知识的概念可以用两种基本观点来具体描述:一种是知识的认识观,一种是知识的信息观。在工业经济时代,由培根、洛克、笛卡尔等人所建立的现代认识论,特别是其中知识的认识观(或现代知识观)广为传播,深刻地影响和支配着人类的生活。,1. 信息概论,2 知识、情报和文献21 知识(knowledge)知识的认识观认为,知识就是对事物属性与联系的认识。表现为对事物的知觉、表象、概念、法则等心理形式。即是说,知识
9、是对事物本质及联系的认识。根据这种知识观,人们把知识分为直接知识与间接知识两大类。20世纪后期,人类信息技术的发展导致了整个社会的生产方式、生活方式以及文化观念的深刻变化,人类进入了工业化社会的高级发展阶段信息化时代。,1. 信息概论,2 知识、情报和文献21 知识(knowledge)知识的信息观认为,知识是人类通过信息对自然界、生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。即是说,信息是产生知识的原材料,知识是信息加工的抽象化产物。英国哲学家波兰尼(Polanyi, M.)提出了人们有着共识却又忽略了的命题:“我们所知道的多于我们
10、所言传的”。,1. 信息概论,2 知识、情报和文献21 知识(knowledge)经济合作与发展组织(OECD)知识分为四类:知事(Know-what):即关于事实认知的知识。知因(Know-why ):即关于科学原理以及自然规律的知识。技能(Know-how):即从事业务的技巧、秘诀、窍门与能力。知人(Know-who):即那些人有特殊专长的知识及特殊社会人脉关系。,1. 信息概论,2 知识、情报和文献22 情报(information; intelligence) 情报是具有特定传递对象的特定知识或有价值的信息。钱学森说情报是激活的知识。我国图书情报界普遍认为,知识性、传递性和效用性是情报
11、的三个基本属性。也有将intelligence翻译为情报,例如竞争情报(Competitive Intelligence )。把数据转变成信息,再变成决策所需的知识,这种由思考和分析所加工的信息构成了情报(Intelligence)。信息与知识、情报之间是属种关系,信息是属概念,知识、情报是信息之下具有交叉关系的种概念。,1. 信息概论,2 知识、情报和文献23 文献(literature,document)在我国1983年颁布的国家标准文献著录总则中,文献的定义为“记录有知识的一切载体”。这个定义揭示了文献所包含的知识内容、信息符号、载体材料和记录方式四个基本要素。其中,知识信息内容是文献的
12、灵魂所在。信息符号是赖以揭示和表达知识信息的标识符号,如文字、图形、数字、代码、声频、视频等。载体材料是可供记录信息符号的物质材料,如纸张、胶片胶卷、磁性介质、光盘、穿孔纸带等。而记录方式,包括印刷、复制、篆刻、拍摄、录制等,将知识信息内容与载体统一成为文献。,文献,文献,1. 信息概论,3 信息源 信息源是个人为满足其信息需要而获得信息的来源。 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1. 1 按信息的保存性划分,可分为正式记录的信息源、非正式记录的信息源。前者指的是以可以保存的形式记录的信息源,如各种印刷品、缩微、声像、机读载体的文档、资料或出版物;后者指的是没有正式记
13、录、无法保存的信息源,如会议、电话、口头交流等。 3 1. 2 按信息产生的时间顺序可分为先导信息源、实时信息源、滞后信息源。先导信息源是指产生时间先于社会活动的信息源,如天气预报、市场预测等;实时信息源是指在社会活动过程中产生的信息源,如实验记录、产品、讲座或报告等;滞后信息源是指某一社会活动完成之后产生的反映这一活动的信息源,如报刊、会议论文等,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:31 . 3 按信息表现形式划分可以划分为文字信息、图像信息、数值数据信息和语音信。其中数值数据信息是“信息的数字形式”或“数字化的信息形式”。狭义的“数据”是指有
14、一定数值特性的信息,如统计数据、测量数据以及计算机中区别于程序的计算数据。广义的数据是指在计算机网络中存储、处理、传输的二进制数字符编码,文字信息、图像信息、语言信息以及从自然界直接采集的各种自然信息等均可转换为二进制数码,网络中的数据通信、数据处理和数据库等就是广义的数值数据信息。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(1)图书 大多是对已发表的成果和经验,或某一知识领域的系统论述或总结。它往往以期刊论文、会议论文、研究报告等一次文献为基本素材,经作者的分析、归纳、重新组织而成。图书提供
15、的知识一般比较系统、全面、可靠,起着综合、积累和传递知识的重要作用。从时间上看,图书报道的知识比期刊和特种文献晚,且出版周期较长。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(2)期刊 指采用统一名称,定期或不定期出版的连续出版物。其特点是出版周期短,报道速度快,数量大、内容多,发行面广。期刊的内容一般是一次文献,即原始文献,许多新的研究成果大多首先在期刊上发表,因此,期刊论文是获取新信息的主要来源,是极其重要的信息源。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准
16、划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(3)科技报告 是关于某项科学研究和革新成果的报告或研究过程中的阶段进展情况的实际记录。它反映的科学研究和技术革新成果比期刊论文快,内容高度专门化,且具有一定的保密性。一般以单行本的形式出版。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(4)专利文献 专利是国家对发明创造的法律保护。广义的专利文献应该是一切与专利有关的文献,包括专利说明书、专利公告、专利分类表、专利文摘等。狭义的专利文献一般指专利说明书,它是专利文献的主体。专利
17、文献是极其重要的信息源,蕴藏着丰富的科技信息。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(5)会议文献 一般是各种科技会议上的论文或书面发言。随着科学技术的发展,各种科技会议日益增多,已成为科技交流的一种重要渠道。许多学科中的重要发现有很大一部分是在会议文献中公开的,加上一些会议论文不在其它刊物或出版物上发表,或者即使发表,也要经过较长一段时间,因此,会议文献越来越受到科技界的重视,它已成为科技人员了解本专业的发展水平和最新研究成果的有效工具。,1. 信息概论,3 信息源 3 1 信息源的类型
18、信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(6)政府出版物 指各国政府部门及所属机构发表、出版的文件,大体上可分为行政性文件(如法令、方针政策、规章制度、统计资料等)和科技文献两大类。科技文献中包括政府各部门的科研报告、技术政策等,对了解某一国家的科学技术和经济政策及其演变等情况有一定的参考价值。 (7)学位论文 是为了取得某一级学位而提交的论文,包括学士论文、硕士论文和博士论文。它们的特点是:论文的水平和质量差别较大,论题比较专一,阐述系统、具体,有一定的独创性观点,且经过一定的审查,故有一定的参考价值。,1. 信息概论,3 信息源 3 1
19、 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(8)标准文献 是对工农业产品和工程建设的质量、规格及检验方法等方面做出的技术规定。它是从事生产、建设的共同技术依据,是一种规章性的文献,有一定的法律约束力。标准文献属于三次文献,其反映的信息传达了当时的技术标准和技术水平。因此,其技术新颖性和及时性低于专利等文献。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(9)产品样本 是厂商为推销产品而印发的一种宣传性出版物,包括产品的性能、规格、尺
20、寸、重量、构造、用途、使用方法等。产品样本的特点是技术上比较新颖,参数比较可靠,能给人以直观形象。利用它可了解国内外技术水平及有关技术的演变和发展动向,可获得设计、制造、使用中所需要的数据和方法,也可以为判断产品的价值提供依据。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:3 1 . 4 按信息的出版类型划分,可分为以下十种类型,(10)科技档案 是在科研生产活动中形成的有一定具体工程对象的技术文件、图样、照片、原始记录的原本或复制本,内容包括任务书、技术指标、研究方案、实验记录、设计图纸等。它是科技活动的真实记录,内容一般真实、准确可靠。,1. 信息概
21、论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:,3 1 . 5 按信息的产生次序和加工整理的程度不同,可将信息划分为四个层次结构:3 1 . 5. 1 零次信息 指未经正式发表或不宜公开和大范围内交流的比较原始的素材、底稿、手稿、书信、工作文稿、工程图纸、考察记录、实验记录、调查稿、原始统计数字,以及各种口头交流的知识、经验或意见论点等。这类文献在较小的范围内交流、使用、参考,其传播渠道少,或常保密,或限制使用以及因珍稀的原因,不为人们知晓。其形式多是抄件、打字件、油印件以及内部录音、录像等等。其特点是信息来源直接、真实,内容新颖。,1. 信息概论,3 信息源 3 1
22、 信息源的类型信息源的类型可依不同的标准划分如下:,3 1 . 5 按信息的产生次序和加工整理的程度不同,可将信息划分为四个层次结构:3 1 . 5. 2 一次信息 又称原始文献,也称原始信息源,它是作者依据本人的科研和工作成果而形成的文献,这类文献是脑力劳动的正式产品,是科研成果的一种主要表述方式,代表新知识,组成了可供交流的系统性信息。此类文献主要包括:图书、期刊和报纸、科学考察报告、研究报告、会议论文、学位论文、专利说明书、政府出版物、产品样本等。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:,一次信息有如下特点: (1)创造性:一次信息是人们根据
23、自己在生产和科学研究中的成果撰写的,是创造性劳动的结晶。它报道新成果、新技术、新发明、新创造。例如专利,它具有新颖性和创造性,反映了发明创造、技术革新与改进的创造性劳动成果。正由于一次信息的创造性,故受到人们重视。 (2)原始性:一次信息是一种原始的创作,也必然是初次发表的,一般是作者根据自己所积累的原始素材、原始数据创作而成,故其既有真实可靠的一面,又有特定性和不成熟一面。 (3)多样性:一次性信息是每个作者的不同成果,故在内容上多样化;另外,在表现形式上也呈现出多样性,有文学读物、期刊论文,也有研究报告、学位论文等等。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的
24、标准划分如下:,31 . 5. 3 二次信息 指根据实际需要,按照一定的科学方法,将特定范围内的分散的一次信息进行加工整理使之简化和有序化而形成的文献信息。它能较为全面地系统地反映某学科某专业文献的线索,是检索一次信息的工具。这类文献有:书目、题录、索引和文摘等。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:,二次信息具有以下特点: (1)集中性:二次信息集中了某个特定领域范围的文献信息。它可以是某个信息部门的所有书刊资料,某个学科领域的信息,某个作者的所有信息等。二次信息是在所集中的某个特定范围的信息基础上,用科学的方法加工整理、组织编排而成,它比较完
25、整地反映了某信息部门、某学科、某作者等的信息情况。 (2)工具性:二次信息可称之为工具性的文献,它以特定的方法,简练的语言揭示文献的外部特征和内容特征,并加以科学的编排。它是累积、报告和查找文献线索的一种工具。一般所说的信息检索,即指对于此类文献的有效利用,从中查检到一定的知识信息或某项课题的文献线索。 (3)系统性:二次信息本身具有自己的系统结构,为了方便利用,一般提供多个检索途径。所以一种好的二次信息往往具有比较固定的体系结构。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:,31. 5. 4 三次信息 指通过二次信息提供的线索,选用一次信息的内容,进
26、行分析、综合、研究后而编成的信息。一般包括专题述评、动态综述、系统评价、进展报告、学科年度总结、年鉴、指南和百科全书等。三次信息具有以下特点:(1)综合性:三次信息是在大量有关文献的基础上,经过综合、分析而成。综合性就是将大量分散的有关特定课题的信息、事实和数据进行综合、评价、筛选,以简练的文字扼要叙述出来,内容十分概括。它可以是纵向综合,如某学科的过去、现状和将来的综述;也可是横向的综合,如对各产业部门同类产品的比较综述等。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依不同的标准划分如下:,三次信息具有以下特点:(2)针对性:三次信息是为了特定的目的,搜集大量相关的文献,
27、进行分析、综合而编写出来的。因此,具有很强的针对性,即针对特定用户的信息需求,为特定的目的服务。(3)科学性:三次信息是在已有的知识成果的基础上,对特定专业课题的总结和综述,因此,其观点比较成熟,内容比较可靠,有材料、有事实、有数据、有建议、有结论,具有较高的科学性,一般可直接提供参考、借鉴和使用,因而普遍为科研人员和管理者所重视。如循证医学中的系统评价和实践指南。,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依加工程度划分:,三次信息的经典代表循证医学数据库:,1. 信息概论,3 信息源 3 1 信息源的类型信息源的类型可依加工程度划分:,从信息产生次序和加工程度看:信息检
28、索实际上是对信息的一个加工过程,学习这门课程,就是要掌握利用二次和三次文献信息,及时获取有价值的一次文献信息,并加以利用,解决学习、工作和生活中的各种问题。,1. 信息概论,4 信息素养41 信息交流,信息交流就是个体之间借助于共同的符号系统所进行的信息传播、交换和分享。人类社会的信息交流活动大致经历了三个时期:口语时期、文字时期、电子时期。在每一时期,信息交流与人类社会的发展都具有极大的同步协调性。信息社会的最基本特征是信息交流的全球化。它改变了信息交流的时间、距离、空间,改变了传统信息交流方式和信息流动的速度。在信息社会中,其本质就是信息在世界范围内的传递和交流。,第一章 信息检索基础,4
29、 信息交流和信息素养43 信息需要,信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需求。美国心理学家马洛斯将人的基本需要划分为生理需要、安全需要、社交需要、尊重需要、求知需要、求美需要和自我实现需要七个层次。当人们在行动中遇到某些问题时,就必须获得各种信息的支持才能使问题得到解决。,第一章 信息检索基础,4 信息交流和信息素养43 信息需要,(1) 信息需要的特征广泛性:人类的实践活动的广泛性也决定了信息需要是普遍存在着的心理现象。社会性:信息需要的产生和发展是由社会环境和社会活动决定的。所以信息需求不仅仅是个体的特性,而且主要是一种社会需要。发展性:社
30、会实践活动的发展,社会现象日趋复杂,刺激了信息需要的日益增长。多样性:信息用户的知识结构、专业、地位、职责等的多样性决定了信息需要千差万别,即使对于同一信息用户,在不同的时间、地点和环境条件下,由于具体任务的变化,其信息需要也会有很大的差别。,第一章 信息检索基础,4 信息交流和信息素养43 信息需要,(2)信息需要的层次 未知的信息需要有些现实问题过于复杂和隐蔽,或个人的认知能力有限或缺乏信息意识,因此没有、或没有意识到自己处于信息需要的状态,属客观信息需要。潜在信息需要有些人可能认识到了自己的信息需要,但却没有表达出来,致使信息需求无法用信息符号表达出来而处于“意会”的状态。人们认识到而未
31、表达出来的信息需要称为潜在信息需要。 现实的信息需要当人们意识到信息需要,而且明确表达出来的,称之为现实信息需要。用户在表达出来后,向信息服务机构提出具体的信息要求的称之为信息提问,用户自己动手寻找信息的称之为信息自问。,第一章 信息检索基础,4 信息交流和信息素养43 信息需要,用户能够认识到信息需要的层次结构是十分重要的。在日常工作中,潜在信息需要和未知的信息需要是经常存在的。如果用户自己不能意识到,就不会有足够的激发动力向信息机构作出信息提问或设法信息自问,那么工作中的问题就不会得到解决。在许多情况下,用户对存在的问题熟视无睹,根本没有想到如何去解决,就是没有意识到这两个层次的信息需要。
32、需要特别提出的是信息需要和信息需要表达常常是不能完全一致的。我们常常遇到这样的问题,当信息需要是“糖尿病足的护理”,但信息需要表达出的概念也许是“糖尿病人的足部护理”。信息表达往往并不能充分和完全地表达信息需要的全部内涵。,第一章 信息检索基础,4 信息交流和信息素养43 信息需要,(3) 信息需要的内容对信息本身的需要是用户信息需要的最终目标。人们在从事各种社会活动的过程中,为了解决所遇到的问题,就需要了解情况,增长知识,及时做出有效的决策。由于信息本身的诸多属性,用户对信息的需求也涉及到许多方面。如内容上要求有助于特定问题的解决;类型上要求各种类型的信息;在质量上要求准确/可靠、完整、全面
33、的信息;在数量上要求适度、能够有效消化的信息,避免“信息过载”等等。,第一章 信息检索基础,4 信息交流和信息素养43 信息需要,(4) 各类信息用户的需要特点 各类信息用户的信息需要在内容上、质量和数量上、类型上根据解决问题的属性均有所区别。同时各类人员的信息需要特点也是有所差异。如科研人员需要的是理论性强、原始的、完整的信息;管理决策人员需要内容综合广泛、具有战略性、全局性和预测性的涉及决策对象内外各方面的、经过浓缩加工的信息;工程技术人员的信息需要主要集中某一专业方向,具体的、经过验证的数据、技术信息,信息的类型往往是专利、标准、技术报告、工程图纸、产品样本等等。医务人员注重解决临床难题
34、的方法、数据等具体情报信息,如疾病诊断和治疗方法,特别注重信息的准确性与可靠。信息类型均以国内外期刊为首选,获取方式上,十分着重同行之间交流获取信息,与阅读期刊所获占同样比例,获取手段上要求快捷。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,信息行为是人们满足自己信息需要的社会活动的过程。用户的信息行为主要有信息检索行为、信息的选择行为和信息利用行为。 (1)信息检索行为信息检索行为,指的是用户自己查找、采集和寻求所需要信息的活动。而在寻找信息源的过程中,信息查询者对于信息查询路线的选择,往往总是首先选用最便于接近的信息源,而对于这些信息源的质量与可靠性的考虑,则处于次要地位。
35、此外,信息查询者比较注重信息源系统的易用性。就是说,如果一个信息源系统,在使用其获取信息时比不获取信息时更费心更麻烦,那么这个系统就不会得到利用。这是可近性的延伸,二者相辅相成,决定着某个信息源系统能否得到利用。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,信息行为是人们满足自己信息需要的社会活动的过程。用户的信息行为主要有信息检索行为、信息的选择行为和信息利用行为。 (2)信息选择行为 信息选择行为指的是信息采集者从某一信息群中把符合自己需要的一部分信息挑选出来的过程。信息选择的核心标准是相关性和适用性。所谓“相关”和“适用”指的就是对于用户来说是相关的和适用的。,第一章 信
36、息检索基础,4 信息交流和信息素养44 信息行为,信息行为是人们满足自己信息需要的社会活动的过程。用户的信息行为主要有信息检索行为、信息的选择行为和信息利用行为。 (3)信息利用行为 信息利用是用户寻求信息的根本目的。信息利用行为指的是用户利用信息解决其所面临问题的过程。由于信息利用的过程就是问题解决的过程,所以关于信息利用的研究就集中在“问题解决”上。问题解决的过程一般包括:问题提出、问题空间确立、问题空间搜索、问题解释、问题解决。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,(3)信息利用行为 问题提出 用户在有了信息需要并进一步在信息动机的驱使下产生信息行为时就已经提出了
37、具体的“问题”。所谓“问题”就是问题解决者(即用户)在面临一项任务又没有直接的手段去完成时所产生的复杂的心理活动。问题空间确立问题空间是问题解决者对一个问题所达到的全部认识。人们要解决问题,首先是理解这个问题,明确问题的初始状态,构想问题的目标状态,从记忆中提取相关信息,对问题进行解释和表征,构成问题空间。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,(3)信息利用行为 问题空间确立问题空间不是现成的,也不是自然生成的,它是问题解决者根据所掌握的信息自我主动构造的。所以,问题解决者的素质、修养和能力对问题空间的构建有很大的影响。由此导致问题空间的复杂性。不同的人,对于同一个问题
38、可能构成不同的问题空间;而同一个人,对同一个问题所构建的问题空间在问题解决之前也会不断发生变化,甚至会由于情况的变化而重新构建新的问题空间。当然,不同的人面对不同的问题肯定是构建不同的问题空间。 最重要的问题是用户如何构建一个适宜的问题空间。因为适宜的问题空间对解决问题有直接的影响。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,(3)信息利用行为 问题空间搜索 问题空间搜索,就是查询解决问题所需要的信息,以找到一条从问题的初始状态到达目标状态的通路。在问题空间中,需要被解释的信息,称作“被解信息”。而解释本身所含的信息,称作“解含信息”。所谓“解释”,就是寻求被解信息与解含信息
39、之间的关系。要获得圆满的解释,就要对问题空间中的被解信息和解含信息进行不断的搜索。问题空间搜索的范围,一般首先是用户的大脑,然后是已有的社会信息流总库。搜索的结果,会获得新的被解信息,接下来就是运用新信息进行解释。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,(3)信息利用行为 问题解释 问题解释是整个问题解决过程的核心环节。解释就是变本来不可理解为可以理解而进行思考和陈述的信息激活工作。认知心理学认为,思维主体在接受到新信息之后,就开始了对问题的解释。解释过程不是照相式、录音式的机械过程,是一个对感知的信息加以理解、选择、组织,使之成为一个统一体的复杂过程。显然,在这里人具有
40、主动性和选择性,所以人的心理因索、文化背景、阅历经验、知识修养等素质、修养和能力都会对解释产生影响。,第一章 信息检索基础,4 信息交流和信息素养44 信息行为,(3)信息利用行为 问题解释 在解释中,由于获得的新信息的信息量大于信息管理者原有知识结构的信息量,或者是新信息导致原有知识向深层发展,或者是新信息与原有的预测相反,因而需要对新的被解信息进行激活加工,提出新的合理的解释,或者确认原来的知识结构不能容纳新信息,或者确认原来的知识需要向深层次发展,或者确认原来的预测有误,并由此形成新的知识结构。这个过程不是一次就完成的,是在反复思考、不断获取反馈、不断修正信息行为的过程中实现的。,第一章
41、 信息检索基础,4 信息交流和信息素养44 信息行为,(3)信息利用行为 问题解决 问题得到圆满的或相对圆满的解释就是最后的问题解决。问题的解决关键在于对问题做出有价值的解释。这就要求所获得的信息必须是相关、合适的。这种与问题直接相关的、适量的信息被称为合适的信息度。要达到完全的合适信息度是困难的,但是尽可能地接近这个合适信息度,减少偏离度是可能的。整个信息行为过程是“信息需要、信息查找、信息选择、信息利用(问题解决)”的过程。,第一章 信息检索基础,4 信息交流和信息素养45 信息动机,(1)信息动机的含义信息动机是指激励和推进个体发动并维持其信息行为导向某一目标的心理过程。信息需要是信息行
42、为发生的根本基础,而信息动机则是信息行为发生的根本动力。(2)信息动机的形成由于个体的内在条件(信息需要)和外在条件(环境刺激)的存在导致信息动机的形成。个体的内在条件,就是信息需要。每个人随时都有很多信息需要。只是这些信息需要在不同的时间、地点条件下,表现出不同的需要强度。它们中最强烈的那一个需要决定着个体的实际信息行为。,第一章 信息检索基础,4 信息交流和信息素养45 信息动机,(3)信息动机的转化是指信息动机向信息行为的转化。信息动机形成后,具有两种功能:一是激励功能。信息动机可以激发个体产生某种信息行为,并对个体的实际信息行为起着推动和控制的作用:二是指向功能。信息动机可以帮助个体朝
43、着特定的方向、预期的目标进行信息行为。,第一章 信息检索基础,4 信息交流和信息素养46 信息素养,信息素养(Information Literacy)概念是从图书检索技能演变发展而来。传统图书检索技能中,包含很多实用、经典的文献资料查找方法。计算机、网络的发展,使传统图书检索技能同当代信息技术结合,成为信息时代的每个公民必须具备的基本素养。2000年1月18日,美国大学与研究图书馆协会(ACRL)通过了美国高等教育信息素养能力标准(Information Literacy Competency Standards for Higher Education)。,第一章 信息检索基础,4 信息交
44、流和信息素养46 信息素养; 美国大学与研究图书馆协会(ACRL),第一章 信息检索基础,4 信息交流和信息素养46 信息素养,标准一 能够确认信息需求的特性与范围 。 标准二 能有效而又高效地获取所需要的信息。 标准三 能评判性地评价信息及其来源,并能把所筛选出的信息融入自己的知识基础 。 标准四 能有效地利用信息去完成一个具体任务。 标准五 了解利用信息过程中所涉及的经济、法律和社会问题,合理、合法地检索、搜集和利用信息。,第一章 信息检索基础,4 信息交流和信息素养46 信息素养,标准一 能够确认信息需求的特性与范围 。 研究主题的来源日常生活和工作中存在着大量的研究主题来源,以下给出了
45、其中最主要的十种: (1)研究领域已有的学位论文;(2)学术和专业期刊上的文章; (3)会议论文集;(4)书籍或者书评;(5)研究领域的综述; (6)与领域专家的交流;(7)与研究成果潜在用户的交谈; (8)与同事的讨论: (9)其他媒体,包括研究门户以及研究社团的网站等; (10)自己的工作。 (1)(5)意味着需要经常访问高质量的图书馆。,第一章 信息检索基础,4 信息交流和信息素养46 信息素养,信息素养是一个比较宽泛的概念,它着重于信息内容的分析、检索和评价,是一种理解、发现、评估和利用信息的认知能力和逻辑辨析推理能力,属于人的智能,是独立于技术的,而信息技术则主要是对技术的了解和应用
46、。但是信息素养能力要依赖于信息技术方能“广、快、精、准”地收集信息,二者关系密切、相互交叉,信息技术越来越成为信息素养的支撑。,第一章 信息检索基础,5信息检索,信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。广义的信息检索包括信息的存储和信息的检索,所以又称为“信息存储与检索”(Information Storage and Retrieval)。信息的存储主要包括对在一定专业范围内的信息选择基础上进行信息特征描述、加工并使其有序化,即建立数据库。这个工作现在已经基本由专业机构借助计算机这一工具承担,不需要读者自己来做读书卡片,按一定方式组织读者卡片了。但由于
47、个人计算机普及和性能的提高,也可以采用国内外流行的文件管理软件(如医学文献王、Endnote、Reference manager等),并借助各类数据库的套录数据,建立自己感兴趣的专题数据库,以便经常检索和阅读,这也是一种信息的存储。,第一章 信息检索基础,5信息检索 51 信息检索的类型,511 信息检索按存储和检索的内容划分为文献信息检索、数据信息检索、事实信息检索(1)文献信息检索文献信息检索(document information retrieval)是以文献为检索对象,将存储于数据库中的关于某一主题文献的线索查找出来的检索。它通常通过目录、索引、文摘等二次文献,以原始文献的出处为检索
48、目的,可以向用户提供有关原文献的信息。例如,“关于亚甲基蓝灭活血浆病毒有哪些专利文献?”的问题。,第一章 信息检索基础,5信息检索 51 信息检索的类型,511 信息检索按存储和检索的内容划分为文献信息检索、数据信息检索、事实信息检索(2)数据信息检索数据信息检索(Data Information Retrieval)是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要查出可回答某一问题的数据的检索。这些数值型数据各种各样,包括物理性能常数、统计数据、人口数据、国民生产总值、气象数据等。数据检索不仅能查出数据,而且能提供一定的运算、推导能力。用户获得各种经过整理、计算过的量化信息,从而为定
49、量分析提供依据。例如,MICROMEDEX数据库中的Dosing & Therapeutic Tools,提供图表,药物剂量换算程序,诊断和治疗的经典法则等工具。,第一章 信息检索基础,5信息检索 51 信息检索的类型,511 信息检索按存储和检索的内容划分为文献信息检索、数据信息检索、事实信息检索(3)事实信息检索事实信息检索(fact information retrieval)是将存储于数据库中的关于某一事件发生的时间、地点、过程等情况查找出来的检索。一般先从系统中检索出所需信息后,加以逻辑推理得出出结论。例如,HIS数据库包括大量医院管理中有关人员、工资、病床周转率、药房销售统计等信息,这类信息主要是用于管理决策。事实信息检索比数据信息复杂。,第一章 信息检索基础,5信息检索 51 信息检索的类型,511 信息检索按存储和检索的内容划分为文献信息检索、数据信息检索、事实信息检索(3)事实信息检索事实信息检索(fact information retrieval)是将存储于数据库中的关于某一事件发生的时间、地点、过程等情况查找出来的检索。一般先从系统中检索出所需信息后,加以逻辑推理得出出结论。例如,HIS数据库包括大量医院管理中有关人员、工资、病床周转率、药房销售统计等信息,这类信息主要是用于管理决策。事实信息检索比数据信息复杂。,