1、2018/6/17,1,情 报 学 (上),2018/6/17,2,第一章 总论,2018/6/17,3,第一节 “情报”的概念,一、演变情报是汉语拥有的一个独特概念,在英文中不存在与其完全吻合的对应术语。情报是一个发展中的概念,不同的历史时期,其社会功能和概念有所不同。情报最早是一个军事术语,强调的是情况、消息和传递报道的作用。“定敌情如何,而报于上官者。”(辞源1915年)“战时关于敌情之报告,曰情报”(辞海1939年),2018/6/17,4,现在是从知识、信息及情报的社会功能等角度来认识情报。吉田贞夫:情报是人和人之间传播着一切符号系列化的知识。米哈依洛夫:作为存贮、传递和转换的对象的
2、知识情报是特定时间、特定状态下对特定人提供的有用知识。斯拉麦卡(美):情报就是有用的数据或被认为有用的数据。草间基(日):情报是判断、意志、决心、行动所需要的能指引方向的知识和智慧。,2018/6/17,5,情报是指有明确接受对象的那部分知识和信息。 情报就是作为交流对象的有用知识或消息,也可以说是用于特定需要的知识或消息。(我们所要掌握的概念),2018/6/17,6,二 、属性情报的基本属性是:情报的知识性、情报的传递性、情报的效用性。三、情报与信息的比较information 概念广信息是情报的源泉,是情报加工的颜料。没有信息,便没有情报。知识、情报、信息的关系,2018/6/17,7,
3、情报,知识,知识,信息,2018/6/17,8,四、日本的情报概念情报在日文中最初也是一个军事术语,对应的英文译名为intelligence(谍报之意)19世纪20年代,情报正式成为information的译名日文情报中同时具有intelligence和information的双重含义。其中,intelligence定义为对information的评价、分析、综合和解释的结果。,2018/6/17,9,第二节 情报工作,1 情报工作的产生与发展(1)情报工作与科学研究活动结合在一起。获取情报靠个人的努力。(2)情报工作的形成阶段,人们开始主动地有组织地进行情报传播。文摘杂志大量发行,文献(情报
4、)工作成为一种职业。(3)情报工作的发展阶段,20世纪40年代发展起来的科技情报工作。有组织的科技情报工作相继出现,情报机构纷纷成立,人员和经费逐年增多。(4)网络时代,信息技术的应用改善了情报工作的工作环境,提高了管理与服务效率。,2018/6/17,10,2情报工作的含义在我国,科技情报工作起步较早所谓情报工作,就是用科学的方法,把国内外有用的社会信息、科学知识核心的科研成果,有计划、有目的、准确、及时地提供使用的一种科学技术工作。 对情报工作的要求: “广”、 “快”、“精”、“准”,2018/6/17,11,3 情报工作的主要内容情报的搜集、加工整理、情报研究、情报报道、情报服务、情报
5、机构的管理。,2018/6/17,12,4 专职的情报工作机构(专职信息服务机构)这类机构的任务就是对科技信息进行搜集、加工、存贮、检索和提供利用。科技信息主要以文献为载体,这类信息机构主要从事的实质上是文献管理工作,但偏重于图书以外的文献,如期刊、会议文献、专利等。我国于1956年10月成立中国科技情报研究所,1992年更名为中国科技信息研究所。情报机构从事科技情报服务工作(日本称情报管理工作),主要进行二次文献加工,旨在克服传统图书馆文献利用方面的滞后现象及过分重视“藏书”的现象。,2018/6/17,13,中国科技信息研究所的工作介绍我国的科技信息工作要通过改革和创新,向收集、加工、整理
6、、传播、研究和利用知识的知识服务行业发展,成为国家科技创新体系的重要支撑体系。工作内容:1 提供多元化科技文献保障(以国家工程技术图书馆与国家科技图书文献中心资源共建共享系统服务为依托)2 加强科技信息分析研究,提供高水平决策支持3 先进技术研发推广4 提供人才教育全国科技信息服务中心、学术中心、人才培养中心、网络技术研究推广中心,2018/6/17,14,第三节、情报科学,一、情报学的产生产生于科学情报工作的实践,是情报工作经验的高度总结和概括。以美国学者布什(v. bush)1945年发表的著名论文如我们所能想象的为标志。在“情报爆炸”中诞生 :情报产量与情报利用者之间不平衡的矛盾。,20
7、18/6/17,15,二、定义ISO 情报学是对情报的功能、结构、传递的研究和情报系统管理的研究。严怡民 情报学是研究有关情报的产生、搜集、整理、存贮、检索、报道服务和分析研究的原理原则与方式方法的科学。研究对象:情报与情报交流过程主要目的:提供情报服务内 容:情报的产生和组织 情报的传递与利用 情报技术 情报系统,2018/6/17,16,三、体系结构 理论情报学:基础理论部分。主要研究学科赖以形成和发展的各种基本理论问题。情报的定义、属性、特点、结构和类型情报学的性质、目的、任务和范围网络情报交流的理论与模式知识的生产、组织、管理、增值、创新、增长与老化 等用户认知模型、用户行为模型、用户
8、服务规律及障碍情报活动及过程(生产、加工、组织、检索、传递及 利用)情报学研究方法论情报学的分支学科及相关学科,2018/6/17,17,应用情报学:情报学理论的应用研究部分。情报采集的渠道、途径以及筛选的方式、方法情报的加工、处理方法(信息组织与知识组织的新方法)情报检索系统和数据库的建立、使用、评价方法与方式情报分析、研究、咨询、服务与传递的新方法和新方式情报用户研究(用户心理与行为、用户需求模式、用户服务要素),2018/6/17,18,技术情报学:情报技术的应用研究部分采集技术处理技术检索系统与数据库开发和评价技术(数字化、网络导航、搜索引擎、多媒体、用户/系统接口、数据库、元数据、网
9、络传输)情报内容、知识的表达、分析与整序技术(自然语言理解与处理、文本内容自动化处理、自动标引、自动摘录、自动分类、传家系统、智能情报检索)信息安全与保护技术,2018/6/17,19,管理情报学:情报系统与服务的组织与管理(业务流程、重组、情报服务效果与效益的评价)信息资源的共建共享以及各种情报系统与服务之间的协作协调情报产品的价值、价格、生产、应用及其商品化、市场化、产业化等信息资源管理创新、知识创新、知识管理及信息主管和知识主管环境管理与建设(国家宏观情报政策、方针、计划、体制、信息政策与法规)情报业务与技术的标准化、规范化情报专业教育与人才培养等这四个部分共同结合成一个有机整体情报科学
10、,2018/6/17,20,四、情报学的学科性质1自然科学科亨在1974年专著文献增长的集成机制中称“情报科学是一门自然科学”。20世纪90年代,很多学者不同意把情报科学作为一门自然科学,但是必须承认情报科学有自然科学的特点,使用了自然科学和技术科学的某些做法和方法。佩斯雷指出:自然科学充当了情报科学研究方式和方法的来源。情报科学是按照一种自然科学的模式来构建的。萨瑞塞维克等指出:在情报科学中强调其自然科学或技术科学的一面,是与信息技术、计算机技术及它们的应用密不可分。,2018/6/17,21,2、人文科学根植于人文科学,该领域早期的研究以历史或思想史为起点,哲学对知识的组织和分类系统的创建
11、也有贡献。随着图书情报工作的计算机化,历史型研究渐少。史蒂格1990年发表了情报科学与人文科学一文,运用人文科学的概念、人类价值和人类精神表现等理论讨论了两者的关系,主要讨论情报哲学的问题。,2018/6/17,22,3、 社会科学许多研究者把情报科学称为一门社会科学。情报科学研究的是某一社会架构下,个人与个人,个人与社会情报系统的互动。研究一般的人类交流和特定的情报交流所记录的知识的传递包括人与人之间、人与社会情报系统之间的处理和交流。,2018/6/17,23,五、情报学的研究方法,社会调查法引文分析法系统科学法文献计量法科学计量法信息计量法网络计量法基于文献的知识发现法历史的研究方法,2
12、018/6/17,24,六、情报科学与相关学科1情报科学与图书馆学亲密的血缘关系从产生过程来看,图书馆文献工作才是情报学真生长形成的温床。从研究对象来看,既有重叠又有差异。图书馆工作往往以图书、图书馆为重心,而情报工作则较重视知识的发现,深入分析、报道文献的具体内容。学科宗旨和任务是相同的,科学方法也相似、同一。作为统一的概念有待时日。,2018/6/17,25,2、 情报科学与传播学情报科学与传播学融合(英格沃森1992年指出情报科学发展的趋势之一) 情报科学的实质是人类交流问题,是在系统的帮助下发生于情报生产者与情报用户之间的人类情报传播。20世纪80年代中期,一些传播学院和图书情报学院确
13、实合并了。适合研究记录知识传递中人的行为和相互作用。,2018/6/17,26,鲁宾(B.ruben)情报科学与传播学都关注情报的产生、组织、传输、存储、管理和使用等。大众传播学研究者关注的焦点是以选择、组织、传输、存储、管理和使用情报为主要功能的机构,这些活动也是情报机构的基本使命。他实际上是把情报机构在功能上是为传播交流机构的一部分。虽然两者的功能类似,但方式不同。新技术使它们向统一目标汇集。,2018/6/17,27,第四节、国外情报科学研究进展,20世纪情报学对世界的最大贡献:情报学研究者测量了信息爆炸情报学工作者遏制了信息爆炸情报学工作者在信息存储和检索系统方面最早将计算机用于处理文
14、献和文献记录。情报学研究了用户信息查询、需求、爱好以及诸如关联和实用评估等相关方面情况。在政府和产业界工作的情报学领军人物极力阐明和制定国家信息政策法规。,2018/6/17,28,一、情报科学定义的变化50年代 关注科学情报和科学交流的过程。60年代 关注着同情报的产生、组织、收集、存储、检索、解释、传递、转化和利用等有关的知识体系。70年代前期 建立一套原理来控制所有的交流过程和与其相关的情报系统。从60年代开始,基本现象(情报、知识和知识结构)与过程(交流和情报使用)的性质、表现形式和影响等,已成为情报科学基础研究所探讨问题。,2018/6/17,29,1974年科亨 情报检索系统的组成
15、包括:作为情报处理器的人,作为情报载体的文献、作为表达形式的主题。情报科学的研究对象就是上述三种对象各自的生命周期及它们之间的动态交互。70年代中期 关注人类交流过程“情报科学的目的就是在于促进人们之间的情报交流(贝尔金)”,2018/6/17,30,80年代 “管理”进入情报科学1987年,威尔逊指出,情报科学是研究情报的产生、组织、传输和利用的学科。它既关心情报的通道或载体以及用户,又关注情报系统和情报服务的设计与评估,从公共图书馆到计算机情报检索都是情报科学关心的对象。信息管理(information management, IM)狭义:对信息本身的管理,采用各种技术方法和手段对信息进行
16、组织、控制、存贮和规划等,并将其引向预定目标。广义:不单单是对信息的管理,而是涉及信息活动的各种要素(信息、人、机器、机构等)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。,2018/6/17,31,90年代 “知识”知识管理(knowledge management, KM)出现于1989年,其主要目标是改善组织或机构获取、共享和利用知识的能力。1992年,萨拉塞维克指出:情报科学是致力于科学研究和专业实践的一个领域,它探讨人们在社会、机构和个体三种不同情况中有效地交流知识和知识记录的问题。在处理这些问题时,应尽可能地利用现代信息技术。,2018/6/1
17、7,32,二、情报认知观认知科学(cognitive science)产生于20世纪70年代末,以研究智能系统(包括自然和人工的)工作原理为对象的,从哲学、心理学、语言学、人工智能、人类学、神经科学的交叉领域中成长起来的一门交叉科学。认知观吸收了认知科学的基本思想和有关理论,研究了人的信息处理原理,关注人对情报的利用和吸收,以研究设计支持、改善这种利用、吸收的情报系统和情报服务为目的。,2018/6/17,33,认知观的代表理论1 布鲁克斯(B.C. Brookes)理论基础 波普尔“三个世界” 理论世界一:物理客体的状态。(客观物质世界)世界二: 意识状态和主观经验。(主观精神世界)世界三:
18、客观知识世界。情报科学基本方程式:kS+IkS+S 在情报(I吸收的情报量)的作用下,原有的知识结构(kS)被改变为新的知识结构(kS+S),因此认为情报是使人的知识结构发生变化的那一部分知识。,2018/6/17,34,图书馆学家和情报科学家的实际工作可以归结为收集和组织“世界3”的人类思想记录并提供利用。情报科学的理论任务可以归结为研究世界2与世界3的相互作用,在可能的范围内描述和解释这一相互作用,帮助组织知识(而不是文献),以便人们更有效地利用知识。对客观知识进行分析和组织是布鲁克斯情报学的核心思想。在他看来,人们利用现存的各种分类和索引法对文献的标引分类都不是组织知识而是组织文献。他理
19、想中的知识组织,是对文献中的逻辑内容进行分析,找到人们创造与思考的相互影响及联系的结点,从而探索了“知识地图”概念,试图揭示知识的有机结构。,2018/6/17,35,2. 贝尔金知识非常态状态(ASK)理论贝尔金文本概念与“情报概念” 情报科学的基本问题是“促进所需的情报在情报生产者和情报用户之间的有效传播”。情报科学关注的论题包括:人类认知传播系统中的情报;情报和情报生产者间的关系;情报与用户间的关系;多元体所需的情报,情报的效用与情报传递的作用。文本是传送者有目的地组织起来的符号集,意在改变接受者的概念结构。生产者-文本-接受者,2018/6/17,36,情报的概念是生产者根据对接受者知
20、识状况的了解,有目的、有意图地修改过的概念结构。贝尔金ASK理论认为用户之所以有情报需求产生,是因为用户认识到自己存在着知识的非常态,也无法确切描述需要什么来解决这种非常态,情报检索的目的就在于描述、理解和解决知识的非常态。,2018/6/17,37,3 英格沃森1992年,对布鲁克斯的基本方程式又做了发展,在方程式中加上了情报的产生和接受,引入了“潜在情报(potential information, PI)”的概念,认为可改变知识状态(知识结构)的情报(即I)来自于情报消费主体对PI的选择和利用,而新的知识状态有会产生对其他人有潜在意义的新情报(PI). PI I+KS KS+S PI 这
21、个方程式未能更准确地把个人的情报查询和使用情况表现出来,因此,个人如何从PI中抽出I来改变知识结构的问题又成为情报学研究达到的新问题。,2018/6/17,38,三、当前情报科学研究的重点领域1自动化系统数字化图书馆;系统评价;产生的影响2信息经济学信息对提高生产率的作用用情报计量学有效地评价某一组织的生产率电子信息的营销、收费机制、价格策略3标引机读数据组织 数字化图书馆中文本和图像的标引不同情报系统中的书目情报要素,2018/6/17,39,4、情报需求与使用各类用户的情报需求发展用户的信息查询技能,提高用户的信息素养(information literacy)情报的获取怎样改变用户5、情
22、报检索情报检索系统的人机界面人工智能与情报检索以用户为中心的检索研究和分析方法6、信息资源管理认识信息资源管理的知识角度和集成角度信息资源管理的组成部分和实施步骤网络化组织的信息资源管理,2018/6/17,40,四 情报学前沿领域,1)“数据库知识发现”(KDD)研究2)语义网研究3)3G(Great Global Grid)研究4)信息构建(Information Architecture)5) 知识管理研究6)数字图书馆研究7)信息技术应用8)小世界现象,2018/6/17,41,第二章、情报交流与传递,2018/6/17,42,第一节情报的交流方式及特点,一、情报的交流方式(commu
23、nication)1、信息的传播交流信息的自我传递,关于自己思想、著作、论文等资料的回忆与检索。信息的个人间传递,通过面谈、书信、电讯等方式交换信息。信息的大众传播,利用现代传播媒介或大型会议、讲座方式向社会中的大量读者、观众、听众传播信息。报纸、杂志、电视、广播)科学情报交流与上述相似,2018/6/17,43,2、 科学交流(米哈依洛夫)非正式情报交流:情报生产者和利用者个人之间直接进行的情报传递。如交谈、会议等,包括自我传递和个人间传递。正式情报交流:通过科学文献系统(包括纸质、磁质、光质文献的出版、发行)的情报交流,如书刊发行、图书馆工作、档案工作、情报工作、广播电视传播工作。正式情报
24、交流由专职情报工作者完成,表现为文献流通。非正式情报交流由科技工作者自己完成,带有明显的个体性质。,2018/6/17,44,二、情报交流过程的特点1、非正式交流过程的特点 所传递的情报是零次情报;具有最短的情报间隔时间;具有高度的选择性和针对性;传递情报反馈迅速;提供情报生动、直观,易于理解和接受。 非正式交流过程的缺点 范围非常有限;缺乏有效地监督和评价;不能进行有效地情报积累,缺乏严谨性。2、正式交流过程特点与之对应存在情报交流的正式过程和非正式过程是互为补充的,2018/6/17,45,2018/6/17,46,第二节、情报的生产和流通,一、情报的生产的两个层次1原始情报作者的成果,包
25、括期刊、图书、专利、学位论文、学术报告、政府出版物2二次情报、三次情报情报工作者的劳动产品,是情报中心、文献中心和图书馆的任务,目的是开展情报服务。现代情报中心的任务主要是围绕二次情报和三次情报的生产和提供而开展的,数据库产业迅速发展,2018/6/17,47,二、 情报的流通情报通过科学文献系统的流通过程。科技文献有对情报内容的审查或评价功能。期刊是情报流通过程的主要媒介。在流通过程中,情报传播有时差。,2018/6/17,48,三、情报流通渠道正式渠道中流通的主要是科技文献,包括出版物和非出版物非正式渠道流通的主要是零次情报,流通形式主要包括情报生产者和情报利用者之间的个人接触、书信来往、
26、出席学术会议、参观展览或同行实验室,2018/6/17,49,2018/6/17,50,第三节、情报传递模式,一、非正式过程中的情报传递模式1无形的集体看不见的学院(invisible college)由某些核心的科学家领导组织的,其他科学家则围绕着他们,经常联系。2情报交换中心利用看不见学院原理,把某一些学科领域的科学家之间的的情报交流传递正规化。情报网:我国八十年代,正式出版物少,内部资料的交换3其他各种会议,2018/6/17,51,二、正式过程中的情报传递模式1多向主动传递书商关于新书目录的发布,二次文献报道(包括目录、索引、文摘等)2单向主动传递了解用户需求,把情报主动传递给事先确定
27、的接收者。3多向被动传递 图书馆阅览室、信息中心的借阅处4单向被动传递 信息(情报)咨询服务四种模式相互补充,相互不能替代,协调一致地关系。多向是为了进行更好地单向,多向是单向的基础,多向比单向传递容易,单向是理想目标,多主是最基本的情报传递形式,单主是情报传递的高级形式,但不容易做到。,2018/6/17,52,三、网络对信息交流方式的影响,互联网提供新的政治信息交流方式互联网提供新的商业信息交流方式互联网提供新的教育信息交流方式四、传统科学信息交流模式的变解和栈理论信息栈:信息从生产者向使用者流动过程中所经过的环节。它必须是人或人工系统,其功能是接收、处理和传递信息。并且是信息交流过程中信
28、息变异的重要影响因素。网络环境下科学信息交流模式:零栈:网络学术信息的生产者与利用者之间直接进行的信息交流模式组织栈:由一个组织机构来发挥对信息的接受、处理和传递功能的信息栈个人栈交流模式,2018/6/17,53,2018/6/17,54,第四节 情报交流的障碍及解决途径,一、技术方法障碍自然语言障碍:一种民族语言;一种人工语言;机器翻译学科语言障碍:科学普及;联合研究检索语言障碍:对情报用户进行培训;尽量采用自然语言情报时滞:充分利用IT信息技术;提高工作水平情报源障碍:采用新的IT技术;信息机构的建立二、社会性障碍版权与专利制度 政治因素 经济问题,2018/6/17,55,第四节 情报
29、交流的障碍及解决途径,信息源障碍时滞障碍系统障碍渠道障碍共享障碍:发挥馆际互借的优势技术障碍语言障碍:自然语言障、专业语言、检索语言阅读障碍设备障碍,2018/6/17,56,第三章 情报源,2018/6/17,57,第一节 情报源(信息资源)的类型,一、信息资源的定义:人类选取、组织、序化的有用信息的集合。 二、信息资源类型体系1潜在情报源 指个人在学习、认知和实践过程中储存在大脑中的信息资源,只能供个人使用。,2018/6/17,58,2 现实情报源 指人类获取并表述出来的,能够为公共所利用的信息资源。A 体载情报源 以人为载体并能为其他人识别的信息资源。分为口头语言(讲演)、体语(舞蹈)
30、B 文献情报源 以文献为载体的信息资源。分为刻写型(手稿、日记、信件、原始档案、碑刻)、印刷型(图书、报刊、特种文献、档案、图片、舆图、乐谱)、缩微型(胶片、胶卷、卡片)、机读型(磁带、磁盘、光盘)、声像型(唱片、录音带、录像带、电影胶卷、胶片、幻灯片)等。,2018/6/17,59,C 实物情报源 以实物为载体的信息资源,分为天然和人工(产品、样品、样机、模型、雕塑等)。D 网络情报源 从计算机技术、通信技术、多媒体技术相互融合而形成的网络上可查到的资源。分为非正式出版信息(电子邮件、电子会议、电子布告版电子论坛)、半正式出版信息(个单位宣传自己或其产品的描述信息)、正式出版信息(网络数据库
31、、电子期刊、电子图书、电子报纸)。,2018/6/17,60,第二节 搜集方法,1、常见的情报搜集方法: 采购:现正在出版发行的文献 采购是一种经常性的、稳定的、系统的搜集和获取信息的有效方式 。 交换:适合于内部交流的文献 交换的信息源多属于内部资料、非卖品,不能通过采购或其他方式获得 。 现场搜集:非文献情报(零次情报) 索取:还不够详细、完备和全面的信息源,根据需要与可能,可以通过通讯联系或直接派人联系取得。 检索:手工检索、脱机检索、联机检索和网络检索。 复印:复制,照相 调查:现场调查 、访问调查 和问卷调查 。,2018/6/17,61,第三节 情报源的价值评定,一、直接评定法 及
32、时性、完整性、新颖性、可靠性、简明性二、间接评定法 通过情报用户来评价情报源,以调查表的方式调查用户对情报源的需求和利用情况,然后由情报工作者对调查所得到的数据进行统计分析和对比,对情报源的价值作出评定。特点 :工作量较大,客观,2018/6/17,62,三 网络环境下情报源的评定1 定性评价方法:“热门站点推荐”、“站点精选”、“最佳站点”2 定量评价方法:软件实时检测法、网络计量法,以链接分析或访问量为依据3 两者结合,2018/6/17,63,第四章 文献情报交流的规律,文献计量学的 六大定律:文献增长规律,老化规律,分散规律,洛特卡规律,齐普夫规律与文献引证分析规律,2018/6/17
33、,64,第一节 文献分散规律 布拉德福定律,一、布氏定律的表述布拉德福(S.C.Bradford)是英国的化学家和文献学家大量该学科的文献相对地集中在一定数量的杂志上,而剩余部分的文献则依次分散在其他大量的相关杂志上。,2018/6/17,65,区域表述形式,如果将科学杂志按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些杂志中分出载文量最高的核心部分和包含着与核心部分同等数量的论文的随后几区,这是核心区和后几个区中所含的杂志数成1:a:a2的关系(a1)。 (对于当时统计过的数据来说,a约等于5),2018/6/17,66,如:将所有的杂志分成3区,使每区论文书大致相等,则
34、杂志数服从布拉德福定律。即:9592581552布拉德福分散曲线 上升AC 直线CB 下垂BD组成的曲线,2018/6/17,67,B,c,R(n1),R(N),R(n),A,O,N,N,C,R(N),D,lgn,2018/6/17,68,布鲁克斯: R(n)= n (1nc) R(n)= klg (n/s) (c nN)R(n)相关论文累积数n杂志等级排列的序号(级),等级排序的期刊数的累积数第一级杂志中的相关文章数R(1).载文章作高的杂志中的相关文章数c核心区中的杂志数量N等级排列的杂志总数k,s待定参数,k等于分布曲线中直线部分的斜率,可用实验方法求得。当N足够大是,kN 参数,与收藏
35、的杂志(核心区的杂志)数量有关,大小等于分布图中曲线部分的曲率,总小于1(1)s学科确定了,s就确定了。当s较小时,表明该学科范围较窄。,2018/6/17,69,二、布氏定律的应用 1选择核心期刊2文献检索工具的完整性测定3指导读者利用期刊,指导期刊采购 4学科幅度和成熟度参考的比较5动态馆藏的保护6. 选择核心出版社,2018/6/17,70,三、条件限制是一个较为粗浅的经验定律A 论文的学科领域应当清楚划分B 被分析的某一学科或课题的期刊清单,以及对这些期刊中所刊载的相关论文的统计应当是充分的C 被分析的期刊的时间应当清楚限定四、百分比补偿期刊登载某课题论文数占该期刊全部论文书的百分比,
36、将期刊按百分比降序排列。,2018/6/17,71,第二节 洛特卡定律与齐夫定律,一、洛特卡定律平方反比分布揭示著者与发表文献量的关系,描述科学生产率美国情报学家洛特卡(A.J.Lotka)提出了定量描述科学生产率的平方反比分布规律 f(x)=c/x2f(x)为发表x篇论文的著者出现频率(即占作者总数的比例)c为常数,经计算c,得c=6/20.6079(即60.79%)当x=1 f(1)=c 其含义是约60%的著者仅发表一篇论文写二篇论文的作者大约是写一篇论文作者数量的1/4(1/22)写三篇论文的作者大约是写一篇论文作者的1/9(1/32),2018/6/17,72,应用:用于预测著者数量和
37、文献数量,便于检索和管理,便于研究人才洛特卡定律有局限,是一般的理论估计,不是一个精确的统计分析。影响平方反比分布有两个最主要的量:一是统计研究的时间区间(10年以上),而二是统计研究对象的作者集合(1000位以上)。,2018/6/17,73,二、齐普夫定律省力法则词汇在文献中出现的频率齐夫是美国语言学教授,试图证明自然语言词汇的分布服从于一个简单的定律,他称这一定律为“省力法则”。只用一个词表达概念最省力;每个概念都能用一个词表达理解起来最省力。,2018/6/17,74,如果将一篇较长文章(约5000字以上)中每个词按其出现频率递减排列起来(高频词在前,低频词在后),并用自然语数给这些词
38、编上等级序号,出现频次最高的为1级,其次为2级这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:fr=c (c为常数)frk=c,2018/6/17,75,齐夫定律主要用于:标引与词汇控制(编制词表);检索(倒排文档,估算存贮量);用于计算图书馆的排架,合理选择图书馆的地理位置等。以英语为基础。 英文the出现频率最高,2018/6/17,76,三、布齐分布的机理 布氏定律、齐夫定律、洛特卡定律被认为是文献统计中最基本的定律,实际上,可以将它们看作是一个定律的不同表现形式,可以用下式统一表示:f(n)=c/n (12)它们都是按某一个具体对象在其主体来源中的出现频率
39、排序而导出的,在社会科学领域内是一种常见的分布现象。产生这种集中与分散的现象的原因是:成功产生成功(马太效应);省力法则(求近律)。,2018/6/17,77,第三节 科学文献的增长与老化 指数增长律与逐渐过时律,一、指数增长律假设:所有的知识都包含在已发表的文献中每篇文献含有等量的知识1普赖斯曲线以年代为横轴,以科学文献量为纵轴F(t)=aebt a是统计的初始时刻(t=0)的文献量 e=2.718 b表示持续增长率,其值近似等于文献年增长率用文献翻一倍的时间来衡量科学文献的增长速度,即 t=2/b t为文献量翻倍时间 b为持续增长率,2018/6/17,78,科学文献的指数增长规律在一定程
40、度上正确反映了文献的实际增长情况,但它仅仅是一个理想的模式。科学文献并不总是按指数模式增长。 2. 逻辑曲线考虑某些因素,有的学者提出科学文献按逻辑曲线增长的理论,作为对指数增长的一种补充和修正。F(t)= k 1+ae-bt F(t)代表时刻t的文献量,k为文献增长的最大值,2018/6/17,79,科学文献增长的初始阶段,是符合指数增长规律的;当文献增至最大植的一半时,其增长率开始变小,最后缓慢增长,并以k为其极限。文献的增长往往会出现几个急剧增长时期和几个相对稳定时期当科学发展到一定阶段时,科学文献的增长率为零,科学文献达到了不可逾越的最大值,没有新的文献产生。,2018/6/17,80
41、,3.文献增长与质量的关系勒希尔(rescher)认为:文献的数量与其质量有关。质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的增长速度,质量高的文献增长速度慢。她定义(01)为文献的质量级别,则不同级上的文献量为F(t).他给的的具体值如下:,2018/6/17,81,=1:至少是一般文献(实际代表所有文献)=3/4:至少是有意义的文献=1/2:至少是重要的文献=1/4:至少是非常重要的文献=0:第一流的文献对于第一流的文献(=0),文献数量为F(t)不同质量级别的文献量翻倍时间不同每10年才增加一份第一流的文献。,2018/6/17,82,4.科技文献数量增长的原因,最
42、根本的原因是科学技术规模发展和科技成果的不断涌现。(1)科研经费和科技人员数量的激增(2)科学本身呈现出迅速增长的趋势(3)通讯出版技术的改进和情报工作的加强,加速了情报交流,促进了科学文献数量迅速增长。,2018/6/17,83,二、科学文献的老化逐渐过时律文献的老化:科技文献老化是指科技文献随着其“年龄”(出版距今的时间)的增长,逐渐失去了作为科学情报源的价值,越来越少地被用户所利用的过程。情报的老化:情报的有效价值随时间的流逝而衰减的现象。,2018/6/17,84,半衰期:指某学科领域现时尚在利用的全部文献中的较新的一半是在多长一段时间内发表的。普赖斯指数:即某一学科领域内,对发表年龄
43、不超过5年的文献的引用次数与总的引用次数之比值。普赖斯指数越大,半衰期就越小,文献老化的速度越快。文献老化的因素:文献增长影响;文献的学科特点对老化的影响;文献的类型和性质对老化的影响;学科的不同发展阶段对老化的影响;用户需求及情报环境对老化的影响;语种及国家对老化的影响。,2018/6/17,85,第四节.文献的引用规律,一、文献引用的原因文献之间的相互作用反映文献相互联系,说明知识和情报内容的继承和利用。文献相互引用的原因:提供证据和说明,提供背景材料,评价或更正以前的著作,归誉与起源。,2018/6/17,86,二、文献引用关系1引文耦合两篇论文如果同时引用一篇或多篇相同的文章时,则称它
44、们在引文上是耦合的。引文耦:两篇论文具有一篇相同的参考文献,那么这两篇论文就有一个引文耦。,2018/6/17,87,2. 同被引两篇(或多篇)论文共同被后来的一篇或多篇文献所利用。同被引强度(同被引频次):以引用它们的论文数量来测定其联系的强弱程度。同被引所反映的是两篇被引用文献之间的关系。前者是由两篇文献的作者共同建立的,后者则由引用它们的作者建立的。引文耦合强度是固定不变的,同被引强度则时刻有可能发生变化。,2018/6/17,88,3 自引,文献自引机理:研究主题的自相关性被引用文献的可获得性主体的学术地位作者(群)的主观倾向,2018/6/17,89,三、引用文献的分布类型1按出版年
45、代分布2按语种的分布3按期刊的分布4. 按文献类型的分布,2018/6/17,90,四、引用分析的局限文献被引用,不一定反映重要性。著者选用引文受可获得性的影响。引文出现的数量不同,作用和目的不同。 五、期刊引用分析,2018/6/17,91,引用分析:用数学和逻辑学方法对期刊、论文、专著等研究对象的引证和被引证现象和规律进行分析,以揭示出它们所蕴含的研究对象所具有的特征或对象之间的关系的一种研究方法。几种指标:1期刊载文量:即在抽样期间内,某刊刊载论文的多少2期刊被引量:即在抽样期间内,某刊被别的期刊引用的次数3. 期刊的平均引用率:引文率:该刊参考文献除以期刊载文量 平均期刊引用率:某刊引
46、用的期刊数除以载文量,2018/6/17,92,4.影响因子数: 1979年引用该刊1978年和1977年文章的总次数 1978年和1977年该刊发表文章的总数5.学科影响因数:某刊中文章被某一学科中核心期刊引用的平均次数6.即年指标:用于测量期刊被利用的速度的指标 1979年对该刊该年发表文章的引用次数1979年该刊发表的文章的总数7.自引率:某刊自引的引文量 该刊全部引文量 被自引率:某刊自引的引文量 该刊被引用的总次数,2018/6/17,93,期刊引用分析的工具:期刊引用报告(JCR)美国费城科学情报研究所1969年创刊包括四部分:期刊排队部 来源数据部 期刊半衰期部 引证与被引证期刊部,