收藏 分享(赏)

信息服务与用户 第三章 信息分布.ppt

上传人:tkhy51908 文档编号:7942071 上传时间:2019-05-30 格式:PPT 页数:45 大小:294KB
下载 相关 举报
信息服务与用户 第三章 信息分布.ppt_第1页
第1页 / 共45页
信息服务与用户 第三章 信息分布.ppt_第2页
第2页 / 共45页
信息服务与用户 第三章 信息分布.ppt_第3页
第3页 / 共45页
信息服务与用户 第三章 信息分布.ppt_第4页
第4页 / 共45页
信息服务与用户 第三章 信息分布.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、,第三章 信息分布,主要内容:以文献信息为对象,从纵向(随时间变化的分布动态)和横向(不同载体、领域的分布动态)来研究信息分布的特征和规律。,3.1 信息产生与分布中的马太效应,来源:它的名字来自于圣经新约马太福音 中的一则寓言。“凡是少的,就连他所有的,也要夺过来。凡 是多的,还要给他,叫他多多益善。”,扩展 1968年,美国科学史研究者罗伯特莫顿 (Robert K. Merton)首次用“马太效应”来描述这种 社会心理现象。任何个体、群体或地区,一旦在某一个方面 (如金钱、名誉、地位等)获得成功和进步,就会 产生一种积累优势,就会有更多的机会取得更大的 成功和进步。,3.1.1马太效应的

2、表现和作用形式核心趋势 高产或核心作者 核心期刊 高频词汇的确立特征:是信息生产主体(行为者)的主动期 望与采取实际步骤的结果,集中取向 一篇论文多次被引 一个网站被众多用户点击特征:是社会选择和影响的结果,马太效应在人类社会中普遍存在,被广 泛引申和应用。经济中的马太效应举例:贫者越贫,富者越富。品牌资本的马太效应举例:品牌知名度越大,品牌的价值越高,其忠实的 消费者就越多,市场份额越大。,教育中的马太效应举例:越是教授、专家,得到的科研经费多,社会兼 职越多,各种名目的评奖似乎就是为他们设立的。过度投资建设名校。资金、师资、生源严重 向名校倾斜,而薄弱院校却出现了人、财、物的全 面危机。将

3、学生分为三六九等,给予不平等的待遇。,科学领域的马太效应举例:相对于那些不知名的研究者,声名显赫的科学家通常得到更多的声望即使他们的成就是相似的,同样地,在同一个项目上,声誉通常给予那些已经出名的研究者,结果,研究成果越多的人往往越有名,越有名的人成果越多,最后就产生了学术权威,3.1.2 马太效应的影响正面影响突出重点,降低信息管理的成本,提高信息利用效益 在理论上,基于马太效应描述的优劣,发现信息管 理学的基础性定律。防止社会过早地承认那些还不成熟的成果或过早地 接受貌似正确的成果“马太效应”所产生的“荣誉追加”和“荣誉终身”等对无 名者有巨大的吸引力,促使无名者去奋斗,而这种奋斗 又必须

4、有明显超越名人过去的成果才能获得向往的荣誉。,负面影响易使信息工作者按简单的优劣进行复杂多变的信 息管理工作信息分布富集有时是表面的、外在的过分注意核心信息源马太效应青睐名人、拒绝新人的习惯势力不利于 新人成长,限制了新思想、新知识和新信息的产生及 传播。,启示 发挥好的方面:促进资源的优势积累和整合,所谓“集中力量办大事”。 促进良性竞争。都有一种“一步领先、步步领先,一步 落后、步步落后”的进取意识, 为社会进步提供强大动力。去除坏的方面:在资源和利益分配中坚持效益与公平兼顾的原则。加快制度性规范的建设。,3.2 信息生产者分布规律,信息生产者在信息生产过程和生产结构 中呈现何种规律,这种

5、规律对信息分布有何 影响。洛特卡定律普赖斯定律,3.2.1洛特卡定律,洛特卡定律是由美国学者A.J.洛特卡在 上世纪20年代率先提出的描述科学生产者生 产率的经验规律,又称“倒数平方定律”或“平 方反比分布”。,它描述的是科学工作者人数与其所著论文之间 的关系:生产2篇论文的作者数量约为生产1篇论文的作 者数量的1/4;生产3篇论文的作者数量约为生产1篇 论文作者数量的1/9;生产n篇论文的作者数量约为生 产1篇论文作者数量的1/ n2,而生产一篇论文作 者的数量约占所有作者数量的60。该定律被认为是第一次揭示了作者人数与生产 论文数量之间的关系。,洛特卡定律应用举例:当某一领域中生产6篇文献

6、的作者数量是 1000人,估计该领域作者总量约是多少?(1)生产一篇论文的作者数量:62*1000=36000人 (2)生产一篇论文的作者数量占所有作者数量的60%,故:36000/60%=60000人,3.2.2普赖斯定律,核心生产者分布的“平方根定律”:在某一特定领域中,全部论文的半数系由 该领域中全部作者的平方根的那些人撰写的。In(x)=N1/2m+1式中,n(x)为撰写x篇论文的作者数; I=nmax为该学科规定时期内最高产的作者数; N为该学科领域全部作者总数。,M=0.749(nmax)1/2式子表明,高产作者中一位最低产的作者发表 的论文数量,等于最高产作者所发表论文数的平方

7、根的0.749倍。K=0.812/(nmax)1/2式子表明了高产作者人数同全体作者人数之间的 比例关系。价值:简洁地描述了信息按生产者能力的分布情况。,信息生产者分布规律揭示了少数信息生 产者生产了大量信息的规律和特点,充分显 示了马太效应的作用效果。,3.3 信息离散分布规律,信息的离散分布是信息的重要属性,它表现 为信息的内容单元以不同方式从不同角度分布于各 种载体中。信息的离散分布是人类所有信息活动的基 石,也是对信息进行有效管理的基础。因而研究信 息的离散分布规律是信息管理学科的重要课题。布拉德福定律齐夫定律,3.3.1布拉德福定律,揭示论文在科学期刊中的分布情况英国著名文献信息学家

8、布拉德福发现,某一学 科领域中的相关论文在期刊中的分布是不均匀的, 而且具有明显的集中与分散规律。布拉德福他在长期的观察和统计基础之上,提 出了有名的“布拉德福分散定律”(Bradfords Law of Scattering),简称为布拉德福定律或布氏 定律,“如果将科学期刊按其刊载某个学科主题的论文 数量,以递减顺序排列起来,就可以在所有这些期 刊中区分出载文率最高的核心部分和包含着与核心 部分同等数量论文的随后几区,这时核心区和后继 各区中所含的期刊数成1aa2的关系(a1)。”这 就是布拉德福定律的区域表述形式。,应用地球物理学论文的布氏分布,布拉德福定律应用举例:运用布拉德福定律研究

9、中国沙棘文献的核心期刊,说明: 布拉德福定律有两个基本要点: 频次等级排序,形成主体来源(期刊)的有序目录 确定相关论文在主体来源中的分布规律 具体方法则包括区域分析和图形描述 布拉德福定律主要揭示的是宏观层次的信息(文献)离散分布,而对于微观层次的信息(内容单元)分布的研究则基本上是空白。,3.3.2齐夫定律,词汇是表达和载荷信息的基本单元。词 汇的选择、使用及出现频次必然影响信息的 分布。齐夫定律是美国学者G.K.齐夫于上世纪 40年代提出的词频分布定律。,1.齐夫定律的表述如果将一篇较长文章(约5 000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些

10、词编上等级序号,出现频次最高的为1级,其次为2级这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:fr=c (1)式中c为常数。上式称为齐夫定律。,词频分布,齐夫定律的修正,如果建立f与r的直角坐标系,用纵坐标表示 词的等级序号,横坐标表示出现频次,就得到一条 双曲线。如果等级r与频次f都取对数,则双曲线变 成一条直线。,1,2,3,4 5 6 r,f 200 150 100500,lgf,lgr,frb=c(2)取b=1,(2)式与(1)式相同,因此可以将 (2)式看做是对齐夫定律的修正。,说明: 齐夫定律是对自然语言词汇统计所得到的规律,研究表明,人工语言及人工

11、语言语词构成的集合同样满足齐夫定律。 齐夫定律通过研究英语语言词汇得出的结论,同时完全符合汉语语言词汇的分布。,3.4信息对时间的分布规律,研究信息在时间轴上的动态分布规律, 揭示信息的增长与老化,刻画信息随时间的 推移所表现出来的趋势。指数增长律逐渐过时律,3.4.1指数增长律,普赖斯曲线如果以文献量为纵轴,以历史年代为横 轴,把各不同年代的文献量在坐标图上逐点 描绘出来,然后以一光滑曲线连接各点,则 可十分近似地表征文献随时间增长的规律。 这就是著名的普赖斯曲线。,普赖斯曲线,1665 1750 1800 1850 1900 1950 t,F(t) 10000100010010,通过对曲线

12、分析,普赖斯最先注意到文献增长与时间成指数函数关系。如果用F(t)表示时刻t的文献量,则指数定律可表为下式:F(t)=aebt (1)式中:a是统计的初始时刻(t=0)的文献量 e=2.718b表示持续增长率人们还常常用文献量翻一倍的时间来衡量文献的增长速度,即t=ln 2/b (2)式中:t为文献量翻倍时间,b为持续增长率。,实际的统计发现,不同时期、不同级别、不 同质量、不同学科领域的文献信息增长态势是不一 样的。勒希尔考察了不同质量级别的文献增长状况,发 现它们的增长速度差别很大。勒希尔认为,文献的 数量与其质量有关。他定义(01)为文献的 质量级别,则不同级别上的文献量为F(t)。如果

13、文献量翻倍时间为t,那么质量为级的 文献数量翻倍时间将是t/。,他给的具体值如下:=1:至少是一般文献(实际代表所有文献)=3/4:至少是有意义的文献=1/2:至少是重要的文献=1/4:至少是非常重要的文献=0:第一流的文献对于第一流的文献(即=0),文献数量lnF(t)。,生长曲线普赖斯指出,考虑物质的、经济的、智力的及 时间的影响和限制,文献信息的增长更趋近于生物 的生长曲线(Logistic Curve),即最初生长或 繁殖很快,随着时间推移,其生长速度越来越慢, 致几乎不增加了。其方程为:F(t)=k/(1+ae-kbt)式中:F(t)代表时刻t的文献量,k为文献增长 的最大值。,生长

14、曲线,K/2,Ln a/kb,t,F(t),生长曲线表明,在文献增长的初始阶段,它是符合指数增长规律的,当文献增至最大值的一半时,增长率开始变小,最后缓慢增长,并以k为其极限。,生长曲线的描述,一般来说,在不同的阶段科学文献增长的 态势是不同的。学科处于诞生和发展阶段,文献量指数增长,文 献的寿命较短。学科进入相对成熟阶段,文献增长就不能总保持原 有的指数速率,增长率变小,曲线变得平缓,文献寿命 相对变长。某一知识领域的研究取得重大进展后进入相 对成熟的阶段。内容上更新的文献又将进入一个新的急 剧增长时期(如指数增长)。然后又进入一个稳定时期。文献的增长往往会出现几个急剧增长时期和几个相 对稳

15、定时期,呈现出错综复杂的格局。,3.4.2逐渐过时律,随着时间的推移,信息的价值会逐渐衰 减乃至失效。文献老化 文献信息的老化一般指这样四种情形: 文献中所含信息仍然有用,但现在已被 包含在更新的其他论著中;文献中信息仍旧有用,但现在正处于一个人们 对其兴趣下降的学科;文献中的信息仍有用,但为后来的著作超越;信息不再有用。,衡量文献老化的指标文献半衰期是指某学科领域现尚在利用的全部文献中 的一半是在多长一段时间内发表的。半衰期大体上与某学科领域的文献中半数失 效所经历的时间相同。例如:物理学文献的半衰期是4.6年 意思:(1)现仍在利用的物理学文献的50%,其 出版年龄不超过4.6年。(2)物

16、理学文献一半失效的时间是4.6年,普赖斯指数 即某一学科领域内,对发表年限不超过5年 的文献的引用次数与总的引用次数之比值。一般来说,普赖斯指数越大,半衰期就越 小,文献老化的速度越快。,文献信息老化曲线,用纵坐标表示现在正被引证的文献量, 横坐标表示时间,绘制出文献的老化曲线。 相应的方程可表示为:C(t)=ke-at式中:C(t)表示发表了t年的文献的被引次数,k是常数,随学科不同而异,a为老化率。,被引证次数C(t),出版年龄t,t1,t2,t3,0.5,文献信息老化的影响因素,文献增长。文献的增长和老化是一个事物的两个方面,它们从不同的侧面来描述科学的发展,阐明科学知识的修正率。 学科差异。世界上93%98%的科学杂志引用寿命为20年左右,但并不是所有这些学科的文献老化速率都大体一致,相反,彼此之间差异甚大。 学科发展阶段的差异。即使是同一学科,不同的时期或阶段,文献的半衰期不尽完全相同。 信息环境和需求。不同信息用户对文献的需求是不同的 ,因而信息利用者的需求及所处的信息环境 的研究十分必要。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报