1、对我国高校机构知识库建设的几点思考对我国高校机构知识库建设的几点思考SomeThinkingofInstitutionalRepositoryConstructionintheUniversitiesofChina范亚芳渠芳(徐州师范大学徐州 221116)摘要高校机构知识库建设会遇到各种各样的问题,从建设的必要性,建设中的目标定位,资源内容定位,功能定位,服务模式,管理方法诸方面探讨,思考,为我国高校机构知识库的建设者提供参考.关键词机构知识库机构知识库建设开放获取1 对我国高校机构知识库建设必要性的认识中国高等院校是培养高层次人才的摇篮,是知识创新和知识传播与交流的重要场所,是科技成果产出
2、的重要基地.因此,收集,保存,管理,传播,利用高校系统内其成员的高质量数字化学术科研成果,对增强机构实力,赢取竞争优势等具有十分重要的意义.1.1 实施我国高校机构知识库建设,是有效捕获并保存机构内智力成果的需求高校既是一个培养高级人才的机构,也是一个学术科研中心.随着社会对教育科研的重视和科研经费投人的不断加大,以及广大高校教育科研工作者的努力,经过多年的积累,高校系统内产生了大量的数字化学术知识产品.这些个性化学术成果,在我国高校并没有得到系统,完整的保存,从应用现状来看也不那么尽如人意.如何赋有成效地保存高校系统内具有真正学术价值和交流价值的个性化学术成果,如何对机构内学术产品进行统一分
3、类,标引,加工,存储,建库,保存,检索和利用,如何给本校乃至全球的用户提供一个交流与沟通的平台,如何更好地发挥机构内学术成果的最大效用.显得非常重要.实施高校机构知识库建设,可将校园的学术资源集中在一起,可为机构的学术成就树立品牌,能为用户提供更为方便的捕获与利用机构内智力成果的学术交流平台.1.2 实施高校机构知识库建设,可增加各高校之间,各研究机构团体之间,各院系之间,各研究个体之间学术研究的可见性,促进学术活动的交流与沟通我国高校中的各教学单位,各研究机构大多都分条管理,由于各高校之间,各院系之间各教研室或实验室之间无论在物理位置还是科研活动方面都相互独立,彼此之间对相互之间的研究情况和
4、研究成果大多互不了解,在教学,科研的沟通与交流上存在一定的瓶颈.建立机构知识库可将各高校,各院系,各教研室或实验室,个体研究者的相关资料和学术研究成果存储下来,在一个共用的网络平台上发布,同时可提供无障碍浏览与检索,这样可彼此了解对方的研究状况,加强交流和沟通.1.3 传统的出版方式给用户的学术交流带来了许多障碍,*实施高校机构知识库建设可克服现有学术交流模式上的弊端一是传统出版方式时滞过长.科学研究的社会化,规模化及所谓大科学的出现,导致了科学发现的速度大大加快.在某些领域,科学发现的速度已快于期刊出版的速度.科研成果迅速增长使有限的印刷出版能力变得愈加不适应用户的交流需要,印刷出版周期过长
5、的滞后性直接影响用户的交流与学术资源获取的时效性.二是印刷本期刊与电子期刊价格的不断上扬,使得高校图书馆购买能力逐年下降.一项对美国期刊价格的调查表明,在过去的 16 年里,在平均通货膨胀率为 3.1%的情况下,期刊的订购价格平均增长了 9.5%.图书馆的订购经费无论如何都赶不上这样的增长,图书馆学术信息资源难以保障学术交流的需要.三是价格飞涨的学术性期刊,在一定程度上,不仅对学术信息造成了垄断,也影响着学术传播,限制了同行交流与合作的机会.由于诸多方面的原因,科学研究人员的学术成果只有在出版后,其学术成就和学术影响力才能被认可和传播.而科学研究人员出版或发表学术成果时,要向出版单位支付高额的
6、出版费用,当科学研究人员所在校园图书馆或个人需要收藏利用这些学者出版或发表的学术成果时,还需要向出版单位或数据商支付高额的使用费.这些都为学术成果的传播,交流与利用设置了障碍.实施高校机构知识库建设,可借助于互联网这一方便,快捷的运行平台,低成本,高效益,灵活方便地获取信息资源,促使机构的研究成果在研究人员之间免费,快速交流.2 对我国高校机构知识库建设的分析思考我国高校机构知识库建设,要根据各高校的实际情况,从机构内,机构与机构之间,各地区之间乃至国家层面加以考虑,采取多种形式将校园内的各种学术资源集中在起,实现机构内,机构与机构之间,各地区之间乃至国家层面数字学术资源的长期保存,为高校机构
7、内各种智力产品的保存与传播提供了一个实用的框架,促进高校内学术的交流与沟通.因此,高校机构知识库在实施的过程中必须从以下几方面加以考虑.2.1 目标定位各高校在建设自己的机构知识库时,首先基金项目:江苏省教育厅人文社会科学研究成果之 编号:06JSB870002);江苏省高校人文社会科学研究项目编号:06B870002)成果之.作者简介:范亚芳,女,1960 年生,副馆长,副研究馆员 ;渠芳,女,1975 年生,馆员.圈要明确机构知识库所承担的使命与责任.要建设一个什么样的机构知识库,采取什么样的技术方案,系统设计的基本原则是什么,采取什么样的设计模式和方法,为实现长期保存而应该采取什么样的技
8、术路线等等.再则要明确机构知识库主要的服务对象.确定机构知识库将为机构中的哪一部分人服务的,明确双方的权利和义务.因为在目前的体制中,机构中不同部门,不同人员之间以及不同机构之间除了合作之外,还存在着竞争,只有明确了权利和义务,使员工在履行向机构知识库提交知识产品义务的同时,享有利用其中资源的权利,才能够激发员工呈缴其作品的积极性和主动性.2.2 确定机构的覆盖范围机构知识库构建的主体和收藏的地域界限是机构,机构可以是实体的,也可以是虚拟的.就实体的机构来讲,可以是大学,也可以是大学共同体或大学联合体等.就虚拟的机构来讲,可以是数字科研环境下出现的虚拟联合实验室,e 一研究院等 .因此,在建设
9、机构知识库时,需要明确其对实体机构和虚拟机构的覆盖范围.2.3 制定机构知识库建设的各种方针,政策 a.制定机构知识库的收藏政策,确保机构知识库建设的规范,保障机构知识库建设稳步,长久的发展;b.制定便于操作的学术性 ,个性化资源选取原则,确保机构知识库的学术质量,摈弃没有学术价值的普通资料存储到机构库中,影响机构知识库的学术价值:C.制定学术成果提交原则,对学术成果提交者,审核者,提交程序,提交内容的格式,不同类型产品的提交标准等做出规定,做好学术成果的质量控制工作;d.制定学术成果提交的元数据标准及质量控制规范,便于资源的共享与交流;e.制定版权保护政策,根据资源提交者的要求和不同的文献类
10、型对用户的权限设置控制等等.2.4 资源定位机构知识库收录的应是机构内成员具有个性化的学术研究成果.因此,在机构知识库资源的定位上,要对机构内的资源进行系统的分析与研究.从机构库研究成果的出版状态来看,有在正式刊物上发表的学术着作,有尚未发表的学术着作;从出版的形式上看,有期刊,图书,学位论文 ,会议论文等;从文件格式上看,有图像文件,文本文件,视频文件 ,音频文件,图形图像等;从所隶属的学科门类看,有哲学 ,政治,法学,经济学,教育学,文学,历史学,理学,工学,农学,医学,管理学等多种文献类型;从学术研究的性质,目的和过程方面看 ,有基础研究,应用研究和开发性研究等,由于资源种类繁多,形式类
11、型不一.因此,我国高校机构库建设者应该根据机构的性质和机构库的建设目的通盘考虑,进行资源类型的筛选,确保机构知识库建设的质量.25 功能定位机构知识库是为世界用户免费获取机构内资源提供服务的存储仓库,因此,在建设中必须考虑下面几点功能.a.提供按各种方式组织,浏览,检索学术产品的功能.如提供按“中图法 “学科等级体系 ,采用层次式组织,浏览学术产品的功能;提供按学科主题组织,浏览,检索学术产品的功能;提供按实体组织浏览,检索学术产品的功能(如机构中的具体院系);提供按文件格式组织浏览,检索学术产品的功能等等.b.提供机构之间的跨库检索功能.为实现机构知识库之间的互操作,也为了能够使机构知识库的
12、内容被其它搜索引擎或检索工具访问,在单个机构知识库的建设上,要注意考虑机构知识库创建,信息采集,组织和管理的规范化问题,避免出现单库检索与多库检索的不统一,不一致,提高多种机构知识库检索的查全率和查准率.C,具有存储内容格式类型不限的功能.由于机构成员的研究成果形式不一,产生不同类型的文件格式,因此,机构知识库系统必须要考虑对各种数字化资源进行存储,如文字,图像,音频,视频等.d.具有良好的人机界面与管理功能.如:在 Web 界面下,可以方便地按不同的方式浏览机构知识库中的条目;同样在 Web 界面下,管理员可以在机构知识库系统管理界面中创建或删除相关的数字对象,对数字对象的权限进行控制管理,
13、对用户与群组进行控制管理,对数字对象的相关元数据进行编辑等.e.具有统计分析功能.系统的安装,运行和使用情况对系统管理人员是至关重要的,因此,系统必须提供详细的日志记录,各种统计报表等.f.具有动态更新功能.一般来说,信息一旦输入数据库就不再发生变化,但有些学术产品提交者,为了使最新研究成果能在最短的时间内发布,提交者可根据自己的最新研究随时修改,更新以前提交给机构知识库的信息,使机构知识库体现出明显的动态性特点.2.6 构建工具当前世界各国机构知识库的建设主要采用两种方法:一种是自行开发研制专用软件,用于机构知识库的建设;另一种是使用专用软件,用于机构知识库建设 .多数大学,科研机构采用后一
14、种方法.目前,世界各国用于机构知识库建设的成熟工具主要有 DSpace,Eprint,Bepress,Fedora 等.DSpace 系统是由麻省理工学院图书馆(MIT)与惠普实验室(HP)共同开发的项目,DSpace 系统发展至今,已经发布了 10 个版本,在 DSpace 官方网站上有登记,并使用 DSpace 系统的教育科研机构已经有 145 家.我国厦门大学图书馆,中国科学院国家科学图书馆正在使用该系统构建自己的机构存储仓库.Eprint 是由南安普顿大学开发的一个通用免费软件,主要用于建立基于 Web 的档案系统 .采用 Perl 语言开发,运行在 GNU/LINUX/UNIX 系统
15、上,但不能在 Windows 系统上运行,目前已有 130 余家网站使用.Bepress 是 BerkeleyElectronicPress 开发的一个系统,它的核心软件是 EdiKit,可以对用户的工作流和站点的设计进行定制,具有很强的灵活性.Fedora 是基于 web 的开放源码的软件,是弗吉尼亚大学与康奈尔大学在梅隆基金会的支持下,建立的一个复杂的数字对象知识库系统,可用于构建机构知识库,数字图书馆,内容管理系统等多种目的.3 对高校实施机构知识库建设服务模式的思考机构知识库服务对象为资源使用者,资源提供者及建库工作人员.3,l 对资源使用者的服务模式 a.主页获取服务模式.即用户直接
16、登录机构知识库,通过机构知识库整合后提供的浏览,检索界面,来查询获取机构库中的免费资源.b.元数据收割服务模式.元数据为各种形态的数字化信息资源集合提供了规范化的描述方法和组织基础.这些灵活多样的元数据之间存在着集成和互操作性问题.OAIPMH 协议的出现则为元数据的互操作性问题提供了一个高效的解决框架.0AI 是一个旨在促进网络信息资源开发,发布与共享的一个合作组织.该协议充分利用已有相应领域的通用元数据规范,推出元数据级的共享模型选择性收割,通过选择性收割方式来定义一个技术框架用于来满足上述共享要求.该协议起点低,适豳合于系统间元数据的周期性的交换,为网上信息发布提供了独立于应用的互操作框
17、架.OAI 从逻辑功能上看分两类: 一类是数据提供者(DataProviders);另类是服务提供者(ServiceProviders).前者支持 OAI 协议,以协议规定的方式发布元数据;后者向前者构建的系统发送 OAI 协议请求,然后使用从前者那里返回的元数据作为增值服务的基础,用户再从服务提供者得到增值的服务.目前,国外各种实用的机构知识库,几乎都遵循 OAIPMH 协议,以 0AI 数据提供者的身份开放自己的数据库,对外提供基于 0AIPMH 的元数据收割服务.C.web 服务模式 .web 服务是一种基于对象 /组件模型的分布式计算技术.在 Web 服务技术中 ,整个网络成为一个开放
18、式的组件平台,通过组合不同的 web 组件,应用程序很容易就能够得到近乎无限的扩展,从而满足用户的各种功能要求.利用 web服务模式可以将机构知识库的各个业务逻辑和功能模块包装成 web 服务, 并将这些 web 服务发布到 UDDI 注册中心,以便其他系统来集成这些 web 服务,从而实现对机构库中资源的获取.d.元搜索服务模式.即在用户与各个资源实体之间架构一个搜索中间件,通用搜索引擎的爬行器抓取机构库中的所有数据,来实现对不同资源实体中文档的有效检索和利用.3.2 对资源提供者的服务模式 a.分布式提交模式.资源提供者从互联网上的任意一台计算机上登录进人机构知识库网站的提交页面,依据研究
19、成果提交规则,选择或输人研究成果的元数据,并将元数据连同成果一起提交到机构库中.该模式完全由资源提供者本人提交与管理个人的研究成果,简单,方便,快捷.但也存在一定的问题,如:由于研究成果为资源提供者直接提供,会造成机构库内容质量难以控制;研究成果的元数据为提供者自己标引,会造成元数据标引的不准确,影响资源获取者检索机构知识库时的查全率和查准率.b.集中式提交模式.由资源提交者将研究成果提交给图书馆或机构内资源提供负责人,由机构知识库资源提交负责人帮助资源提交者对研究成果进行元数据加工与研究成果的审核上传与提交.集中式提交模式由于机构图书馆等专职人员的参与,能使机构库的质量得到一定的保证,但不便
20、于资源提交者适时,动态更新.C.半分布半集中式提交模式.研究成果由机构内各部门,各研究单位负责提交.资源提供者将研究成果的原件提供给所在部门或单位,由部门或单位指定的专门人员为研究成果选择元数据,并提交到机构库.由于半分布式半集中式提交模式采取部门集中审查,集中提交的方法,可以避免部分人不负责任地随意提交,而且由于一个部门内的研究成果往往属于同一个学科,审查人员一般也具有该学科的专门知识使得元数据质量和成果质量都有所保汪.再则资源提供者对于最新研究成果也可及时提供给部门或单位资源提交负责人,及时更新原来提交过的研究成果.3.3 对机构知识库建库工作人员的服务模式 a,集中提交服务模式.该模式主
21、要是针对集中式提交,半分布半集中式提交模式而实施的管理方法,要求工作人员依据资源提交者提供的原文件,进行元数据标引与研究成果的上传.b 分布式提交服务模式.该模式主要是针对分布式提交模式的管理方法,要求工作人员对机构知识库提供的研究成果实时跟踪监控,及时删除不符合机构知识库建库标准的资源,以保证机构知识库的学术价值含量.4 对高校机构知识库建设其它问题的思考4.1 组织管理问题我国高校机构知识库建设,必须要明确组织管理的责任单位.从国外的建设经验看,一般是由图书馆负责提供基础设施,实施建库工作的.据调查,我国高校教师,科研人员对机构知识库的认识不深,这需要机构知识库建设人员向机构员工,学生进行
22、宣传.使员工,学生对向机构知识库提交学术成果,利用机构知识库学术成果成为一种自愿行为.同时要根据机构知识库的不同服务模式,做好资源提交人员,审查上传人员,分机构负责人员的合作协调关系,建立完善的协作机制,保证机构库的顺利建成和正常运行.4.2 质量控制与评价问题由于传统出版模式在长期的发展过程中形成了一整套的质量控制与评价机制,如专家评审或同行评议制度等,从而保证了出版物的质量.而机构知识库提交的文献不仅包括已在传统学术期刊上发表的学术性论文,正式出版发行的学术专着,还包括大量未发表的研究成果,科学研究数据,学习资料,工作文件等.如何针对不同类型的资源建立相应的质量控制和评价体制,如何运行这一
23、套评价制度,保证机构知识库的质量,树立机构知识库的质量声誉,是机构知识库建设将需要急需研究的问题.4.3 经费问题建设机构知识库,要根据机构知识库的建设规模,有明确的资金支持计划,以保证机构库正常运行.因此,高校机构库承办单位,要争取校领导的支持,将机构知识库建设作为学校事业发展的一项经常性工作来做,初始建库给予专项资金支持,每年拨出专款,用于机构知识库的硬件投人,软件升级,系统维护,人员培训等.我国高校机构知识库建设刚剐起步,它虽然不是一个浩大的工程,但意义深远.相关管理部门应出台一些相关政策,规范,支持机构知识库的建设工作.随着机构知识库建设的增多和知识库中内容的不断充实,相信它对教学,科
24、研的支持能力将不断提高,将成为未来世界数字环境下学术交流和知识共享的有效平台.参考文献1 郭少友机构库建设的若干问题研究中国图书馆,2006;(1)2 常唯机构知识库:数字科研时代一种新的学术交流与知识共享方式图书馆杂志,2005;(3)3CliffordALynch,JoanKLippincott 着;孙茜译机构知识库在美国的发展.图书情报工作动态,2005:(11)4 董文鸳,袁顺波聚集学术机构知汉的中心:机构库(InstitutionalRepository)探析图书馆杂志,2005;(8)5 宋承志略论机构知识管理对图书情报机构的意义图书馆学研究.2003;(4)6 胡莹实施机构存锗库的需求性分析图书情报论坛,2005;(2)7 李字,张秋开放式信息资源 MITOCW 的本地化图书情报工作,2006;(5f 责编:梅加勃)回