1、数字图书馆复习题1、数字图书馆的早期提法是什么?数字图书馆的定义。数字图书馆早期的提法是电子图书馆。基于数字图书馆的三个基本特征:数字资源、网络服务、特色技术可以将数字图书馆定义为数字图书馆是以数字信息资源为基础,并使用网络及其特色技术为用户提供信息服务的组织。2、数字图书馆的支持技术包括哪些?在数字图书馆的研究中形成了哪三大学派,对其进行比较?其代表项目是什么?数字图书馆的技术支持包括:通用信息技术(计算机技术、网络技术、信息安全技术)和专用创新技术(信息处理与加工技术、海量信息存储技术、分布式资源运行与管理技术、多媒体信息标引与检索技术、信息挖掘技术、个性化信息定制与发布技术、信息可视化与
2、读者界面技术、信息安全技术、数字权益管理技术) 。在数字图书馆的研究中形成了资源主导学派、服务主导学派、技术主导学派三大学派。资源主导学派以资源数字化为目标,借助一定的技术手段,不一定是最先进的,提供因特网浏览和检索。其特征是可以是资源网站,任何商业机构、个人都可以开发建设,很多项目属于传统图书馆资源的数字化。代表项目是:美国记忆,日本大多数数字图书馆。服务主导学派以各类资源库的整合和系统服务为目标,结合各种先进的服务手段,如个性化服务、自动定制等,并常常用到各种电子商务手段,如用户认证、付费管理等。其特征是深层次情报服务,常常是传统图书馆向数字图书馆转型期的必然选择。项目代表是加利福尼亚数字
3、图书馆项目和大英图书馆项目。技术主导学派以涉及数字图书馆资源获取、存储、组织、检索、发布和版权管理等方面的技术创新和开发为目标,资源库通常作为测试环境或副产品。其特征是求得某一方面的技术进展,成果为技术报告,资源库只作为测试环境(Testbed) 。代表项目:DLI1和 DLI2项目。3、数字图书馆的体系结构主要有哪些类型?主要有两种类型:信息体系结构和技术体系结构。4、数字图书馆的可用性包括?数字图书馆体系结构可从哪些方面评价?可用性包括:易学、易用、容错、愉悦、服务差异化。评价标准:开放性、互操作性、扩展性、可伸缩性。5、数字图书馆的最主要特征。对传统图书馆与数字图书馆进行比较。数字图书馆
4、的特征包括:文献内容数字化、利用计算机技术管理以数字化的资源、信息储存量大、文献信息传递网络化、广泛可存取性、资源共享性、开放性、占用空间小、利用方便。对传统图书馆与数字图书馆进行比较。(1)在功能方面:数字图书馆以科学方法、专用特色技术收集、组织整理、保存数字资源;通过网络提供信息服务。传统图书馆以科学方法采访、整理、保存印刷与非印刷资料;提供读者服务(2)在主要特征方面:数字图书馆强调访问数字资料,而不管它们实际存储在什么地方,数字化消灭了对拥有或者存储物理实体的需要。编目深入到单个单词以及符号。基于超链接的浏览,浏览方式有了更多的选择,如按关键词或相关度。相同主题的材料不必在物理上彼此挨
5、在一起。网络技术,用户不必亲自造访一座数字图书馆。传统图书馆强调物理实体的保存和保藏在一个较概略的级别(而不是细节)上编目,例如,它建立author 和 subject 索引而不是对全文的索引。浏览要求相关材料的物理位置上靠近,例如,社会学的书在书架上挨在一起排列。信息被人为地汇集在一个地方,用户必须去图书馆,才可了解它们在什么地方和利用它。6、国内外数字图书馆的运行模式。国内三种模式:国家与单位投入,免费提供给用户使用;国家与单位投入,市场化运行;企业自己投入,市场化运行。国外种模式:国家投资;基金会等机构赞助;专业机构投资。7、对已有资源的数字化目前主要采用哪些技术?主要采用:人工键盘录入
6、、扫描录入、OCR(Optical Character Recognition) 、视频音频捕捉。8、数字图书馆产生的内在、外在因素有哪些?内在因素:印刷型文献的保存问题与文献信息的利用问题。外在因素:文献信息资源剧增、信息高速公路的建设和 Internet 的发展、数字化技术的发展。9、数字图书馆信息体系结构的主要构件及其作用是什么?数字对象、句柄、仓储。数字对象是数字图书馆体系中储存的实体和对象,有元数据、数字资料、句柄或调度码组成。句柄标识数字对象。仓储存储数字对象。10、数字对象由哪几部分组成,每部分的作用是什么?数字对象由元数据、数字资料、句柄或调度码构成。元数据描述、组织、管理数据
7、对象。数字资料,提供数字图书馆的原型资料。句柄用于标识数字对象。11、数字图书馆的形成过程包括哪几个方面?文献资源数字化、数字资源的集成、数字资源的共享。12、支持动态 Web 生成的技术包括哪两种?客户端技术(客户端脚本技术、组件技术、DHTML、Java applet)和服务器端技术(公共网关接口(CGI) 、服务器端脚本技术、servlet 技术)13、句柄和 URL 的语法结构。句柄的语法结构:hdl: naming authority/item ID(hdl,指出该字符串是 handle 类型;naming authority,命名权威代码(前缀) ,包括两部分,以“”隔开;item
8、 ID,项目标识符)URL(Uniform Resource Locator)的句法结构:protocol:/ server name /path/file name /(协议:/服务器名/路径/文件名,其中服务器名包括了主机和端口)14、基于三层客户机/服务器模式的数字图书馆指的是什么?指的是:以 Web 为中心的浏览器/Web 服务器/数据库(B/S/D)模式的数字图书馆。15、数据挖掘所需海量数据的来源。数据库与数据仓库的区别。数据挖掘所需海量数据的来源是数据仓库。数据库与数据仓库的区别:(1)数据内容上:数据库是当前值,数据仓库是历史的、存档的、归纳的、提炼的数据(2)数据目标上:数据
9、库是面向业务数据操作,重复处理,数据仓库是面向主题域,分析应用(3)数据特性上数据库是动态变化、按字段更新,数据仓库是静态,不能直接更新、只能定时添加、刷新(4)数据结构上:数据库是高度结构化、复杂,适合操作计算,数据仓库是简单,适合分析(5)使用频率上:数据库是高,数据仓库是中到低(6)数据访问量上:数据库是一次操作访问少量数据,数据仓库是一次操作可能要访问大量数据(7)响应时间上:数据库是以秒为单位,数据仓库是时间长16、在元数据的应用中,一个单一完整的元数据体系,应该包含哪些内容。一个完整的元数据体系,包含三个方面的内容,就是结构(structure)、语义(Semantic)以及语法(
10、syntax)的定义与描述。17、DC 的15个元素及其修饰词有哪些。DC 的15个元素是:题名(title) 、创建者(creator) 、主题(subject) 、描述(Description) 、出版者(publisher) 、其他责任者(contributor) 、日期(date) 、资源类型(resource type) 、格式(format) 、标识(resource identifier) 、来源(source) 、语言(language) 、联系(relation) 、覆盖范围(coverage) 、权限(rights) 。他们的修饰词分别是:题名:alternative,描述
11、(说明):table of contents、abstract,日期:created、valid、available、issued、modified,格式:extended、medium,关联:is version of、has version、is replaced by、replace、is required、is part of、has part、is referenced by、references、is format of、has format,覆盖范围:spatial、temporal。18、在 HTML 中使用 DC 通过 HTML 的哪两个标签实现的?Meta 与 link 标
12、签。19、分析 DC 元数据集的特点。对 DC 与 MARC 进行比较。DC 的特点:简化资源描述与维护工作、元数据元素少,覆盖范围广、具有国际性、可扩展性、句法独立性与可选择性、可重复性、可修改性、与其他元素映射衔接性。MARC 与 DC 之间的联系1) MARC 是目前发展最成熟的元数据格式。有关人员在设计 DC 之前,即在一定程度上参考了 MARC,DC 字段的设计源于 MARC 中的字段,因此 DC 被称为“MARC的网络缩微版” ,它为 MARC 的进一步发展提供了理论和实践的空间。2) MARC 与 DC 在著录资料的相关信息上,都是数据的数据,目的都是将资料的相关信息格式化,都是
13、用来描述数字化信息资源的主题、内容特征,并通过字段中所著录的信息来提供检索的依据。MARC 与 DC 所记录的资料属性相同,如基本内容、主题性查询目的等。3) MARC 与 DC 均可在技术的支持下,通过运用目录协议、搜索和检索协议等多种形式开发利用。两者一经建立便可共享,并且在使用过程中由工作人员增加新的属性,使它们逐步完善。4) MARC与 DC 之间能够建立映射关系,通过程序,进行自动转换。MARC 与 DC 之间的区别1) 著录的格式不同;2) 著录的对象不同:DC 描述的是已经数字化的对象,主要是网络信息资源的描述;MARC 适用于形式相对稳定的物理载体,如印刷型出版物、图像、缩微、
14、数据库等;3) 著录的主体不同:专业人员与非专业人员之间的区别;4) 著录的详简程度不同:简单与复杂之分;DC 的著录相对比较简单,以“建立一套简洁而灵活的,且非专业图书馆人员也可容易掌握和使用的资源著录格式”为目标,提供一种比图书馆现行编目更有效率的方法。MARC 经过多年的发展,已经成为系统较完善,字段较完备,标准较严密的一种数据描述格式。5) 显示的形式不同:DC 为自己设置了两种 HTML 语言的标签“NAME”和“CONTENT” ,同时将每个单元都加了著录标识,著录时,DC 以使用 HTML 语言为输出结果的网络接口形式,也保留了自己的著录标准和系统。MARC 格式则必须首先在自己
15、所熟悉的软件系统中著录,输出著录结果,再将著录结果使用 HTML 语言加以标识,比较复杂。6) 产生的途径不同。在 CORC 系统中,DC 元数据的产生主要有两种途径:一种是通过 OCLC 网络编目软件直接制作,另一种是通过 import 的方式来获取。MARC 记录则必须经过专用的编目软件,由通过一段时间严格培训的编目员进行编目,以独立数据库或文件形式存在,与其所描述的对象分离,在进行数据处理时对软件平台的依赖性较强。20、元数据的功能包括哪些?描述资源功能、管理资源功能、应用性元数据的功能。21、DC 元数据的产生主要有两种途径。一种是通过 OCLC 网络编目软件直接制作,另一种是通过 i
16、mport 的方式来获取。22、数字图书馆系统的安全内容包括哪些?防火墙的作用是什么?消息摘要模型?数字图书馆系统的安全内容包括:硬件安全、软件安全、运行安全、计算机系统安全立法。防火墙的作用是(1)可以限制他人进入内部网络,过滤掉不安全服务和非法用户;(2)防止入侵者接近内部其他的防御设施;(3)限定用户访问特殊站点;(4)为监视Internet 安全提供方便消息摘要(message digest):又称为数字摘要(Digital Digest)。它是一个唯一对应一个消息或文本的固定长度的值,它由一个单向 Hash 加密函数对消息进行作用而产生。发送方将消息和摘要一同发送,如果消息在途中改变
17、了,则接收者通过对收到消息的新产生的摘要与原摘要比较,就可知道消息是否被改变了。因此消息摘要保证了消息的完整性。23、为什么说密钥是加密技术的关键?机密技术包括加密算法和密钥。密钥分为对称密钥和非对称密钥,加密密钥一般不对外界公布,即加密密钥一般来说对外界是保密的,它是一组用于打乱和恢复数据的特定代码,密钥越长越难破解,加密性能越好,同时较长的密钥会导致更长的加密时间。所以密钥是加密技术的关键。24、什么是直接连接存储(DAS)和网络连接存储存储系统?本地备份的特点。直接连接存储(direct attached storage) ,也叫做服务器连接存储(server attached stor
18、age) ,它是将外部存储设备直接连接在各种服务器扩展接口下的数据储存架构。网络连接存储(network attached storage) ,也叫做网络直联存储,是将集成的存储系统如磁盘阵列和磁带设备,直接通过 LAN 接口连入信息通信网络的技术。本地备份的特点是:便于数据管理、无需通过网络传输数据、可以消除网络瓶颈、备份的文件是局部的25、衡量数据压缩技术好坏的指标有哪些?什么是无损压缩和有损压缩?数据为什么能被压缩?指标:压缩比、恢复效果、压缩速度、硬件开销。无损压缩也叫冗余压缩,利用数据的统计冗余进行压缩,去掉或者减少数据中的冗余,解压时这些冗余可以完全恢复到原始数据中去的压缩方法。有
19、损压缩是,利用人们视听觉器官对频带中某些频率成分的反应不太敏感,将这部分频率所涵盖的信息摒弃换取较高的压缩比的压缩方法。26、机器翻译技术的核心,目标语言、源语言。机器翻译技术的核心是保持两种文本(源语言文本和目标语言文本)的语义对等。源语言:是在跨语言检索中,提问式所用的语言叫做源语言,一般是用户的母语。目标语言:被检索文档所用的语言,这种语言对用户来说是不熟悉的。27、可通过哪些途径实现基于内容的图像信息检索?可以通过颜色检索、形状检索、纹理检索、空间位置检索、对象特征检索等途径实现基于内容的图像信息检索。28、OAI 系统的交互框架模型包括哪几方?数据提供方(data provider
20、administer system) 、服务提供方(service providers)和注册服务器(Register Server) 。29、RSS 技术在图书馆网络信息服务中的应用。基于 RSS 技术的数据库书目更新推送服务;新书通报、预约通报、续借还书提醒;虚拟参考咨询。30、合理使用制度在数字图书馆中的应用。在不侵害版权人权利的情况下,图书馆应将合理使用很好的利用起来,主要有以下几个环节: 保存版本的需要,对馆藏文献数字化,并在馆域网范围内向读者提供信息服务,可以适用合理使用。 读者网上浏览行为,可是适用合理使用原则。 有条件限制的网上信息链接。 数据库的合法套录。 在保证读者无复制或者下载作品的前提下,图书馆可以对他人的数据库或网站的访问技术保护措施进行破解,供馆内读者使用。