1、一、选择题1、数据仓库是随时间变化的,下面的描述不正确的是:A、数据仓库随时间变化不断增加新的数据内容。B、捕捉到的新数据会覆盖原来的快照。C、数据仓库随时间变化不断删去旧的数据内容。D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。 答案: B 2、关于基本数据的元数据是指: A、基本元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。B、基本元数据包括与企业相关的管理方面的数据和信息。C、基本元数据包括日志文件和建立执行处理的时序调度信息。 D、基本元数据包括关于装载和更新处理、分析处理以及管理方面的信息。答案: A 3、下面有关数据粒度的描述
2、不正确的是: A、粒度是指数据仓库小数据单元的详细程度和级别。B、数据越详细,粒度就越小,级别也就越高。C、数据综合度越高,粒度就越大,级别也就越高。D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。答案: B 4、有关数据仓库的开发特点,不正确的描述是: A、数据仓库开发要从数据出发。B、数据仓库使用的需求在开发出去就要明确。C、数据仓库的开发是一个不断循环的过程,是启发式的开发。D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据的分析和处理更灵活,且没有固定的模式。答案: B 5、RAID 技术具有容错能力,能够满足对存储能力、性能和可靠性不断提高
3、的要求。其实,实现原理是将数据写入多张磁盘中,如果张磁盘发生故障,就从其他存放冗余数据的磁盘上访问数据。有关 RAID 不同级别的描述不正确的是:A、在 RAID 0 这一级别上,数据记录通过在多组驱动器的扇区上交错地分布着实现,没有奇偶校验,不提供任何冗余。B、RAID 1 称为镜像。在这一级别上,数据被冗余地写入成对的驱动器中,可以独立地从每个驱动器提取该数据。这种方法没有什么缺点,是备份时候经常用到的技术。C、RAID 3 数据记录在成组驱动器上,位交错,只有一个驱动器仍有奇偶校验信息。D、RAID 5 如果采用这一水平的技术,则数据记录在成组的驱动器上扇区交错地存放着,所有驱动器都有奇
4、偶校验信息。 答案: B 6、有关数据仓库测试,下列说法不正确的是:A、在完成数据仓库的实施阶段中,需要对数据仓库进行各种测试。测试工作中要包括单元测试和系统集成测试。B、当数据仓库的每个单独组件完成后,就需要对它们进行单元测试。C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。D、在测试之前没必要制定详细的测试计划。答案: D 7、OLAP 技术的核心是:A、在线性B、对用户的快速响应C、互操作性D、多维分析 答案: D 8、关于 OLAP 的特性,下面正确的是:快速性 可分析性 多维性 信息性 共享性A、B、C、D、答案: D 9、关于 OLAP 和 OLTP 的区别
5、的描述,不正确的是:A、OLAP 主要是关于如何理解聚集的大量不同的数据。它与 OLAP 应用程序不同。B、与 OLAP 应用程序不同,OLTP 应用程序包含大量相对简单的事务。C、OLAP 的特点在于事务量大,但事务内容比较简单且重复率高。D、OLAP 是以数据仓库为基础的,其最终数据来源与 OLTP 一样均来自底层的数据库系统,两者面对的用户是相同的。答案: D 10、OLAM 技术一般简称为“数据联机分析挖掘” ,下面说法正确的是:A、OLAP 和 OLAM 都基于客户机/服务器模式,只有后者有与用户的交互性。B、由于 OLAM 的立方体和用于 OLAP 的立方体有本质的区别。C、基于
6、Web 的 OLAM 是 Web 技术与 OLAM 技术的结合。D、OLAM 服务器通过用户图形接口接收用户的分析指令,在元数据的指导下,对超级立方体作一定的操作。答案: D 11、数据仓库的数据具有四个基本特征,下列不正确的是: A、面向主题的。B、集成的。C、不可更新的。D、不随时间变化的。答案: D 12、下列是关于 OLAP 的描述,不正确的是:A、一个多维数组可以表示为:(维 1,维 2,维 n)B、维的一个取值称为该维的一个维成员C、OLAP 是联机分析处理D、OLAP 是以数据仓库进行分析决策的基础答案: A 13、关于 OLAP 和 OLTP 的说法,下列不正确的是:A、OLT
7、P 事务量大,但事务内容比较简单且重复率高B、OLAP 的最终数据来源与 OLTP 不一样C、OLTP 面对的是决策人员和高层管理人员D、OLTP 以应用为核心,是应用驱动的答案: B 14、关于数据仓库元数据的描述,下列不正确的是:A、元数据描述了数据的结构、内容、码、索引等项内容。B、元数据内容在设计数据仓库时确定后,就不应该再改变。C、元数据包含对数据转换的描述。D、元数据是有效管理数据仓库的重要前提。答案: B 15、下列描述不正确的是:A、模型辅助决策系统一般可以使用若干个模型来解决同一问题。B、人机交互系统是决策支持系统的一个组成部分。C、决策支持系统包含模型库和模型库管理系统。D
8、、智能决策支持系统包含知识库系统。答案: A 16、决策支持系统可以用不同的方法进行构造,下列的说法不正确的是A、可以用生命周期法和原型法构造决策支持系统。B、原型法是一个迭代过程。C、原型法中不存在对用户的反馈。D、SDLC 即是系统开发的生命周期法答案: C 17、数据清洗是数据转移的一种基本类型,它不能通过下列的那种方法来完成:A、范围检验B、枚举清单C、相关检验D、删除不合格的数据答案: D 18、下列不是数据转移的基本类型的是:A、简单转移B、清洗C、集成D、继承答案: D 19、开展数据挖掘的基本目的是:A、建立数据仓库。B、帮助用户作决策。C、从大量数据中提取有用信息。D、对数据
9、进行统计和分析。答案: C 20、产生数据挖掘的根本原因是:A、数据统计分析。B、技术的发展。C、商业推动。D、数据仓库的产生。答案: A 21、 ()是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设的过程中提取信息。A、文本数据挖掘B、发现驱动的数据挖掘C、验证驱动的数据挖掘D、Web 数据挖掘答案: C 22、对于在数据仓库中设计、使用 OLAP 的用户来说,下面不属于 OLAP 的衡量标准的是:A、解释性批处理提取。B、弹性报告和一致性能报告。C、对物理层的自动调整。D、体系结构。答案: D 23、对 MOLAP 和 ROLAP 的比较,不正确的说法是:A、MOLAP 的
10、查询能力一般较好,而在 ROLAP 中进行查询,往往很难预料查询结果。B、MOLAP 所需要的数据加载时间比较长,而 ROLAP 的加载时间要比 MOLAP 短。C、ROLAP 比 MOLAP 的查询速度都要快很多。D、MOLAP 在分析过程中的精度较高,具有分析的优势。答案: C 24、关于 OLAP 服务器及其工具,说法正确的是:A、只有 Oracle 提供了 OLAP 功能。B、评价 OLAP 服务器的标准不包括全局结构视图。C、OLAP 的服务引擎都应满足分析模型及应用在功能、规模和技术特征上的要求。D、对 OLAP 服务器的管理能力没有特别的要求。答案: C 25、数据挖掘工具按照使
11、用方式分类,可以分为:A、分为基于神经网络的工具,基于规则和决策树的工具,基于模糊逻辑的工具和综合性数据挖掘工具等。B、分成决策方案生成工具,商业分析工具和研究分析工具三类。C、分成专用型数据挖掘工具和通用型数据挖掘工具两大。D、分成基于神经网络的工具和研究分析工具。答案: B 二、填空题1、数据仓库(简答题必考)是_、_、_、_有组织的数据集合,支持管理的决策过程。 答案: 面向主题、集成的、时变的、非易失的 2、一般来说,可将数据仓库的开发和应用过程细分为_、_、_、_。 答案: 设想阶段、规划和成长阶段、控制阶段和稳定阶段 3、_是对现实世界进行抽象的工具,需要将现实世界的事物及其有关特
12、征转换为信息世界的数据,才能对信息进行处理与管理,这就需要依靠_作为这种转换的桥梁。这种转换经历了从现实到_,从_到_,最后从_到物理模型的转换。 答案: 数据模型、数据模型、概念模型、概念模型、逻辑模型、逻辑模型 4、元数据(简答题必考)是关于数据、_和应用程序的结构和意义的描述信息,其主要目标是_。其范围可以是某个特别的数据库管理系统中从现实世界的概念上的一般概括,到_。 答案: 操纵数据的进程、提供数据资源的全面指南、详细的物理说明 5、按对象级别对元数据进行分类,可以从三个抽象级别上来认识:_、逻辑级和_。答案: 概念级、物理级 6、数据库系统的特点主要体现在下面几个方面:_、数据的共
13、享性、_和_。答案: 数据的结构化、数据的独立性、数据统一由 DBMS 管理和控制。 7、依据数据仓库数据量大但是操作单一的特点,可以采取一些技术来进行数据仓库的物理数据模型设计,如:合并表、_、引入冗余、_、建立广义索引等等。答案: 建立数据序列、表的物理分割、生成导出数据 8、数据仓库的接口技术包含多技术接口技术、_和数据的高效率加载技术。答案: 语言接口技术 9、数据仓库中数据的组织方式与数据库不同,通常采用_分级的方式进行组织。般包括早期细节数据、_、轻度综合数据、_以及_五部分。答案: 当前细节数据、高度综合数据、元数据 10、数据仓库的需求分析根据不同领域可以划分为_、设计的需求、
14、_和最终用户的需求等方面。答案: 业主(投资者)的需求、开发者的需求 11、数据仓库虽然是从数据库发展而来的,但两者存在大的差异,从数据存储内容看,数据库只存放_,而数据仓库则存放_,数据库中的数据的目标是面向_,而数据仓库则面向_。答案: 当前值、历史值、业务操作人员、高层管理人员 12、数据库内的数据是_的,只要有业务发生,数据就会更新,而数据仓库则是_的历史数据,只能定期添加、刷新。答案: 动态变化、静态 13、数据仓库主要是供决策分析用的,所涉及的数据操作主要是_,一般情况并不进行_答案: 数据查询、修改操作 14、数据仓库创建后,首先从_中抽取所需要的数据到数据准备区,在数据准备区中
15、经过_的净化处理,再加载到数据仓库数据库中,最后根据用户的需求将数据发布到_。答案: 数据源、数据、数据集市/知识挖掘库中 15、 “主题”在数据仓库中由一系列_实现的。一个主题之下表的划分可按_、数据所属时间段进行划分。主题在数据仓库中可用_方式进行存储,如果主题存量大为提高处理效率可采用_方式进行存储。答案: 列表、数据的综合、多维数据库、关系数据库 三、简答题1、 什么是数据挖掘(Data Mining)? (简答题必考)答案: 数据挖掘( Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知
16、识的过程。挖掘的数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。 2、数据挖掘研究内容是什么? 答案: 主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。 3、数据挖掘提取出的知识主要由哪些类型? 答案: 数据挖掘所发现的知识最常见的有以下四类:广义知识( Generalization) , 关联知识(Association) ,分类知识(Classification Cl
17、ustering ) , 预测型知识(Prediction) ,偏差型知识(Deviation) 。4、什么是专家系统?答案: 专家系统是一个智能计算机程序系统,其内部含有大量的某一个领域专家水平的知识与以验,能够利用人类专家的知识和解决问题的方法来处理领域问题,专家系统是一种模拟人类专家解决领域问题的计算机程序系统。5、简述数据仓库的组成。答案: 数据仓库管理部分的组成包括:定义部件。这一部件用于定义和建立数据仓库系统,设计和定义数据仓库的数据库。定义数据来源。确定数据源向数据仓库复制数据的转换、清理规则。数据获取部件。依据数据定义部件定义的规则从数据源中指数据抽取到数据仓库中,完成清洗、变
18、换和集成工作,将数据装载到数据仓库中,定期清理数据仓库,消除数据仓库与源数据库的不一致,清除失效数据等。一般情况下可以通过一些通用工具完成,但是由于数据源中的数据类型、格式非常复杂,因此有些情况下需要编制特定的工具完成数据获取工作。管理部件。主要包括对数据仓库中数据的维护、安全、备份、恢复、日志等工作。这些工作需要借助数据库管理系统的功能实现。元数据管理,也可称为信息目录管理。它主要完成元数据的管理、存储以及对整个数据仓库数据的检测和管理,由以下部分组成:技术元数据。技术元数据由关于数据源、目标、转换规则、清理规则以及数据源与数据仓库之间的映射组成。业务目录。业务目录由数据仓库管理员生成,由数
19、据来源、当前值、预定义的查询等方面组成,是针对具体应用数据的元数据管理。(2)数据仓库工具集数据仓库工具集主要由一些分析工具组成,主要包括检索查询工具、多维数据的 OLAP 分析工具、统计分析以及数据挖掘工具等(严格地说,数据挖掘工具只是数据仓库支持辅助决策的一种方法,数据挖掘列以从数据仓库中挖掘知识、规律,也可以从数据库或者一些平面文件中挖掘,但是从支持辅助决策的角度来看,将它归为数据仓库系统的一部分)。OLTP 与 OLAP 的主要区别有以下几点:(简答题必考)(1)、所面向的用户和系统:OLTP 是面向客户的,由职员或客户进行事务处理或者查询处理。OLAp 是向向市场的,由经理、主管和分
20、析人员进行数据分析和决策的。(2) 、数据内容:OLTP 系统管理当前数据,这些数据通常很琐碎,难以用于决策。OLAP系统管理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和管理信息,这些特点使得数据适合于决策分析。(3) 、数据库设计:通常,OLTP 采用 ER 模型和面向应用的数据库设计,而 OLAP 系统通常采用星型模式或雪花模式和面向主题的数据库设计。(4) 、视图:OLTP 系统主要关注一个企业或部门的当前数据,而不涉及历史数据或不同组织的数据。与之相反,OLAP 系统常常跨越一个企业的数据库模式的多个版本,OLAP系统也处理来自不同组织的信息,由多个数据源集成的信息。(5) 、访问模式:OLTP 系统的访问主要由短的原子事务组成,这种系统需要并发控制和恢复机制。而 OLAP 系统的访问大部份是只读操作,其中大部份是复杂查询。(6) 、度量:OLTP 专注于日常时实操作,所以以事务吞吐量为度量,OLAP 以查询吞吐量和响应时间来度量。