收藏 分享(赏)

天津商业大学08数据仓库与数据挖掘试卷.doc

上传人:jinchen 文档编号:6518716 上传时间:2019-04-14 格式:DOC 页数:3 大小:55.50KB
下载 相关 举报
天津商业大学08数据仓库与数据挖掘试卷.doc_第1页
第1页 / 共3页
天津商业大学08数据仓库与数据挖掘试卷.doc_第2页
第2页 / 共3页
天津商业大学08数据仓库与数据挖掘试卷.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、1 数 据 仓 库 与 数 据 挖 掘 一、选择题(每空 2 分,共 40 分)1开展数据挖掘的基本目的是( ) 。A. 建立数据仓库 B. 帮助用户作决策 C. 从大量数据中提取有用信息 D. 对数据进行统计和分析2建立“数据仓库”的目的主要是( )。A规范管理数据 B.日常事务处理 C更新数据方便 D.联机分析与决策支持3以下不是支持数据挖掘技术的基础有( )。A数据加密技术 B.海量数据收集 C数据挖掘算法 D.强大的多处理器计算机4. 人工神经网络包括三个基本层,即输入层、 ( )和输出层。A. 网络层 B. 神经元层 C. 基因层 D. 隐含层5. 元数据是一种 ( )数据。A. 数

2、据的原始版本 B. 数据仓库内存储的信息 C. 描述数据仓库的信息 D. 是数据集中的精简数据。6数据仓库上的业务处理称作( ) 。A.联机事务处理 B.联机分析处理 C.联机输入处理 D.联机查询处理7. 智能决策支持系统是( )的系统。A. 决策支持系统与人工智能技术相结合 B. 决策支持系统与数据库系统相结合 C. 决策支持系统与范式理论相结合 D. 决策支持系统与事务处理系统相结合8. 数据仓库和数据挖掘是作为( )出现的。A. 两种相同的信息技术 B. 处理数据的方法 C. 两种独立的信息技术 D. 两种独立的信息存储技术9. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买

3、尿布,这种属于数据挖掘的哪类问题?( )。A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理10. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘11. 假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内? ( )A. 第一个 B. 第二个 C. 第三个 D. 第四个 12. 数据仓库是随着时间变化的,下面的描述不正确的是

4、 ( )A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行新综合13. 下面关于数据粒度的描述不正确的是:( )。A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量14. 决策树中不包含一下哪种结点?( )A. 根结点(root node) B. 内部结点(internal node) C. 外部结点

5、(external node) D. 叶结点(leaf node) 15数据集市的数据组织一般采用( )模型。A星型模型 B雪花模型 C星网模型 D第三范式16多维数据分析中, ( )是使用户在多层数据中能通过导航信息而获得更多的细节性数据。A切片分析 B切块分析 C向下钻取 D旋转分析17遗传算法的三个基本算子有( ) 。A重复、配对、变异 B选择、交叉、变异 C繁殖、屏蔽、改良 D选择、配对、变化18一个链接到许多权威站点的站点叫( ) 。2A权威 B中枢 C权威页面 D中枢页面19神经网络中,神经元起了一个( )作用。A决策作用 B分类作用 C判断作用 D简化作用20BACON 系统有(

6、 )个版本。A3 B4 C5 D6二、判断题(每题 1 分,共 10 分。各题的答案只能是“对”或“错”,要求分别用“” 或“”表示)1数据集市是一种更小、更集中的数据仓库,因此数据集市很容易升级成数据仓库。 ( )2监视休眠数据分为三级:表格级休眠、列级休眠和行级休眠。 ( )3思考模型属于静态数据分析,分析人员利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。 ( )4可拓变换包括:转换变换、增加变换、删减变换和扩大变换。 ( )5文本挖掘是从大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。 ( )6发现学习有两种方式,数据驱动方式的公式发现和启发式驱动方式的

7、概念发现。 ( ) 7遗传算法是一种随机搜索方法,是高效的有方向的搜索。 ( )8ID3 是将信息增益作为特征(属性)判别能力的度量。 ( )9数据仓库分析与设计由需求分析、概念模型设计、逻辑模型设计和决策模型设计四个部分组成。 ( ) 10数据挖掘是一个不断反馈的过程。 ( )三、简答题(共 25 分)1 (5 分)数据集市的定义及其与数据仓库的差别。2 (6 分)OLAP 的十二准则。3 (5 分)数据仓库开发有哪些困难?4 (4 分)数据挖掘按挖掘对象分类有哪些?5 (5 分)数据仓库的决策支持包括哪些?四、应用题(共 25 分)1 (10 分)对于 buy_computer 的决策树,请从下图的决策树中提取分类规则。2 (5 分)设全集 U 对某属性 A 的划分为:A=E 1,E 2,E 3=(a,b,c) , (d,e,f ) , (g),现有对 A 的粗糙集 X=a,b,g,分别计算集合 X 的下近似 A-(X ) 、上近似 A-(X) 、正域 POSA、负域NGEA和边界 BNDA。3 (10 分)数据库有如下 4 个事务。设最小支持度为 50%,使用 Apriori 算法找出所有的频繁项目集。(要求画出候选集 C 和 L 频繁集的表格,并在最后写出所求的频繁 2-项集和频繁 3-项集)TID 项T1 A,C,DT2 B,C,ET3 A,B,C ,E3T4 B,E

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报