收藏 分享(赏)

《大数据》题目.doc

上传人:dzzj200808 文档编号:5748879 上传时间:2019-03-15 格式:DOC 页数:10 大小:92KB
下载 相关 举报
《大数据》题目.doc_第1页
第1页 / 共10页
《大数据》题目.doc_第2页
第2页 / 共10页
《大数据》题目.doc_第3页
第3页 / 共10页
《大数据》题目.doc_第4页
第4页 / 共10页
《大数据》题目.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、大数据题目一、 单选题1) 大数据的 4V 特点:Volume、Velocity、Variety、Veracity,其中他们的含义分别是( 1 ) 、 ( 2 ) 、 ( 3 ) 、 ( 4 ) 。A.价值密度低 B.处理速度快 C.数据类型繁多 D.数据体量巨大2) 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行( 5 ) 。A. 数据信息 B. 专业化处理 C.速度处理 D. 内容处理3) 随着谷歌( 6 )和( 7 )的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的 ( 8 ) 。6: A.Map B.Docs C. YouTube D. MapR

2、educe7: A. Google Mobile B. iGoogle C. GoogleFile System D. Google Docs8: A.质量 B. 速度 C.精度 D. 进度 4) 斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的 2.5 米口径望远镜进行的红移巡天项目,2012 年 4 月发布的关于 Quasar spectra 的数据为( 9 ) 。A.932,891,133 B. 228,468 C. 1,457,002 D. 668,0545) 下列哪一项不属于大数据的治理:( 10 )A. 安全问题 B. 成本问题 C. 针对大用户 D. 信息生命周期管理6) IB

3、M 的大数据战略以其在 2012 年 5 月发布智慧分析洞察“3A5 步”动态路线图作为基础,指的是在( 11 )的基础上( 12 ) 、 ,进而( 13 ) ,优化决策策划能够救业务绩效。A. 采取行动(Act) B. 获取洞察(Anticipate)C. 掌握信息(Align) D. 应用管理(management)7) 在云生态环境中,用户需求相当于( 14 ) ,云数据中心相当于( 15 ) ,云服务相当于( 16 ) 。A. 降水 B. 水滴 C. 水库 D. 阳光8) 尿布啤酒是大数据分析的( 17 )A. A/B 测试 B. 分类 C. 关联规则挖掘 D. 数据聚类9) 在 GA

4、PMINDER 的 Wealth & Health of Nations 中,中国在什么区域( 18 )A.黄色 B.红色 C.绿色 D. 蓝色10) 舆情研判,信息科学侧重( 19 ) ,社会和管理科学侧重突发群体事件管理中的群体心理行为及( 20 ) ,新闻传播学侧重对( 21 ) 。 A. 舆论的本体进行规律性的探索和研究 B.舆论控制研究 C. 互联网文本挖掘和分析技术11) 物联网是在计算机的( 22 )基础上,利用( 23 ) 、 ( 24 )等技术,构造一个覆盖世界上万事万物的“Internet of Things” 。在这个网络中,物品(商品)能够彼此进行“交流” ,而无需人的

5、干预。 A. 有线数据通信 B. 无线数据通信 C. RFID D. 互联网12) 数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%( 25 ) ,对于成功重要性的百分比%( 26 )A. 50 B. 20 C.80 D. 6013) MapReduce 的 Map 函数产生很多的( 27 )A. key B. value C. D. Hash14) PageRank 是一个函数,它对 Web 中的每个网页赋予一个实数值。它的意图在于网页的PageRank 越高,那么它就( 28 ) 。 A. 相关性越高 B.越不重要 C.相关性越低 D. 越重要15) 购物篮模型(market-baske

6、t model):用于描述两类对象之间的一种常见形式的( 29 )关系。A.一对一 B.一对多 C. 多对多 D. 多对一16) AdWords 是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按( 30 ) 。A.每个广告计费 B. 每次点击计费C.每显示一次计费 D. 每浏览一次计费17) 协同过滤分析用户兴趣,在用户群中找到指定用户的( 31 )用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( 32 ) ,并将这些用户喜欢的项推荐给有相似兴趣的用户。A. 相似 B.相同 C.推荐 D. 预测18) 2012 年 12 月 2

7、8 日,全国人大三次会议通过的( 33 )A. 互联网行业的自律公约 B. 治安管理处罚条例C. 关于加强网络信息保护的决定 D. 信息安全保护条例 19) Google 收集的信息不包括 ( 34 )A. 日志信息 B. 位置信息 C.你的家庭成员 D. Cookie 和匿名标识符20) 大数据的取舍与( 35 )不相关。A. 易于提取 B.家庭信息 C. 数字化 D. 廉价的存储器21) IBM 智慧地球中 Smart Work 指( 36 ) A. 新锐洞察 B. 智慧运作 C. 动态架构 D. 绿色未来22) 根据 IDC(国际数据公司)的监测统计,2011 年全球数据总量已经达到 1

8、.8ZB,而这个数值还在以每两年翻一番的速度增长,预计到 2020 年全球将总共拥有的数据量( 37 ) ,增长近( 38 )倍。A. 10 B. 20 C. 35ZB D. 20ZB23) 2012 年 3 月 29 日奥巴马政府公布了( 39 ) 。该计划的目标是改进现有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。 首批共有 6 个联邦部门宣布投资( 40 )美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供给。A.全民健康计划 B. 5

9、亿 C. 大数据研发计划 D. 2 亿24) 大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并( 41 )成为帮助企业经营决策更积极目的的信息。A.收集 B. 整理 C.规划 D.聚集25) 大数据工程指大数据的( 42 )的系统工程。A. 大数据网络发展和运营过程 B. 规划建设运营管理C. 规律和验证 D. 发现和验证26) 大数据科学关注大数据网络发展和运营过程中( 43 )大数据的规律及其与自然和社会活动之间的关系。A. 大数据网络发展和运营过程 B. 规划建设运营管理C. 规律和验证 D. 发现和验证27) 大数据的价

10、值是通过数据共享、 ( 44 )后获取最大的数据价值A.算法共享 B.共享应用 C. 数据交换 D. 交叉复用28) 社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的( 45 ) ,通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。A.地址 B.行为 C.情绪 D.来源 29) IBM 的“3A5 步”除 Align、Anticipate、Act 外,还需要不断地( 46 )从每一次业务结果中获得反馈,改善基于信息的决策流程,从而实现( 47 ) 。A. Create B. Transform C. Learn D. Mod

11、ify30) IBM 大数据平台和应用程序框架, ( 48 )以经济高效的方式分析 PB 级的结构化和非结构化信息A. 流计算 B. Hadoop C.数据仓库 D.语境搜索31) 临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和( 49 ) 。A.医疗事故 B.病患投诉 C. 民事诉讼 D. 手术费用32) 数据新闻学手册的作者们认为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的( 50 ) 。A.拍摄者 B.知情者 C.记录者 D. 阐释者33) 通过( 51 )和展示数据背后的( 52 ) ,运用丰富的、具有互动性的可视化手段,数据

12、新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。A.数据收集 B. 数据挖掘 C.真相 D. 关联与模式34) CRISP-DM 模型中 Evaluation 表示对建立的模型进行评估,重点具体考虑得出的结果是否符合( 53 )的商业目的。A. 第二步 B. 第三步 C. 第一步 D. 最后一步35) 发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定( 54 )和( 55 ) ,利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则54:A. 最大兴趣度 B. 最小置信度 C. 最小支持度 D. 最大可信度55:A. 最小兴趣度 B. 最小置

13、信度 C. 最大支持度 D. 最小可信度36) 规则 I-j,“有可能” ,等于所有包含 I 的购物篮中同时包含 J 的购物篮的比例,为( 56 ) 。A. 置信度 B.可信度 C. 兴趣度 D. 支持度37) 如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作( 57 )A. 极大匹配 B.二分匹配 C 完美匹配 D.极小匹配38) 国防部高级研究计划局(DARPA)的网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与( 58 ) 。作为一种揭露隐藏操作的手段,CINDER 将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检

14、测的准确性、和速度。A. 内部网络活动 B. 网络间谍活动 C. 网络威胁检测 D. 网络漏洞检测39) 只要具有适当的政策推动,大数据的使用将成为未来提高竞争力、生产力、创新能力以及( 59 )的关键要素。A.提高消费 B.提高 GDP C.提高生活水平 D. 创造消费者盈余40) 个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助( 60 )为其顾客购物提供完全个性化的决策支持和信息服务。 A.公司 B.各单位 C.跨国企业 D. 电子商务网站二、多选题41) 大数据的治理包括( 1 )A. 容量问题 B. 延迟问题 C. 安全问题 D. 成本问题42) Hadoop

15、项目包括( 2 )A. Hadoop Distributed File System(HDFS) B. HadoopMapReduce 编程模型C. HadoopStreaming D. Hadoop Common43) 基于“3A5 步”动态路线图,IBM 提出了“大数据平台”架构。该平台的核心能力包括( 3 )A. Hadoop 系统 B. 流计算(StreamComputing)C.数据仓库(Data Warehouse) D. 信息整合与治理(Information Integration and Governance)44) 大数据在医疗与健康的临床应用包括( 4 )A. 疗效比较研

16、究方案 CER B. 临床决策支持系统C. 远程患者监测系统 D. 患者家庭情况分析45) 数据新闻学手册为我们提供了一些简单的搜索建议。现在的网络技术允许我们进行精准搜索,比如( 5 )A. 电子数据表 B. 地理数据 C. 数据库抽取 D. PDF 文件46) 物联网, 2010 年中国政府工作报告把物联网定义为通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行通信和信息交换,以实现智能化( 6 )A. 识别 B. 定位 C. 跟踪 D. 监控和管理的一种网络47) 数据挖掘的挖掘方法包括:( 7 )A. 聚类分析 B. 回归分析 C. 神经网络 D. 决策树算法48) W

17、eb 内容挖掘实现技术( 8 ) 。A. 文本总结 B. 文本分类 C. 文本聚类 D. 关联规则49) 基于内容的推荐生成推荐的过程主要依靠( 9 )A. 内容分析器 B. 推荐系统 C. 文件学习器 D. 过滤部件50) 以下哪些管理规定对信息安全及个人隐私进行了保护( 10 )A. 互联网行业的自律公约 B. 治安管理处罚条例C. 关于加强网络信息保护的决定 D. 信息安全保护条例 51) 大数据可分成( 11 ) 、大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。A. 大数据技术 B.大数据工程 C. 大数据收集 D. 大数据科学52) 云计算的服务方式有( 12 )A.

18、IaaS B.Raas C.PaaS D. SaaS53) 大数据在社会管理能实现( 13 )A. 提高社会管理的效能 B. 减少行政开支C. 创造新的价值 D. 实现信息透明54) 产品设计的研究和开发包括( 14 )A. 虚拟数字工厂 B. 产品生命周期管理 C. 评估设计 D. 开放创新55) CRISP-DM 模型为一个 KDD 工程提供了一个完整的过程描述.该模型将一个 KDD 工程分为几个不同的、但顺序并非完全不变的阶段,包括 business understanding、data understanding、data preperation、 ( 15 ) A. deployme

19、nt B.design C. modeling D. evaluation56) 文本挖掘的工具有( 16 )A.SPP Text Mining B. IBM DB2 intelligent MinerC. SAS text miner D. SPSS Text Mining57) 数据和软件保护的开放科学(DASPOS)第一次尝试建立一个来自大型强子对接机和费米实验室的( 17 )专家之间的正式合作。A. 理学家 B. 数字保管 C. 异构存储系统 D. 大规模计算机系统方面58) 长尾效应,新竞争力从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们可以称之为流行,而分布在尾部的需

20、求是个性化的,零散的小量的需求。而这部分差异化的,少量的需求会在需求曲线上面形成一条长长的“尾巴” ,而所谓长尾效应就在于它的( 18 )上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。A.质量 B.长度 C.长期 D. 数量59) 为充分获取大数据潜力必须解决的主要问题是数据政策、技术和技能以及( 19 )A. 组织变革和人才 B. 数据访问权 C. 行业结构 D. 政府职能60) 推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、 ( 20 ) ,推测客户将来可能的购买行为。A.客户的朋友 B.客户的个人信息C.客户的兴趣爱好 D. 客户过去的购买行为和购买记录一、单选题答案: 1-5 DBCAB6-10 DCBBC11-15 CBADC16-20 BCBCB21-25 ADCBC26-30 BCDCB31-35 ADCCB36-40 BCBCD41-45 BBDDC46-50 CBBCD51-55 BDCCD56-60 BCBDD二、 多选题答案: 1 ABCD2 ABD3 ABCD4 ABC5 ABCD6 ABCD7 ABCD8 ABCD9 ACD10 ABC11 ABD12 ACD13 ABCD14 BCD15 ACD16 BCD17 ABCD18 D19 ABC20 D

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报