1、一、选择题 1. 云计算是对(D)技术的发展与运用 A. 并行计算 B 网格计算 C 分布式计算 D 三个选项都是2. 从研究现状上看,下面不属于云计算特点的是(C) A. 超大规模 B. 虚拟化 C.私有化 D. 高可靠性 3. 与网络计算相比,不属于云计算特征的是(B ) A.资源高度共享 B.适合紧耦合科学计算 C. 支持虚拟机 D. 适用于商业领域 4. IBM 在 2007 年 11 月退出了“改进游戏规则”的 (A )计算平台,为客户带来即买即用的云计算平台。 A. 蓝云 B. 蓝天 C. ARUZE D. EC2 5. 微软于 2008 年 10 月推出云计算操作系统是( C)
2、A. Google App Engine B. 蓝云 C. Azure D. EC2 6. 2008 年, (A)先后在无锡和北京建立了两个云计算中心 A. IBM B. Google C. Amazon D. 微软 7. 亚马逊 AWS 提供的云计算服务类型是(D ) A. IaaS B.PaaS C.SaaS D.三个选项都是 8. 将平台作为服务的云计算服务类型是(B ) A. IaaS B.PaaS C.SaaS D.三个选项都不是9. 将基础设施作为服务的云计算服务类型是(A) A. IaaS B.PaaS C.SaaS D.三个选项都不是 10. IaaS 计算实现机制中,系统管理
3、模块的核心功能是(A) A. 负载均衡 B 监视节点的运行状态 C 应用 API D. 节点环境配置 11. 云计算体系结构的(C)负责资源管理、任务管理用户管理和安全管理等工作 A.物理资源层 B. 资源池层 C. 管理中间件层 D. SOA 构建层12. 云计算技术的层次结构中包含( ABCD)下层 A.物力资源层 B.资源池层 C.管理中间件 D.SOA 构建层 13. 云计算体系结构中,最关键的两层是(BC) A.物力资源层 B.资源池层 C.管理中间件 D.SOA 构建层 14. 云计算按照服务类型大致可分为以下类(ABC) A.IaaS B. PaaS C. SaaS D.效用计算
4、 15. 下列不属于 Google 云计算平台技术架构的是(D) A. 并行数据处理 MapReduce B.分布式锁 Chubby C. 结构化数据表 BigTable D.弹性云计算 EC2 16. 与开源云计算系统 Hadoop HDFS 相对应的商用云计算软件系统是(A ) A. Google GFS B. Google MapReduce C .Google Bigtable D.Google Chubby 17. Google 文件系统(GFS)分块默认的块大小是(B) A. 32MB B. 64MB C. 128MB D.16MB 18. Google 文件系统(GFS)分成固定
5、大小的块,每个块都有一个对应的(C) A. 代理 B. 结点 C. 索引号 D. 计数器 19. Google 文件系统(GFS)提供给应用程序的访问接口是(A ) A . 专用接口 B. 遵守 POSIX 规范的接口 C.网络文件系统接口 D. Web 网页接口 20. 下列不属于 GFS 的假设和目标是( C)A. 硬件出错正常 B. 主要负载是流数据读写 C. 数据写主要是“插入写” D. 需要存储大尺寸的文件21. Google 文件系统(GFS )通过(B)方式提高可靠性 双备份 冗余 日志 校验码 22. Google 文件系统(GFS)中每个数据块默认是在()个数据块服务器上冗余
6、 23. Google 文件系统(GFS )中客户端直接从()角色完成数据存取 主服务器 桶 数据块服务器 管理块服务器 24. 下列不属于文件系统(GFS)中主服务器节点任务的是() 存储元数据 文件系统目录管理 与数据块服务器进行周期性通信 向客户端传输数据 25. 在主服务器节点容错中,采用日志进行容错的是() 命名空间 与文件名的映射表 26. 在数据块服务器容错中,每个 Block 对应()的校验码 27. GFS 在 Google 中管理着(C)级别的数据 A. TB B. GB C. PB D. MB 28. 在目前 GFS 集群中,每个集群包含( B)个存储节点 A.几百个 B
7、. 几千个 C.几十个 D.几十万个 29. 下列选项中,哪条不是 GFS 次啊用中心服务器模式的原因( A) A.不易成为整个系统的瓶颈 B.可以方便增加数据块服务器 C. 不存在元数据的一致性问题D. 方便进行负载均衡 30. 下列选项中,哪条不是 GFS 选择在用户态下实现的原因( D) A.调试简单 B.不影响数据块服务器的稳定性 C. 降低实现难度,提高通用性 D. 容易扩展 31. Google 文件系统将整个系统的节点分为(ABC )的角色 A.客户端 B.主服务器 C.数据块服务器 D.监测服务器 32. Google 文件系统具有(ABD)特点 A.采用中心服务器模式 B 不
8、缓存数据 C.采用边缘服务器模式 D 在用户态下实现 33. Google 不缓存数据的原因是 (ABCD ) A. OFS 的文件操作大部门是流式读写;B. 维护缓存与实际数据之间的一致性太复杂 C. 不存在大量的重复读写 D. 数据块服务器上的数据存取使用本地文件系统 34. GFS 中主服务器节点存储的元数据包含这些信息( BCD) A.文件副本的位置信息 B.命名空间 C. Chunk 与文件名的映射 D. Chunk 副本的位置信息 35. 单一主服务器(Master)解决性能瓶颈的方法是( ABCD) A.减少其在数据存储中的参与程度 B. 不适用 Master 读取数据C.客户端
9、缓存元数据D. 采用大尺寸的数据块 36. (B)是 Google 提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。A. GFS B.MapReduce C.Chubby D.BitTable 37. Mapreduce 适用于 ( D) A. 任意应用程序 B. 任意可在 windows servet2008 上运行的程序 C.可以串行处理的应用程序 D. 可以并行处理的应用程序 38. 下面关于 MapReduce 模型中 Map 函数与 Reduce 函数的描述正确的是 (A ) A .一个 Map 函数就是对一部分原始数据进行指定的操作 B.一个 Map 操作就
10、是对每个 ReD.uce 所产生的一部分中间结果进行合并操作 C.Map 与 Map之间不是相互独立的 D. Reduce 与 Reduce 之间不是相互独立的 39. MapReduce 执行过程中,数据存储位置不是在 GFS 上的是(A ) A. Map 处理结果 B. ReD.uce 处理结果 C.日志40. MapReduce 通常把输入文件按照(C)MB 来划分 A. 16 B32 C64 D128 41. 与传统的分布式程序设计相比,Mapreduce 封装了 ( ABCD )等细节,还提供了一个简单而强大的接口。 A. 并行处理 B. 容错处理 C. 本地化计算 D. 负载均衡
11、BitTable 分布式结构化数据表 42. (D)是 Google 的分布式数据存储于管理系统 A. GFS B. MapReduce C. Chubby D.Bigtable 43. 下面哪条不是 bigtable 主服务器作用 (B) A. 为每个子表服务器分配子表,对外提供服务 B. 对 bigtable 表中的数据进行存储 C. 探测子表服务器的故障和管理 D. 负载均衡 44. Bigtable 中时间戳是 (D)位整型数。 A. 32 B. 48 C. 56 D. 64 45. Bigtable 中的数据压缩形式有 (B )种 A. 2 B. 3 C. 4 D. 5 46. Bi
12、gtable 中行关键字的大小不能超过(D)KB A16 B32 C48 D64 47. (D)是 Bigtable 中数据划分和负载均衡的基本单位 A. 行 B 列 C 列族 D 子表 48. (C )是 Bigtable 中访问控制的基本单元 A. 行 B 列 C 列族 D 子表 49. (B)是 Google 为 Bigtable 设计的内部数据存储格式 A. 行 B. SSTable C 列族 D 子表 50. SSTable 结尾的索引保存的是(A)信息 A.SSTable 中块的位置 B. SSTable 的位置 C.SSTable 中块的大小 D.Sstable 的大小 51.
13、在 Bigtable 中, (A)主要用来存储子表数据以及一些日志文件 A. GFS B. Chubby C.SSTable D.MapReduce 52. Google 设计 Bigtable 的动机主要是( ABC) A.需要存储的数据种类繁多 B.海量的服务请求 C. 商用数据库无法满足 Google 的需求 D.需要频繁的修改数据53. Bigtable 主要由(ABC)三个部分组成 A. 客户端程序库 B. 一个主服务器 C.多个子表服务器 D 数据管理服务器 54. Bigtable 表中的数据是通过(ABD)来进行索引的 A.行关键字 B 列关键字 C 子表地址 D 时间戳 55
14、. Bigtable 开发团队确定了 Bigtable 设计所需达到的基本目标(ABCD) A.广泛的适用性 B 很强的可扩展性 C 高可用性 D 简单性 56. Google APP Engine 使用的数据库是 (C) A. 改进的 SQLServer B. Orack C. Date store D. 亚马逊的 SimpleDB 57. Google APP Engine 目前支持的编程语言有 ( AD ) A. Python 语言 B. C+语言 C. 汇编语言 D. JAVA 语言 58. 下列不属于亚马逊及其映像(AMI)类型的是(C) A.公共 AMI B.私有 AMI C.通用
15、 AMI D.共享 AMI 59. 亚马逊 AWS 采用 ( A )虚拟化技术 A. 未使用 B. Hyper-V C. Vmware D. Xen 60. 亚马逊将区域分为(AC ) A 地理区域 B 不可用区域 C 可用区域 D 隔离区域 61. 下面选项属于 Amazon 提供的云计算服务是(ABC) A.弹性云计算 EC2 B 简单存储服务 S3 C 简单队列服务 SQS D.Net 服务 62. 在使用弹性计算云 EC2 服务时,第一步要做的是(A) A.创建或选用 AMI B.运行实例 C.选择区域 D.建立对象 63. 不属于弹性计算云 EC2 包含的 IP 地址的是(C) A.
16、 公共 IP 地址 B. 私有 IP 地址 C.隧道 IP 地址 D. 弹性 IP 地址 64. 在 EC2 中用户最多可以拥有(B)个实例 A、10 B、20 C、30 D、40 65. 在 EC2 服务中,每个实例自身携带(A)个存储模块 A.1 B.2 C. 3 D.4 66. 在 EC2 服务的通信机制中,每个账户限制由 (B)个弹性 IP. A. 4 B. 5 C. 6 D. 7 67. 在 EC2 的安全与容错机制中,一个用户目前最多可以创建 (B)安全组。 A. 50 B. 100 C. 150 D. 200 68. EC2 定义了 CPU 的计算单元 ECU,下列资源中使用一个
17、计算单元的是(B) A.Large B.Small C. extrA.Large D. High-CPUMeD.ium 69. 每个弹性存储 EBS 最多可以创建(B )个卷 A. 10 B. 20 C. 30 D. 40 70. 下列选项属于弹性块存储 EBS 功能的是(A ) A. 快照 B0 负载均衡 C. 队列 D.映像 71. EC2 常用的 API 包含下列哪些类型的操作(ABCD)A.AMI B. 安全组 C 实例 D 弹性 IP 地址 72. S3 的基本存储单元是( B) A.服务 B.对象 C.卷 D. 组 73. 下列操作类型不属于 S3API 范畴的是(C) A. 创建
18、桶 B. 读取对象 C.运行实例 D.设置访问控制策略 74. 桶是 S3 用于存储对象的容器,每个用户最多可以创建(D)个桶 A10 B50 C80 D100 75. 与 SDB 相比较,下列选项属于 S3 范畴的是(B) A.支持数据查找、删除等操作 B. 专为大型、非结构化的数据块设计 C. 为复杂的数据建立 D. 为结构化的数据建立 76. S3 采用的专门安全措施是(AB) A.身份认证 B.访问控制列表 C 防火墙 D 防木马病毒技术 77. S3 中对象有下面的( ABCD)组成 A.键 B 数据 C 元数据 D 访问控制 78. 与关系数据库比较,下列选项属于 SDB 特性的是
19、(ACD) A.无需预定义模式 B.具有事物的概念 C.支持自动索引 D. 单个属性允许有多个值 79. SDB 不能完成的操作有(ABCD) A.没有事物的概念 B 不支持连接操作 C 实际存储的数据类型过于单一 D 查询结果只包含条目名称而不包含相应属性值,且返回结果不支持排序操作 80. 简单队列服务 SQS 中采用的是(A)队列方式 A.先进先出模式 B 堆栈模式 C.权重模式 D.后进先出模式 81. SQS 由三个基本部分组成(ABC) A.系统组件 B 队列 C 消息 82. SQS 常用的 API 有(ABCD) A 队列管理 B 消息管理 C 访问控制 D 可见性设置 83.
20、 在云计算系统中,提供“云端”服务模式是(D) 公司的云计算服务平台。 A. IBM B. GOOGLE C. Amaxon D. 微软 84. 下面关于 Live 服务的描述不正确的是 (C ) A. LIVE 框架的核心组件是 live 操作系统; B. 开发者可以使用基于浏览器的 live 服务开发者入口创建和管理应用程序所需的 live 服务;C. Live 操作环境不可以运行在桌面操作系统上。 D. Live 操作环境既可以运行在云端,也可以运行在网络中的任何操作系统上。85. 下列四种云计算方案中,服务间的耦合度最高的是 ( ) A. 亚马逊 AWS B. 微软 AZURE C.
21、Google APP Engine D. IBM 的“蓝云” 86. 云格可以完成的服务有 ( ACD) A. 数据处理服务 B. 格处理服务 C. 高性能计算服务 D. 协作服务87云计算的特点?( ABCDE ) A大规模 B. 平滑扩展 C资源共享 D. 动态分配 E. 跨地域 88.目前,选用开源的虚拟化产品组建虚拟化平台,构建基于硬件的虚拟化层,可以选用(BCD)A .Xen B.VMware C. Hyper-v D. Citrix 89在云计算中,虚拟层主要包括(ABC ) A.服务器虚拟化 B.存储虚拟化 C.网络虚拟化 D.桌面虚拟化 90.下列哪个选项能正确地在 Hive
22、中返回 “查询年龄在 18 到 25 岁之间的用户返回的前 5页”的结果(A)A. SELECT p.url, COUNT(1) as clicks FROM users u JOIN page_views p ON (u.name = p.user) WHERE u.age = 18 AND u.age = 18 AND u.age= 18 AND u.age = 25 GROUP BY p.url ORDER BY clicks;二、填空题 1. 云计算是以 公开 的标准和 服务 为基础,以 互联网 为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片“云“ 成为每一个网民的
23、数据中心和计算中心。 2. 对提供者而言,云计算可以三种部署模式,即共有云、私有云和混合云。 3. 当前,几乎所有的知名 IT 提供商、互联网提供商,甚至电信运营商都在向云计算进军,都在提供相关的云服务。但归纳起来,当前云提供者可以分为三大类,即 SaaS 提供商、PaaS 和 IaaS 提供商。 4云时代宝德科技在其中扮演的角色是公有云提供商、 云基础设备 提供商和私有云解决方案 提供商 。5. 云计算(Cloud Computing):一种利用大规模低成本 运算单元通过 IP 网络连接,以提供各种计算和存储服务的 IT 技术。 三、简答题1、当数据量非常大超过单个机器的存储能力时需要将数据
24、存储在不同的机器上,这时就需要分布式文件系统来管理这些数据,请回答关于分布式文件系统的下列问题:(1).在设计分布式文件系统时需要注意哪些方面? (2).原先存储超大文件的分布式文件系统现用来存储大规模小文件,如何对文件系统进行调整使其针对现在文件的特点发挥更好的性能? (3).分布式文件系统保证数据不被丢失通常存在多个副本并存储在不同的机器上,当用户对数据进行修改时系统存在两种方案:完成一个副本的修改并给用户响应,之后待系统空闲时完成其它副本的修改;完成所有副本的修改之后给用户响应。请说明两种方案的优劣,并做出你的选择并说明选择原因(或者你有更好的方案?) 。 2、在社会计算和移动计算迅猛发
25、展的潮流下涌现了许多著名的互联网公司,假设你和你的朋友也准备加入创业大潮中,建立自己的企业。现假设你们公司的主要业务是移动设备的互联网信息搜索和挖掘,如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价,拍下某个人的头像可以得到这个人在社交网站的主页以及微博等相关信息,当然你们已经设计了比较好的图形匹配算法及搜索算法,并计划使用云计算来进行处理,根据以上背景回答下面问题: 1).你们公司需要构建数据中心现在由你来负责,根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些?2).在数据中心中使用虚拟化技术是必须的,请说说如何部署、管理虚拟化解决方案?你又如何使
26、用商业公司的现有虚拟化产品? 3).受经济危机的影响以及公司盈利能力的不确定性,风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了,你需要将业务创建在云计算平台上a). 与建立自己的数据中心相比,使用商业公司的云计算平台有什么优点和缺点? b). 云构架的基本层次有哪些?并给出给出各个层次的实例。谈谈你如何在云计算平台上部署公司业务? c). 谈谈你对云计算发展的看法。 (注:题中商业公司包括课堂上介绍的 IBM、Amazon、Google、S、Microsoft以及其它现实存在的涉及虚拟化、云计算业务的公司)3、举例描述*aaS 的概念。 云计算按照其提供的“产品”或者是用户
27、获得资源的类型,大致可以分为一些几种类别:1)IaaS,全称 Infrastructure as a Service,基础设施即服务。将多台服务器组成的“云端”计算资源和存储,作为计量服务提供给用户。它将内存、I/O、存储和计算能力整合成一个虚拟的资源池向业界用户提供存储资源和虚拟化服务器等服务。如 Amazon EC2/S3。 2) PaaS,全称 Platform as a Service,平台即服务,把服务器平台或者开发环境作为一种服务提供的商业模式,以 SaaS 的模式提交给用户。用户在服务提供商的基础架构上开发程序并通过网络传送给其他用户(最终用户) 。如F,Google App E
28、ngine,Microsoft Windows Azure。 3) SaaS,全称 Software as a Service,软件即服务,是基于互联网提供软件服务的软件应用模式。将应用软件统一部署于服务器(集群) ,通过网络向用户提供软件。用户根据实际需求定制或者租用应用软件。消除了企业或者机构购买、构建和维护基础设施和应用程序的投入。如 Saleforce online CRM。 4) DaaS,全称 Data as a Service,数据即服务,是继 SaaS,PaaS 之后又一个新的服务概念。5) MaaS,全称 M2M as a Service,M2M 即服务,M2M 是将数据从一
29、台终端传送到另一台终端,也就是就是机器与机器(Machine to Machine)的对话,是物联网四大支撑技术之一。6) TaaS,全称 everyTHING As A Service,虚拟化云计算技术,SOA 等技术的结合实现物联网的泛在即服务。 4、写出 MapReduce 分布式编程环境中的 Map/Reduce 原理,用基本概念、关键词排序的图描述思路。 MapReduce 通过 “Map(映射 )”和“Reduce( 化简) ”这样两个简单的概念来构成运算基本单元,用户只需提供自己的 Map 函数以及 Reduce 函数即可并行处理海量数据。MapReduce实现了 Map 和 R
30、educe 两个功能: 1) Map 把一个函数应用于集合中的所有成员,然后返回一个基于这个处理的结果集;2) Reduce 对结果集进行分类和归纳; Map()和 Reduce() 两个函数可能会并行运行,即使不是在同一的系统的同一时刻。MapReduce 的编程方式: map 程序从输入文件中读取“records“的集合,执行任何需要的过滤或者转换,并且以(key,data)的形式输出 records 的集合。当 map 程序产生输出记录,“split“函数对每一个输出的记录的 key 应用一个函数,将 records 分割为 M 个不连续的块(buckets)。这个 split 函数有可
31、能是一个 hash 函数,而其他确定的函数也是可用的。当一个块被写满后,将被写道磁盘上。然后 map 程序终止,输出 M 个文件,每一个代表一个块(bucket) 。 排序程序处理 10 的 10 次方个 100 个字节组成的记录。这个程序的 Map 函数从文本行中解析出 10 个字节的 key 值作为排序的 key,并且把这个 key 和原始文本行作为中间的key/value pair 值输出。我们使用了一个内置的恒等函数作为 Reduce 操作函数。这个函数把中间的 key/value pair 值不作任何改变输出。最终排序结果输出到两路复制的 GFS 文件系统。5、简述 Azure/VM
32、ware 云的对比与不同,描述四点以上(优缺点) 。 1) Windows Azure 基于一个灵活且易于管理的基础设施为用户提供服务,即 IaaS,与此同时还可以提供一系列基础设施服务平台即服务和软件即服务解决方案。而 VMware 目前则主要只提供基础设施即服务 IaaS。 2) Windows Azure 提供了从硬件到应用程序的全面集成监控和管理,而 VMware 都没有包含对应用程序的全面监控和管理。 3) Windows Azure 提供了简便灵活的云端解决方案,有丰富的价值和多样化的选择,能够以更少的成本、人力轻松实现云部署,而 VMware 使用了大量的组件来创建自己的云解决方
33、案,其中一些更是只限 VMware 最昂贵许可等级才能使用,另外一些组件需要单独的许可以及额外的费用。 4) Windows Azure 提供了一整套免费的云端基础设施工具,为客户带来更好成效的简便方法,而 VMware 没有提供类似的工具。 6、举一个例子描述 paas 云产品(不可以是 GAE),总结五点做技术描述。 7、假设应用(企业软件)如何通过云计算转化成服务,如 webservice 服务进行改造?安全和隐私问题如何兼顾? 保证访问安全有如下一些做法: 访问应用的授权与签名。客户端系统或应用接入云服务前,必须经过云服务商的认证。认证结果以授权码方式交给客户方。以后的每次访问,客户方
34、都需要出示授权码,或请求使用授权码进行签名。系统返回的结果也同样由系统证书进行签名,以达到通信双方的互信。时间戳方式。对于异步系统,使用时间戳及唯一的客户端 ID 作为请求的序列号,系统返回时同样使用相同的方式构造序列号以进行适配。 幂等检查。通过客户端生成唯一的序列号,服务端可以检测客户端命令是否重复发送,如有重复将直接抛弃。幂等检查可以保证所有服务请求都是一次性且唯一的,即使被恶意截获并通过网络设备重播,也不会执行。 通过安全白名单进行控制。通过白名单制度,系统保证只有经过安全认证的客户端能够接入,通常可以通过认证证书实现,这是最严格的访问限制。 8、通过云计算做数据中心 DC(data-
35、center)的关键问题是什么?怎么解决? 1)提示: 数据中心的选址标准:1、大量的廉价电力; 2、绿色能源,更注重可再生能源; 3、靠近河流或湖泊;(设备冷却需要大量水源)4、用地广阔;(隐秘性和安全性) 5、和其他数据中心的距离;(数据中心之间的快速链接)6、税收优惠。 2)云计算 datacenter:一个数据中心(或数据中心或数据中心或数据中心)是一个设施用于内部计算机系统和相关的部件,如电信和存储系统。它一般包括冗余或备份电源,冗余数据通信连接,环境控制(例如,空调,消防)和安全设备。1)经营和管理运营的电信网络 2)提供数据中心应用程序直接向承运人的客户 3)提供托管应用三分之一
36、方提供其客户服务4)提供一个组合这些和类似的数据中心的应用。 9、 GFS 经典结构描述。GFS 的架构 :一个 GFS 集群包含一个单独的 Master 节点、多台 Chunk 服务器,并且同时被多个客户端访问,如图所示 GFS 的工作过程: 1)客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引,向 master(主)发送包含文件名和块索引的请求; 2) .master 收到客户端发来的请求,master 向块服务器发出指示,同时时刻监控众多chunkserver 的状态。Chunkserver 缓存 master 从客户端收到的文件名和块索引等信息。 3) ma
37、ster 通过和 chunkserver 的交互,向客户端发送 chunk-handle 和副本位置。其中文件被分成若干个块,而每个块都是由一个不变的,全局唯一的 64 位的 chunk-handle 标识。Handle 是由 master 在块创建时分配的。而出于安全性考虑,每一个文件块都要被复制到多个 chunkserver 上,一般默认 3 个副本; 4)客户端向其中的一个副本发出请求,请求指定了 chunk handle(chunkserver 以chunk handle 标识 chunk)和块内的一个字节区间。 5.客户端从 chunkserver 获得块数据,任务完成。 通常 Client 可以在一个请求中询问多个 chunk 的地址,而 master 也可以很快回应这些请求。10、 HDFS 结构描述。11、 hadoop 结构描述