1、S M超融合技术白皮书01一、 传统IT发展困境与面临的痛点二、 超融合产生的背景与发展历史三、 超融合的定义四、 超融合技术架构及价值优势五、 超融合的典型应用场景六、 超融合实践指南七、 超融合未来发展趋势展望1、业内主流的超融合厂商及产品简介2、超融合产业联盟介绍3、白皮书制作单位及人员附录目录第一章:传统IT发展困境与面临的痛点自上世纪90年代中后期开始,以大型机、小型机、大型数据库、集中式存储与业务高可用软件组成的IT架构适应了当时的数据大集中趋势,传统IT设备制造商在这一阶段得到了迅猛的发展,集中式的部署模式带来了对硬件性能、高可靠性及扩展性的需求增加。2003年左右,服务器虚拟化
2、技术开始普及,以VMware为代表的虚拟化软件厂商引领数据中心由物理硬件数据中心向虚拟化数据中心转变。服务器虚拟化技术有效控制了数据中心内服务器数量规模的膨胀,提高了服务器的利用效率,并且,利用虚拟机迁移等技术大大降低了数据中心对服务器RAS特征的依赖。服务器虚拟化技术的大规模应用使得业务系统的部署呈现由Unix小型机平台迁移到x86 + 虚拟化 + 集中存储架构的趋势,x86刀片服务器 + 虚拟化 + 集中式存储阵列成为这一时期数据中心的主宰。主流传统IT架构如下图: X86服务器虚拟化已经得到普遍应用和认可。小机用户集中在部分金融、医疗、和制造业等客户,而且因为成本高昂、架构封闭、不易运维
3、等痛点,也正在逐步切换至X86服务器平台。同时客户普遍使用虚拟化技术来提高可靠性和可用性,提升了服务器的资源利用率。 使用集中式外部存储。服务器本地没有存储能力,通过FC交换机连接至集中式存储,集中式存储的特点是通过双控机头或者多控机头连接磁盘柜,所有IO路径通过机头来控制。其要特点是:02 以方案集成的形式交付。IT架构通常涉及众多厂商和品牌,设备种类多。通常由集成商做系统集成来交付完整解决方案,后续运维无法实现一个管理软件实现全部配置、管理、监控功能。随着企业业务规模的不断扩张,尤其是云计算大潮来临,IT平台的规模和复杂程度出现大幅度的提升,业务对IT基础架构的灵活性、可扩展性以及快速上线
4、的能力提出了更高的要求,传统IT数据中心架构的弊端也逐渐显现,具体表现为:存储、服务器、网络安全设备三层堆栈部署存在明显的复杂性,需要对多层软硬件结构进行组装和调试,才能使其正常工作。首先,需要从网络设备厂商采购ToR(Top of Rack,架顶式)交换机,然后从服务器硬件厂商采购服务器,再从存储厂商采购昂贵的存储设备,如果是FC存储,还需要在服务器上部署专门的HBA(Host Bus Adapter,主机总线适配器)卡来提升访问性能,最后,使用Hypervisor软件管理平台实现虚拟机与业务系统的部署。上述IT建设模式导致设备供应商和设备种类繁多,用户需要花费大量的时间和精力准备大量复杂的
5、基础设施,各种设备的配置相互独立,管理割裂,缺少统一的集中化IT构建策略,无法对数据中心内的基础设施进行统一的监控、管理、报告和远程访问,后期维护技术门槛高。传统存储根据机头控制器的能力分为高中低三档存储,低端存储通常支持200块硬盘左右的扩展能力,中端存储通常支持1000块硬盘左右扩展能力,高端存储通常支持5000块硬盘左右扩展能力。集中式存储扩展性受限,低端存储无法升级为中高端存储,不能实现随着计算资源扩展而自由地横向扩展。当客户业务量较小时,初期购买中低端存储,后续遇到业务量增加或者新上业务,存储性能和容量则无法满足客户需求,通常选择是再增加一台新的中低端存储,这样就造成了多存储平台之间
6、的割裂,资源利用率底,管理复杂,无法满足上层业务对易用性和敏捷性的需求。如果客户初次购买高端存储,则又会遇到初次投入成本过高,设备利用率不足等问题。随着数据集中化及云计算成为主流建设模式,存储资源集中化,业务大规模部署及运维逐步成为刚需,传统存储在扩展性上受限,无法适应虚拟化数据中心弹性可扩展的未来要求,这是目前客户遇到的主要痛点之一。03(1) 架构复杂,管理困难,策略分散(2) 集中式存储扩展性差,造成了存储割裂及竖井化投资成本高:传统的存储与计算分离架构,需要配置独立的网络、存储和计算节点。为了提高系统整体高可用性,需要通过资源冗余的方式达到设计目标,包括存储网络设备的冗余、存储控制器的
7、冗余、存储链路的冗余等,增加了数据中心的建设投资成本。运维成本高:随着IT规模的不断膨胀,数据中心内的服务器数量、网络复杂程度以及存储容量急剧增长,随之带来的是高昂的硬件成本支出以及运营成本支出(电力、制冷、占地空间、管理人员等),同时,应用系统的高可靠性严重依赖于硬件提供的RAS(Reliability Availability and Ser-viceability,可靠性、可用性和可服务性)特性,导致硬件产品规格不断提高,硬件采购成本极为高昂。新的服务器、存储设备和网络设备的部署周期较长,整个过程包括方案设计、硬件选型、多厂商采购、分批到货、上架安装、系统集成、网络配置、综合调试、业务部
8、署等环节。一般情况下,这个过程需要的工作量约2040小时,交付周期约25个月,IT系统从提交业务变更请求到进行运营变更之间存在较长的延迟,初期部署效率低。04(3) 高昂的成本支出(4) 业务部署速度缓慢05第二章:超融合产生背景和历史超融合基础架构(HCI)是一种软件定义的IT基础架构,可虚拟化传统“硬件定义”系统的所有元素。 HCI 至少包括虚拟化计算(hypervisor),虚拟化存储(软件定义存储,一般为分布式存储)和虚拟化网络(软件定义网络)。 HCI 通常在商用 x86 服务器上运行。毫无疑问,超融合在近年来已经成为IT基础架构领域最具颠覆性的架构之一,它不仅深刻改变着用户IT基础
9、设施的采购和使用模式,更影响着整个IT基础架构市场的格局。而任何一项变革性的架构无不来自于两个方面的驱动力:从需求的角度,随着企业对信息系统建设越来越重视,以及IT 业务系统持续为企业带来巨大效益,企业对 IT 基础架构投入也越来越大,如何以更低的成本获得稳定、高性能、易于维护、易于扩展的 IT 基础架构成为企业的持续需求。与此同时,IT基础架构的核心技术和产品也在快速的演进,对超融合架构产生影响的技术包含了CPU、分布式存储、SSD、服务器虚拟化和万兆网络在内几乎所有核心元素: 虽然 x86 虚拟化技术早在 1998 年就已出现,但在 2005 年 CPU 支持虚拟化技术之前,并不算十分流行
10、;CPU 虚拟化技术大力推动服务器虚拟化软件的发展;2007 年 VMware 发布 ESX 3.5 真正开始步向成熟。市场也看到服务器虚拟化具有颠覆性的优势,逐渐开始普及服务器虚拟化技术。到今天服务器虚拟化可以说成为企业数据中心必选技术之一,已经被广泛应用。服务器虚拟化技术解决了计算能力的密度提升与降低成本的问题。 随着业务规模扩大,越来越多的虚拟机、越来越多的数据,对集中式存储带来了非常大的压力。由于传统集中式存储性能受限于存储控制器,而存储控制器难以线性扩展,虚拟化程度高导致 IO 压力剧增,集中式存储难以负荷;此外传统存储的专有硬件架构,导致其维护成本高昂、升级困难、管理复杂,与此对应
11、的分布式存储则避免了这些缺点。但分布式存储真正具备长足发展的原因是硬件技术的成熟。从2012年左右开始,企业级SSD逐渐成熟,使得不再需要大量堆砌HDD磁盘来获得性能提升。1. 用户强烈的痛点和需求2. 相关核心技术的演进和成熟(1) 分布式存储发展(2) 服务器虚拟化发展06 10Gb 以太网普及成本下降,使分布式存储访问远程节点的性能与访问本地节点的性能差距大大缩小 8 核甚至 10 核以上的 CPU 也开始普及,让服务器除了运行服务器虚拟化计算外,还有能力同时运行分布式存储软件。在此背景下,超融合架构应运而生,并不断演进,逐渐成为被越来越多人接受的主流基础架构建设方案。以下是根据年份整理
12、的大事记:1998年IBM 发布第一个基于 AIX 操作系统的共享文件系统,General Parellel File System,简称 GPFS。2003年Google 公布 GFS (Google File System)技术细节。2004年Ceph项目开始,提交了第一行代码。2006年Hadoop 发布 HDFS 分布式存储。2010年Google 宣布 GFS 下一代产品在 2010 发布,命名为 Colossus。2011年Nutanix 发布 NDFS 分布式文件系统;Inktank公司成立,专门研发基于Ceph的分布式存储。2014年Ceph社区受到各大厂商青睐,同时Inkta
13、nk公司被RedHat公司1.75亿美元收购。1998年VMware 成立。1999年VMware Workstation 1.0 发布。2001年ESX 1.0 发布。2003年VMware vCenter 1.0 发布;Xen 正式发布。2007年VMware IPO,发布 ESX 3.5;Qumranet 研发和发布 KVM。2008年Redhat 收购 Qumranet,之后 KVM 开源。2013年Xen 宣布开源。2015年VMware 全球服务器虚拟化份额达到 37.7%。07(3) x86 服务器相关硬件发展(4) 10Gb 以太网发展(5) 数据容量发展(6) 超融合市场与厂
14、家的发展2005年Intel 发布 VT 技术,支持 CPU 虚拟化功能。2008年Intel 发布 6 核 CPU。2009年OCZ Technology 发布第一款 1 TB 的 SATA 接口 SSD,NAND Flash成本出现大幅度降低。2010年Intel 发布 8 核 CPU。2012年Intel 发布企业级 SSD 3700,真正在性能和使用寿命上达到企业级要求。2002年IEEE 802.3ae 发布 10Gb 以太网标准。2012年10Gb 以太网交换机每 1000M 的成本下降至 1Gb 交换机的1/3。1986年-2007 年之间,全球数据量平均每年增长超过 23%。2
15、010年-2018 年之间,全球数据量平均每年增长超过 40%。2009年Nutanix成立,开始投入产品研发。2011年Nutanix推出首代超融合产品。2013年联想、华三、SmartX、华云网际、Nutanix在中国纷纷推出超融合产品,标志超融合作为独立的产品形态出现在中国市场。2015年IDC首次发布中国区超融合市场报告,厂商市场占有率排名依次为华三、华为、Nutanix、深信服、VMware、SmartX。2016年1月联想发起成立中国超融合联盟,并担任第一届理事长单位,标志着中国超融合的元年开启。2016年Nutanix 成功 IPO2016年独立第三方研究机构 Gartner 在
16、Market Trends: 超融合 Opportunities in China for Global Vendors系统报道了中国主流超融合厂商与超过上千节点的中国最大超融合案例。2017年中国市场超融合厂商数量超过50家,超融合已经渡过概念炒作阶段,在越来越多的客户落地,成为数据中心重要组成部分。2018年4月IDC发布2017年中国区超融合市场报告,指出2017年中国超融合市场总量相比2016年增长115.3%,达到3.79亿美元。08图2 超融合架构第三章:超融合的定义在传统IT的基础上,延伸出来了融合系统。刚开始,融合系统是简单地物理上堆叠,有的厂商还为此提供了统一管理界面,但是各
17、个部分的管理其实是分开的,从客户数据中心的运维管理维度上来讲,技术人员依然需要花费大量精力来关注于系统级的运维。随着服务器虚拟化的兴起,融合系统逐渐转化为SAN基础架构上跑服务器虚拟化,比如VCE的VBlock。即使有统一的管理界面,用户依然需要对存储、虚拟化或网络单独管理。从宏观上看,计算、网络和存储都融合在一块了,但实际上用户还需要对每一部分做单独管理,并没有实现让IT转向通过关注业务层面的响应来支撑业务发展的愿景。随着互联网与分布式存储的兴起,逐步出现了软件定义的解决方案,包括存储和网络。原来臃肿的SAN方案逐步被简化为基于X86系统的解决方案,不再需要SAN存储和SAN交换机,利用分布
18、式软件让本地硬盘共享给其他主机来使用,并且可以提供不同的存储服务。因此,很多人将其定义为超融合。但准确来说,这并不是超融合。这种方式,其实是将原来的DAS存储利用分布式软件共享出来而已,追根究底还是存储。从其所具有的特点,比如卷快照、提供不同的存储服务(iSCSI/NFS等),也可以看出这只是软件方式的分布式存储。那么,如果将软件定义存储、网络和虚拟化平台打包,是不是就是超融合?从广义上来说是。因为这种方式将计算存储和网络都融合在了一起,每个节点都会有分布式的协议栈,并通过虚拟化平台将硬件资源池化,用户通过虚拟化平台对资源进行统一管理(如图2所示)。同时,可以简单地进行横向/纵向扩展。Gatn
19、er和IDC都是从这个维度上去定义超融合的:Gartner:HCI是一种以软件为中心的体系结构,将计算、存储、网络和虚拟化资源(以及可能的其他技术)紧密集成在单一的供应商提供的一台硬件设备中。IDC:超融合系统是一种新兴的集成系统,其本身将核心存储、计算和存储网络功能整合到单一的软件解决方案或设备中。09从狭义上来说,这其实是融合系统的软件定义化,因为这里的定义是把“超”即“Hyper ”等价于虚拟化平台,即Hypervisor的缩写。但“超”更应该被理解为管理粒度,应该是以支撑业务需求的应用软件为中心,以虚拟机为管理载体的使用方式,存储/网络/计算不再是互为剥离的状态。对于最终用户而言,其面
20、对的、需要管理的载体最好只是虚拟机,而不再需要考虑划卷之类的操作;所以,超融合架构给客户带来的不仅仅是管理上的简单便捷,更是对基础架构管理难度的降低。因此,我们会经常看到说超融合适用场景包括ROBO(远程及分支机构),除了部署/管理简单,另外一个重要的原因是不需要专业的IT人员作运维。超融合系统应该能够最大化降低对运维人员的要求,包括安装简单、配置管理简单,同时,在服务器部件或整机有故障时,能够利用图形化管理界面在非停机状态下实现快速的硬件更换。另一方面,对于用户而言,希望不同的应用采用不同的存储策略以获得最优的性价比。超融合架构所能提供的存储策略是基于虚拟机/虚拟磁盘级别,而不是传统存储是基
21、于逻辑卷级别。这里的存储策略包括快照、克隆、压缩、块大小等。对于数据备份,也不需要对整个卷进行克隆/快照,只需要对重要的虚拟机进行就可以了。所以,超融合是真正做到了以应用为中心、以虚拟机管理为核心。再进一步,在实现了以应用为中心、以虚拟机管理为核心的架构方式之后,管理策略的制定也需要被考虑到。实际的应用是种类繁多的,不同的应用需要有不同的配置策略以满足最优化的运行需求,例如web服务最好能按照4K来配置页面文件大小,而exchange应用则在32K的页面文件大小下性能最优。同时,对用户而言,不同应用的重要性也应该有所不同,比如打印服务与数据库服务对业务系统而言重要性显然是不同的。超融合系统以虚
22、拟机管理为粒度,能够做到因应用而异,可实现不同配置、不同优先级的管理策略,从而更好的支持不同的应用需求。所以,超融合是软件定义的基础架构,物理资源被抽象成资源池、被共享使用;有统一的、简洁的管理界面,用户只需要对虚拟机进行管理。这样的基础架构,扩展简单,维护简单。10第四章:超融合技术架构及价值优势1.硬件资源层:以通用的X86服务器为标准载体,包含CPU、内存、固态硬盘、机械硬盘等基本配件,为上层技术实现层提供硬件资源。整个数据中心只需要通用的x86服务器和二/三层交换机硬件,通过计算、存储、网络、安全和管理的完全软件定义,即可替代复杂的传统基础架构,实现了架构的极简化。 2.技术实现层:将
23、服务器虚拟化、分布式存储、网络虚拟化等几大主流虚拟化技术进行深度融合,利用超融合技术对底层硬件进行全虚拟化,从而将服务器集群所包含的计算、存储、网络资源进行池化,形成虚拟资源池。(1)服务器虚拟化: 服务器虚拟化是整个超融合架构的核心组件,是将通用的 x86 服务器经过虚拟化,对最终用户呈现标准的虚拟机。这些虚拟机就像同一个厂家生产的系列化的产品一样,具备系列化的硬件配置,使用相同的驱动程序。虚拟机的定义: 虚拟机 (Virtual Machine) 是由虚拟化层提供的高效、独立的虚拟计算机系统,每台虚拟机都是一个完整的系统,它具有处理器、内存、网络设备、存储设备和BIOS,因此操作系统和应用
24、程序在虚拟机中的运行方式与它们在物理服务器上的运行方式没有区别。虚拟机不是由真实的电子元件组成,而是由一组虚拟组件(文件)组成,这些虚拟组件与物理服务器的硬件配置无关,与物理服务器相比,虚拟机具有以下优势:超融合作为一种新兴的集成系统,从技术架构维度可分为4个层级,从下至上包括:硬件资源层、技术实现层、虚拟资源层、集中管理层。超融合技术架构11抽象解耦 可在任何 X86 架构的服务器上运行;上层应用操作系统不需修改即可运行;分区隔离 可与其他虚拟机同时运行; 实现数据处理、网络连接和数据存储的安全隔离;封装移动 可封装于文件之中,通过简单的文件复制实现快速部署、备份及还原; 可便捷地将整个系统
25、(包括虚拟硬件、操作系统和配置好的应用程序)在不同的物理服务器之间进行迁移,甚至可以在虚拟机正常运行的情况下进行迁移;(2)分布式存储:业界典型的分布式存储技术主要有分布式文件系统存储、分布式对象存储和分布式块设备存储等几种形式。分布式存储技术及其相关产品已经日趋成熟,并在IT行业得到了广泛的使用和验证。在超融合架构中,分布式存储通过磁盘管理、缓存技术、存储网络、冗余副本等技术,管理集群内所有硬盘,“池化”集群所有硬盘的存储空间,通过向服务器虚拟化提供访问接口,使得虚拟机可以进行业务数据的保存、管理和读写等整个存储过程中的操作。分布式存储软件系统具有以下特点:高性能:数据分散存放,通过全局负载
26、均衡和分布式缓存技术提高IO性能;高可靠:采用集群管理方式,不存在单点故障,灵活配置多数据副本,不同数据副本存放在不同的机架、服务器和硬盘上,单个物理设备故障不影响业务的使用,系统检测到设备故障后可以自动重建数据副本;高扩展:没有集中式存储控制器,支持平滑扩容,容量几乎不受限制;易管理:存储软件直接部署在服务器上,没有单独的存储专用硬件设备,通过Web 页面的方式进行存储的管理,配置和维护简单。12(3)网络虚拟化: 传统IT架构中硬件定义网络的方式,存在诸多问题: 如何保障虚拟机在保持相应的网络配置策略不变的情况下进行虚机迁移。 虚拟化后的数据中心涉及业务众多,对外部提供云接入服务时,传统的
27、Vlan技术无法满足业务隔离的需求,解决大规模租户和租户之间、业务和业务之间的安全隔离是面临的重要问题。 虚拟化后的数据中心的业务系统的构建和上线对网络功能的快速部署、灵活弹性乃至成本,提出了更高的要求。 在传统网络中,不论底层的IT基础设施还是上层的应用,都由专属设备来完成。这些设备成本高昂,能力和位置固话,难以适应新业务对网络快速、灵活自动化部署的需求。为了解决上述问题,业界出现了多种解决方案,大体框架是对基础网络不进行大规模修改的条件下,实现应用在网络上的承载,并能与其它网络业务分离,并且以基于IP的基础网络技术为主。将原本传统的专业网元设备上的网络功能提取出来进行虚拟化,运行在通用的硬
28、件平台上,业界称这种变化为网络功能虚拟化(NFV) 。NFV的目标是希望通过广泛采用的硬件承载各种各样的网络软件功能,实现软件的灵活加载,在数据中心、网络节点和用户端等各个位置灵活配置,加快网络部署和调整的速度,降低业务部署的复杂度及总体投资成本,提高网络设备的统一化、通用化、适配性。3.虚拟资源层:从虚拟资源池获取相应的资源进行实例化,为应用提供丰富的虚拟化实例,从而大幅减少了专有硬件采购数量,降低总体投资成本,提高了业务部署、调整的速度和整体运维效率。4 集中管理层:通过集中式资源管理软件,对底层硬件资源、虚拟资源池和虚拟实例进行统一管理、监控,并支持为不同类型应用灵活分配资源。由此可见,
29、超融合架构并不是将多种硬件进行堆砌,软件才是超融合架构的核心,利用超融合软件实现对计算、存储、网络、安全等资源的重新定义,为X86服务器赋予了更多的能力。13超融合架构具备以下几个特点:基于通用X86服务器的全资源融合超融合架构基于标准的X86服务器,通过软件定义全部功能组件,即可为业务提供所需的计算、存储、网络、安全等资源,数据中心不再需要大量不同种类的硬件设备。按需横向扩展超融合架构具备模块化的无缝横向扩展能力,用户通过横向扩展更多的X86服务器,即可获得更高的计算能力、更大的存储容量、更高的I/O性能、更大的网络带宽,并且扩容期间业务不中断。 全分布式架构超融合架构采用全分布式架构,软件
30、分布在每一台主机上,数据被复制多份并跨主机保存,同时利用虚拟机HA技术和虚拟负载均衡等技术为应用提供高可靠性。任一主机一旦出现故障,都能保证集群管理不中断、数据不丢失和应用正常访问。 开箱即用,交付简单一般来说,超融合厂商都提供一体化交付方案,即超融合一体机,实现“开箱即用”,设备插电即可进行业务部署工作。即使纯软件交付,也只需要花费很短的时间就能完成软件安装工作。资源统一管理基于可视化管理平台对计算、存储、网络、安全等资源进行统一管理,解决了传统数据中心多种硬件设备管理割裂而导致的运维复杂的问题,简化了运维工作。超融合架构特点超融合的客户价值1.更简单的建设运维超融合精简了传统IT系统的三层
31、架构,采用标准服务器高速互联,即可同时实现计算、存储网络、存储设备的功能,不仅大幅降低了设备的使用量,同时使IT系统的建设运维简单许多。用户只需部署好符合要求的服务器或者超融合一体机,很快就可以部署业务并上线。这点在传统三层IT架构下是很难想像的,传统架构复杂的IT拓扑不仅涉及多种软硬件的安装、连接、调试,同时整个拓扑环节中任何一个小模块的故障,都可能导致整套系统无法正常工作,且需要花费较大的精力和时间来排除故障。在实施部署上,超融合系统的实施部署采用一体化甚至自动化安装的方式,只需数小时即可完成。而传统存储需要提前规划存储网络、业务网络、不同规格的设备空间、存储空间划分等需求,部分较专业的硬
32、件必须由专业人士部署,差不多要花费一周的时间。超融合架构下用户只需登陆统一的管理界面,即可监控管理整个集群,包括云管理、虚拟机、存储卷、服务器节点、磁盘的全部信息,并能够统一配置管理。当硬盘或节点故障时,超融合系统可以通过告警快速定位故障,并通过更换硬件恢复至健康状态。在传统模式下,用户需要单独维护存储网络、存储设备、虚拟化平台、服务器硬件、以太网设备等,一旦出现故障,需要逐一排除,甚至停机手动修复。14IT信息系统的TCO包括建设、运维、人力、能耗等多个方面。毫无疑问,更简单的架构和管理能给用户带来更低的使用成本。由于超融合系统无需专用SAN存储及SAN存储设备,也无需使用大量HDD硬盘来堆
33、叠出所需要IO性能,因此在同样的性能要求下,超融合产品一般只需传统架构的60%硬件设备;超融合系统实施快捷,时间成本和人力成本相对传统存储节省80%左右;运维成本上,超融合系统极其简便的运维方式,相对传统架构其运维成本甚至可以降低80%以上。另外在相同业务需求下,超融合架构需要更少的硬件,超融合一体机服务器甚至可以做到高密度整合、模块化配置,大幅节省机柜占用空间,电能节省最高可达40%。2.更低的投入成本15IT架构的扩展性是一个非常重要的问题,企业管理者需要考虑IT整体架构规划、业务发展速度、数据资源打通、重建成本等多方面的问题。横向扩展性是超融合架构的最大优势之一,得益于超融合的集群弹性架
34、构设计,当资源不足或性能不够时只需增加相应的超融合节点即可相应地增加计算资源和存储资源,满足业务扩展性的需求。超融合的虚拟化集群与分布式存储原生的支持在线轻松扩展,扩展过程时间短且不需停机,也不会影响业务的连续性,当完成存储资源扩容后系统会自动进行容量均衡,这种数据全打散的方式不但能够充分利用整个集群的IO并发性能,而且不会因为本地读写的问题导致某些节点存储使用过少或者过多的情况。传统IT架构只能支持scale-up扩展,在需要扩展容量的时候只能增加扩展柜加大容量,但控制器数量的扩展却十分有限,从而成为性能瓶颈。在需要扩展计算能力的时候,需要手动添加新的服务器资源,并从存储设备中增加硬盘划分新
35、的卷给服务器使用,扩展成本高,且扩展幅度极其有限。3.更具弹性的IT基础设施4.更高的业务可靠性超融合系统采用无中心的分布式架构,任意一个节点均可被无差别地替换;虚机HA、数据多副本机制、系统自检自愈功能能够及时恢复因故障缺失的数据副本,使上层应用可以抵御多次多样的故障,获得持续不断的稳定服务能力。因此在可靠性方面,超融合架构具有明显的优势。在业务层面,超融合集成了虚拟化集群的虚机高可用优势,可以在保证存储安全的前提下,实现原生的跨主机故障切换转移。同时还可以基于虚拟化层的快照、克隆、导入技术,对业务虚机进行有效的逻辑备份。在存储层面,超融合采用的是标准的分布式存储技术,分布式存储所具有的多副
36、165.更好的存储性能由于采用分布式存储作为IO支撑,超融合架构可实现较好的多节点并发性能。部分超融合平台采用数据本地化设计,采用SSD作为加速缓存,将VM所有数据都实现本地化吞吐,因此单业务系统即可实现高速的IO吞吐,多业务并发时的总体性能更是传统IT架构无法比拟的。在架构上,首先超融合相对传统存储其IO路径更短,超融合系统中,业务虚机与存储介质存在于同一个物理节点,其IO链路即内部总线,而非延时很高的外部以太网或FC链路,因此可以实现最短路径的IO吞吐,实现高性能业务支撑;同时超融合系统天然亲和闪存介质,每个节点都会配置SSD缓存,并在SSD缓存设计上做出深度的优化;此外超融合系统可以通过
37、横向扩展来单个整套系统性能。传统中端阵列8:2 8K混合随机读写性能约3-5万IOPS,还需要海量的HDD硬盘来实现性能支撑。而对于较好的超融合产品,单个节点8:2 8K混合随机读写很容易达到3-5万以上IOPS,10个左右节点就可以达到30-50万IOPS,更多的IO性能保证了在上层能运行更多、更快的业务系统。本冗余机制、数据打散均衡机制、故障域、纠删码等机制,都能完好的保护超融合系统的数据安全可用。在冗余模式上,超融合的2/3副本的方式比传统存储的RAID5/6更加可靠,当然3副本的情况下空间损耗也比较多。在冗余度上,超融合可以损坏两个节点(3副本情况下),而传统存储最多只能损坏一个控制器
38、或者损坏一两块磁盘。 在管理粒度上,超融合系统可以根据存储池划分不同副本级别,而传统存储是以RAID组为单位。在恢复速度上,超融合系统数据恢复能力取决于节点数和磁盘数,可轻松达到30分钟1TB的恢复速度,并可以控制数据恢复速度(避免影响正在运行的业务),而传统存储的数据恢复受限于单个数据盘的性能,恢复1TB数据往往需要数小时,二次故障的可能性极高。在恢复能力上,超融合系统可以自动恢复环境到健康状态,而传统存储需要人工更换热备盘。综上,超融合架构对于传统存储来说更加可靠。 第五章 超融合典型应用场景虚拟桌面基础设施虚拟桌面基础设施是超融合的典型场景。 虚拟桌面基础架构(VDI)对超融合的使用率比
39、其他任何场景都要多,很多企业在超融合上都优先部署了VDI。虚拟桌面非常受欢迎的原因之一是每个虚拟桌面等同于一个物理机。这就使规划计算容量变得很简单。 超融合的存储I / O管理功能很容易满足VDI中非常严格的I / O需求。虚拟桌面需要高吞吐量且低延迟的存储,所有的超融合解决方案都提供了本地直连存储用以减少延迟,同时超融合的一些I/O平衡算法功能可以优化虚机到物理机的数据传输。超融合里的虚拟桌面具有一些存储的功能,如分层存储和重复数据删除,这些功能能够使企业减少磁盘容量并支持VDI环境所需的磁盘I / O。 一些超融合解决方案的内置数据复制功能对于希望在多个物理位置部署VDI环境的组织机构是非
40、常有用的。 在多站点配置中,用户数据必须在所有站点进行复制以提供可用性。 对于永久虚拟桌面或非持续的思杰虚拟桌面私有虚拟磁盘场景,虚拟机的数据复制是必须使用的。17FEATURE SCOREDESCRIPTION相对传统服务器加存储区域网络(SAN)架构的总拥有成本(TCO)更低可 量 化 ,存 储 和 计 算 协 调 一 致高速、低延迟的磁盘对VDI至关重要,分层存储的闪存和/或动态随机存取存储器(DRAM)提高了启动风暴期间的性能基于统一镜像的桌面分发,因此重复数据删除率高用于多站点配置,虚拟机也需被复制许多VDI依赖虚拟机级快照进行配置可加速初始配置,后续管理自主完成利用API来完成初始
41、环境设置后通过其他方式配置重复数据删除复制快照管理API分层存储兼容性价格YES MAYBE NO 18数据迁移一些超融合产品中内置的VM级复制功能还为在不同物理位置之间迁移虚拟机提供了一种经济且简单可行的方法。这在整合数据中心或站点时特别有效。 企业IT组织使用超融合在每个虚拟机的基础上进行复制,而不是在逻辑单元号(LUN)或文件系统级(如共享存储的情况)内,他们将超融合节点部署到远程数据中心或站点,并在主数据中心设立兄弟节点,然后将虚拟机移入超融合环境,并通过广域网将其从远程站点复制到主数据中心。在这种情况下,通过广域网传输重复数据会显著增加带宽占用。因此,超融合产品所提供的内置重复数据删
42、除服务是非常有效的。此外,超融合的统一硬件管理和运维管理对计划迁移或整合网站的IT组织来说是非常有用的,因为超融合使IT组织不需要专业的系统管理员在远程站点工作,简化的超融合部署和管理意味着他们可以由非专业人员进行管理,从而降低了IT组织的总拥有成本(TC O)。FEATURE SCOREDESCRIPTION相比传统服务器加存储区域网络(SAN)架构的TCO更低。无任何体系结构不兼容问题存储性能不佳可减少迁移期间的广域网吞吐量,需要超融合重复数据删除内置的VM级复制是这种场景的关键特征。由于与站点迁移相关的备份/归档要求通常很严格,因此快照十分有用可由非专业人员在远程站点直接部署解决方案利用
43、API进行监控、日志记录或治理工具,并在迁移过程中收集数据。复制分层兼容性价格YES MAYBE NO 重复数据删除快照管理API19私有云超融合对构建软件定义数据中心(SDDC)非常有帮助,而SDDC反过来又是一个可行的私有云架构。因为SDDC自身的优越性,利用它可显着提高私有云部署的效率。SDDC自身固有的基于策略的设定为云开发提供了坚实的基础,并且提高了整体数据中心的灵活性。由于超融合提供了开箱即用的软件定义来进行计算与存储,这就使其为SDDC提供了极好的块存储。构建私有云服务需将底层基础架构抽象为可供云用户使用的自动策略驱动资源池。超融合已经提供了高级存储功能,例如分层存储、重复数据删
44、除、复制以及快照。如果在传统或融合基础架构上添加超融合提供的高级存储功能,然后抽象出存储功能以供云计算引擎使用是可行的。但是由IT组织自己去解决以上问题就意味着需要投入更多的时间与资源来管理并排除系统中所产生的故障,换言之,就意味着IT组织需要增加额外的硬件来支持现有基于外部控制器(ECB)存储阵列中所不支持的服务,这就导致无形中增加了总拥有成本(TCO)。然而,超融合确实遇到了私有云环境中的可扩展性挑战。在私有云中运行的所有工作负载不可能被量化,因此这里又出现了架构兼容性的问题。更通俗的说,超融合的总体容量上限是低于传统或融合基础架构的。因此,搭建在超融合上的私有云总数可能会很少,或者由许多
45、独立的节点集群组成。因此超融合的选择是非常有限的,而私有云管理起来则会更加复杂。FEATURE SCOREDESCRIPTION在传统的服务器加存储区域网络(SAN)架构上可能会实现价格优势,但如建立在商用硬件则价格偏高由于并非所有工作量都可被量化,而且超融合通常比传统基础设施的容量上限更低,因此可能出现扩展性问题内置分层功能允许私有云加速所有工作负载重复率会根据每种托管工作负载而有所不同,但至少会承担一些不是所有工作负载都需要复制,可实现站点冗余和业务连续性计划(BC)/ 灾难恢复计划(DR)总体而言,是私有云中提供的有用的数据服务私有云的所有主要功能都可通过单个界面进行控制API允许通过云
46、管理平台(CMP)自动部署和管理。快照管理APIs分层存储兼容性价格YES MAYBE NO 重复数据删除复制20远程办公室/分支机构和微型数据中心许多IT组织必须在ROBO位置安装服务器及存储设备。但在中央数据中心之外部署和管理基础架构又极具挑战性。这就导致IT组织越来越多地部署超融合以实现远程工作。将传统的“服务器加共享存储”基础设施部署到远程位置的组织期望使用超融合来降低总拥有成本(TCO)。因此超融合供应商一直视ROBO市场为其受欢迎且能够不断增长使用比例的场景。超融合为ROBO提供了巨大的便利与好处。其内置的数据服务为数据提供了高可用性。策略驱动的数据管理功能可确保将数据备份或复制到
47、中央数据中心。重复数据删除可降低磁盘成本。因为远程站点并没有专业的系统管理员,而超融合所拥有的简单集中控制的统一架构可使非专业人员轻松地部署与管理。这就使超融合拥有了非常大的吸引力。诚然,因为远程站点(如文件服务器或域控制器)的应用程序不是为了扩展而设计的,而是经常需要在不扩展计算的情况下扩展存储容量,所以有时并不适合超融合的架构。然而事实上存储在ROBO中很少成为问题。大多数ROBO位置根本不需要扩展其基础架构,因此任何关于超融合可扩展性的担忧都是没有实际意义的。鉴于此,许多组织得出结论认为,超融合的优点超过了对潜在的低效扩展的担忧。ROBO基础架构通常采用微型数据中心的形式,这种架构在特定
48、场景中越来越普遍。 Gartner将微型数据中心定义为“计算环境被设计用于安装在分布式位置,旨在易于安装、独立使用、可扩展并可远程管理。” 超融合可以为微型数据中心构建理想的块存储。一组超融合设备可以与网络交换机配对,以创建一个完整的基础设施栈,它只需要相对较小的空间、较少的电力、不需要特殊的冷却系统和非标准的电源插座,也没有特殊的安装硬件。在Gartner的分析中,微型数据中心的两个主要设计目标是它应该自主运行,但要集中控制。并且它应该是一个易于部署、替换、监视和远程控制的独立解决方案。 而超融合架构正与这些设计目标十分吻合。FEATURE SCOREDESCRIPTION相比传统或具有相同
49、功能的融合基础架构总拥有成本(TCO)低,但比商用x86服务器硬件的TCO高。ROBO工作负载通常不会被量化,扩展性很少成为问题存储性能很少成为ROBO工作负载的关注点,但可能会从中获益重复数据删除可节省磁盘成本,并可在站点复制期间(如启用)降低广域网吞吐量复制回中央数据中心对许多ROBO工作至关重要ROBO工作负载通常有严格的备份要求,快照可为此提供便利非专业人员可部署超融合解决方案利用API进行监控,日志记录或治理复制分层兼容性价格 YES MAYBE NO 重复数据删除快照管理APIs21关系数据库对于在Oracle数据库或Microsoft SQL Server上构建的大型关系数据库,超融合体系结构的表现有些差强人意,因为它们的存储和计算需求通常不需要同时扩展。数据库服务器通常需要增加存储容量,而不是CPU或内存。即便如此,仍有许多IT组织认为在关系数据库上部署超融合将拥有巨大的潜在回报。提高性能是关系数据库的主要目标。 超融合可