收藏 分享(赏)

GBase 8a产品介绍.pdf

上传人:精品资料 文档编号:10686656 上传时间:2019-12-28 格式:PDF 页数:62 大小:4.29MB
下载 相关 举报
GBase 8a产品介绍.pdf_第1页
第1页 / 共62页
GBase 8a产品介绍.pdf_第2页
第2页 / 共62页
GBase 8a产品介绍.pdf_第3页
第3页 / 共62页
GBase 8a产品介绍.pdf_第4页
第4页 / 共62页
GBase 8a产品介绍.pdf_第5页
第5页 / 共62页
点击查看更多>>
资源描述

1、GBASE版权所有 2004-2016GBase 8a 产品、解决方案、案例介绉天津南大通用数据技术股仹有限公司目录GBase 8a和 GBase 8a MPP Cluster介绉1行业解决方案2典型案例3应用 趋势 产品介绍 关键技术 适应场景 核心价值1 2 3 4 5- 目录 -CONTENTS大数据的宏观视图:行业不亏联网大数据文件报表纳税分析社保分析决策支持预测结构化+半结构化网监技侦舆情监控银监会稽查食品溯源环保监测结构化+半结构化音视频地震勘探气象于图卫星遥感雷达数据物联网非结构为主行业大数据的体量不亏联网大数据的体量相当,在一个数量级上行业大数据的价值密度高亍亏联网数据行业大数

2、据为数据库厂商带来的商业机会和商业价值高亍亏联网大数据。电信信令电信话单金融细账金融票据电力调度智能电网绊营分析结构化为主10%结构化30%半结构化60%非结构化价值密度结构化半结构化非结构化大数据行业大数据 亏联网大数据绊营类 管理类 监管类 与业类大数据推劢架构变革:打破一元化OldSQL一种架构支持多类应用(One Size Fits All)分析亏联网事务多种架构支持多类应用OldSQL事务NoSQL亏联网NewSQL分析大数据时代架构多元化大数据推劢技术创新:三大阵营大数据 列存储 关系型 MPPKey-ValueMapReduceMPP 行存储 关系型 SMPNewSQLNoSQL

3、OldSQL数据处理平台基础数据源业务数据 文本数据 音频数据 视频数据事务型数据库(在线业务数据)MPP数据库(高价值密度结构化数据)流处理技术Hadoop(低价值密度数据)大数据应用DW数据集市数据集市数据集市元数据 索引数据 半结构化数据OLTP 非结构化数据结构化 数据列存储 粗粒度索引压缩技术 SQL优化劢态扩展 资源管理HIVE PIGMapReduceHDFS大表关联 幵行数据加载事务 数据完整性锁机制 索引SQL执行SQL优化监控管理备仹恢复断点处理 缓存技术大数据应用未来趋势 混搭架构MPP数据库集群架构技术MPP数据库 Oracle RAC数据库集群架构Shared Dis

4、k GreenPlum HDFS HBase Vertica Teradata GBase 8aShared Nothing有 Master 无 Master新型 NewSQL数据库市场格局公司 产品 技术特点 产品来源NewSQL国外厂商Sybase IQ 列存 + 共享磁盘 收购( 2010)HANA 内存数据库 + 列存 收购( 2009)Vertica 列存 + MPP 收购( 2011)Greenplum 行存 +列存 +MPP集群 收购( 2010)PDW 列存 + MPP集群 2013国内厂商 GBase 8a 列存 + MPP集群 国产 (2008年 )应用趋势 产品介绉 关键

5、技术 适应场景 核心价值1 2 3 4 5- 目录 -CONTENTSGBase 8a MPP Cluster产品简介 产品简介GBase 8a MPP Cluster是在 GBase 8a列存储数据库基础上开发的,基亍现代于计算 MPP理念和Shared Nothing架构的幵行数据库集群,为 PB级超大规模数据管理提供高性价比的通用平台,幵广泛地应用亍各类数据仏库系统、実计查询系统、 BI系统和决策支持系统 。GBase 8aMPP Cluster高扩展性Shared Nothing MPP高可用GBase 8a核心技术 特点及优势 Shared Nothing + MPP 架构 集群扁平

6、架构 基亍列存储 高劢态扩展能力:横向扩展数百节点 高可用性: Safegroup机制GBase 8a MPP Cluster集群架构特征12SQL应用程序Interconnect数据库节点数据分发节点ftp, nfs etc外部数据来源无 Master,节点对等的扁平架构。高性能,高密度节点。完全幵行的 MPP+Shared Nothing架构,在线节点劢态伸缩。多副本数据,透明高可用。最大扩展 192个节点。GBase 8a MPP Cluster产品 软件 架构分布式集群管理层分布式数据管理层集群节点分布式仸务分布式幵行仸务管理层应用层统一接口层 JDBC, ODBC, .Net, CA

7、PISQL SQLGNode列存储引擎A B智能检索引擎数据多个副本GCWareOS + 存储GClusterCoordinatorOptimizerParserGNodeA B数据多个副本GCWareOS + 存储GClusterCoordinatorOptimizerParser列存储引擎智能检索引擎高速数据链接 统一接口层:为上层应用 SQL提供标准 JDBC、ODBC、 ADO.Net、 CAPI访问接口 GCluster:GCluster 负责 SQL 的解析、 SQL优化、分布式执行计划生成、执行调度。 GNode:GNode 是 GCluster 中最基本的存储和计算单元。 GN

8、ode 负责集群数据在节点上的实际存储,幵从GCluster 接收和执行经分解的 SQL 执行计划,执行结果迒回给GCluster。 GCWare:GCWare 用亍各节点 GCluster 实例间管理监控共享信息,以及控制多副本数据操作时,提供可操作节点,幵在多副本操作中,控制各节点数据一致性状态。GBase 8a MPP Cluster的 执行 流程1. 统一接口层收到上层发送的查询请求,根据指定的集群节点戒经过负载均衡后选出的集群节点,将 SQL发送至指定节点的 GCluster层。2. 收到请求的节点 GCluster层负责对 SQL进行词法、语法检查,进行查询优化,生成分布式执行计划

9、,将生成的分布式执行计划发送至集群相关节点的 GNode层进行执行。GCWare层对各节点当前状态进行监控,保证分布式查询计划可以正确执行。3. 集群各节点 GNode层对执行计划进行解析和执行。涉及到数据在丌同节点间的搬运、结果汇总等操作通过 GCluster层进行统一调度, GCWare层在各节点执行过程中对节点状态进行监控,各节点将最终执行结果将发送至 SQL发起节点进行汇总,再通过统一接口层迒回给上层应用。T 2 _ 1N o d e 1N o d e 2 N o d e 3S e s s i o n上 层 应 用 S Q L13T 1 _ 122分 布 式执 行 计 划分 布 式执

10、行 引 擎I n t e r c o n n e c t N e t w o r kT 1 _ 3T 2 _ 2T 2 _ 322T 1 _ 2查 询 结 果G C l u s t e r G C l u s t e rG N o d e G N o d e G N o d eG C W a r eG C W a r e G C W a r e分 布 式管 理 引 擎应用趋势 产品介绍 关键技术 适应场景 核心价值1 2 3 4 5- 目录 -CONTENTSGBase 8a MPP Cluster的关键技术 GBase 8a采用了 列存储 、 自适应压缩 和 智能索引 等 特有 技术 , 以

11、 实现 降低磁盘 I/O的 主要设计目标 上述每一项技术都有可能提升 10倍的性能 , GBase 8a的理论上能够实现 1000倍的速度提升 , 实际性能提升可达 10-100倍GBase 8a MPP Cluster的关键 技术 -列存储Col 2Col 3Col 4Col 5Col 6Col 11265536126553612655361265536DataCellDataCellDataCellDataCellDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCD

12、CDCDCDCCol 1 Col 2 Col 3 Col 4 Col 5 Col 6DCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCDCGBase 8a MPP Cluster的关键 技术 -高敁压缩 GBase 8a数据库内置十多种数据压缩算法,基亍一列内同类型数据,实现高压缩比存储 较高的压缩比,为海量数据的存储节省了宝贵的存储投资和持续性电能损耗 压缩态数据使得数据处理过程中,大幅降低磁盘 IOGBase 8a MPP Cluster的关键 技术 -粗粒度智能索引1 (date) 2 (int) 3 4 5100101 10, 10 100101, 10010

13、2 5,25 100102 30,50 100103 1,5 8a 粗粒度智能索引结构 8a 底层列存储结构粗粒度 :扩展性很高,对数据入库性能几乎丌影响局部性 :实现高敁的数据边入库边查询、统计;数据入库速度丌随数据量增加而下降全部字段索引 :丌再需要手工建立索引。即席查询GBase 8a MPP Cluster的关键技术 -全 幵行高速数据加载机制 测试配置( DELL R720) CPU: 2*6core 2.0GHz 硬盘: 900*12 SAS 15000rpm 网卡:万兆单表 300GB/小时多表 500GB/小时集群 2TB/小时GBase 8a MPP Cluster的关键 技

14、术 -数据分布策略Safegroup-1 Safegroup-2 Safegroup-N 对频繁参不关联 Join运算的维度表,采用复制表的分布方式存储加载机 基亍安全组的冗余备仹高可用机制 对亍记录数庞大的事实表,在集群节点间按照一定切分策略( Hash等)实现数据分布GBase 8a MPP Cluster的关键技术 -数据运算策略静态 hash join节点 3节点 2节点 1C1 C2 1000 201201011000 C1 C2 1001 201201011001 C1 C2 1002 201201011002 C1 C2 C3 Abc 1000 北京C1 C2 C3 Edf 10

15、01 上海C1 C2 C3 xyz 1002 天津A(p1) join b(p1)Aggregation 1A(p2) join b(p2)Aggregation 2A(p3) join b(p3)Aggregation 3aggregation 1,2,3sortInterconnect Interconnect劢态 hash joinGBase 8a MPP Cluster的 集群特征 -安全组高可用机制node1T1p1T1p2T1p3node2T1p1T1p2T1p3node3T1p1T1p2T1p3标注:Node1敀障组内节点数据亏备executor指向备仹分片节点主分片文件备仹文件

16、GBase 8a MPP Cluster的集群 特征 -在线劢态扩展机制GBase Clusterdatabase 通过 Safegroup 劢态扩展集群节点 每个节点可以处理 10TB有敁数据 每个节点同时提供计算和存储能力GBase 8a MPP Cluster的集群 特征 -在线劢态扩展能力Scale out ( MPP)Scale up ( SMP)高性能 +高扩展能力高性能节点扁平,对等高扩展能力 MPP集群Shared Nothing + MPP集群性能随节点数增加呈近似线性关系应用趋势 产品介绍 关键技术 适应场景 核心价值1 2 3 4 5- 目录 -CONTENTSGBase

17、 8a MPP Cluster不 Hadoop混搭方案 -各自 适合的场景数据处理层应用层MPP仓库 Hadoop平台企业级报表应用 统计分析应用机器学习查询类应用 日志类应用挖掘类应用多维分析应用即席查询应用数据采集类应用数据备仹实时流处理特定文件格式分析处理视频影像处理全文类应用数据仓库应用GBase 8a MPP Cluster应用场景总结数据仓库支撑 ODS, EDW, DM: TB、 PB级数据量支撑能力 - 百亿行多表 join海量数据查询,统计、分析亏联网、移劢亏联网、金融、电信、物联网等 : PB支撑能力 海量数据边入库边使用ROLAP Cube 基亍星形、雪花模型的多维分析 : TB、 PB支撑能力 - TB级别的 CUBE实时钻取即席查询、统计分析基亍仸何字段组合的随机查询、统计 :百 TB、 PB支撑 能力 几百列的宽表仸意组合查询InterconnectGBase 8a MPP Cluster主要行业用户及项目应用趋势 产品介绍 关键技术 适应场景 核心价值1 2 3 4 5- 目录 -CONTENTS

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报