1、根据 SAP 的字面意思理解, SAP HANA 是硬件和和软件组合起来一个解决方案, 容许客户分析大量的数据,而且是以接近Real Time 的方式来同步数据,不需要花费太多时间在数据传输上,目前HANA 的版本是 1.0.集成了一些SAP 的组件, 比如 IMDB(In-Memory Database), Sybase的 Replication 技术,以及 SAP STR(Landscape Transformation Replicator)等等。SAP HANA 作为一种第3 方硬件合作伙伴共同合作而优化打造的应用,目前支持和认证的硬件厂商,包含 HP, IBM, 思科 , 富士通,戴
2、尔 5 家合作伙伴,据说给联想LENOVO 做的 HANA 方案,是使用的联想自己的服务器,应该也可以。但是不在SAP 通用实施的合作伙伴范围之内。关于 IMDBSAP IMDB(In-Memory Database) 是一个内存数据库的混血儿,不仅包含行存储,也包含列存储, 而且还有机遇对象存储的数据数据库技术, 这么设计的主要目的是用来充分挖掘和使用现代多核CPU 架构设计所带来的并发处理能力,毫无疑问, SAP 的这种应用能从中受益颇多。IMDB 是 SAP HANA 的核心,用来帮助客户提升运营效率,敏捷而且灵活,下图来自 SAP中图片。HANA 的 Technology of Man
3、ual2 Admin Client End User ClientsSAP In-MemoryComputingStudio&Administratiof)* SBOP Erifrpi MS EXCEL(PrsMDng Dm& Report)IMDB支持多种数据源,目前支持3中数据replication 方法,并且提供了一个管理界面,这边叫 admin studio ,般的监控和新 modeling 都可以在这里实现。然后支持2种客户端,查看基于内存存储而产生的报表。SAP HANA Replication Technologies-数据复制技术SAP IMDB所产生报告和分析所需要的业务数据
4、是需要从源系统复制到SAP的IMDB.具User InterfacesDashboa rdst Webl,Xcesius Explorer体怎么复制这里现在提供了 3中方法,在看具体有那 3中方式之前,先看这个 IMDB的核 心中有哪些会参与到数据 Replication 的场景:SAP In-Memory Computingr AdministrationSAP ln*MennoryComputingStjdiofH凶日版UM吟说53 SAP HANA 由IMDB 和IMDB Admin Studio 组成,UI主要用来管理 hana 的应用装置,有点类似 BO的仪表盘界面 Source S
5、ystem ,例如 ERP 用于支持数据复制的软件组件Replication Methods OverviewSAP HANAApplication LayerETL-Based ReplicationSource SystemSAP ERPTrigger-Based ReplicationI t I * f I # T |Log-Based Replication - Mrce SysletrsSAPNetWaver 3nj PMy 9WLoadCOTMTQliMAuthor izatkxiManagerRelational EnginesRaw StoreColumn StoreMela
6、dal aManageiPage Man期ment_ Dm vown9Disk StorageLogger这张图片是从 SAP HANA 的PPT上剪辑下来的,主要包含了 SAP HANA 的应用架构和在 应用中会涉及到一些周边软件环境。HANA架构下的亲戚关系 IMCE Studio用于HANA的系统管理,以及信息建模(各种维度,KPI等) ERP这里指的是一般的数据源,会从ERP过来过来的业务数据 BO BI4BO的BI 4.0平台,主要提供 ETL的核心功能,源系统数据导入,删选/合并/格式化数据,再导入目标系统 Other Source System其他的数据源,由于 BI的 In-M
7、emory Computing EngineIMCE的核心组件部分) Clients客户端的工具,用什么方式浏览工具(查看报表或者查询),或者用什么工具来展现数据(报表设计工具,是用Explorer还是用 Web Intelligence, 或者用CrystalReport也是可以的,这里不多加描述)和数据导入相关的IMCE Stu ModelingAdministrationReplicationAgenterpdbLogLoading Data into HANAQxceiClients (planned, e.g.)DashboardSAP BI4 universesDesi 甲(WeN
8、tT)In-Memory Computing EngirSession ManagementRequest FYocessing / Execution CoReplicationParserMtS巳veSQL ScnptCalc EBusiness Objects EnterpriseSBOInformationDesign ToolSBO BI4 servers (program for client)Other Source SystemsSAPNetWeaver 3rd PartyBWLoadCoctrolterDataServicesDesignerDataServicesRelat
9、ional EnginesRowStofeCdumrPage ManagementPbs旧馆nc& LayerDisk StorageDatm VcMjmes* Modeling工具中可以创建数据库表* Replication Agent(这里可能是使用 SLT实时同步的情况下),可以安装在 ERP中作为一个但单独的组件,监控应用层的数据库修改,然后可以同步到HANA的数据库d Data Service Designer用来创建数据的 source ,以及target可以做mapping ,作为ETL的工具,比如创建定时的作业,这样可以定期的从system抽数据,然后导入到 HANA的数据库中
10、3RttposiuxyOala Services D&sign&f Job Server* Data Service 是服务器端(虽然使用DS作为ETL的工具,然后 DS个数据库来支持,注意!不是用来存储从 ERP来的数据,然后传输到source依然需要HANA 中,是用来保存一些mapping 关系的资源库)数据建模的相关亲戚成员Data ModelingIMCX StudioAdministrationModelingMS ExcelClfent$ (pianned, e g )BI4 ExplorerDashboard DesignSAP B(4 unrvarss (WebLJBI4 A
11、nantsIn-Memory Ccmpuvng Engi(eReplicattonAgentERPDBLogSession MonennenlRepl 心 lion ServerRequest Processing i Execution ControlSQL Paw MCXXSQL Scrip!Calc EngineDaia Services O&agnerDakServicesSBO kikxmsbon Design led SBOBH server (programLoad ConrolterCodtm StoepT ransacbon ManagerAuthoizaikMi 眺 Mwg
12、erMetadataMvngarPage Managenwut Pers*5lence LayerLoggef同样,Modeling 工具(就是HANA的Admin Studio ),用来创建数据模型, Attribute View , Analytical View , Calculation View ,在 Modeling 工具中可 以直接查看HANA中数据库表,也可以创建表等。* Meta Data Manager* SBO Information Design Tool,比如创建一些 Business Layer ,然后发布成Universe ,这样其他的BO的报表设计工具就可以使用
13、这个基于Universe 的数据模型了,然后开发出查询报表,等等。* Data Service Designer ,除了帮助load 数据之外,它提供了和报表相关的ReportingIMCE StudioAdrnmstrKMiModeling印1 Repiicabon Agenterpoe问MS ExcelClients (pbnrbodr o g )BM ExpiofvrDashtoad DesionSAP BI4 unrwefses (Webl,.)BM AnalystsIn Memcxv ConouUna Enoine Scsskti ManagementBtsnefis Objects
14、 Entcfpnse口氟之ServicesDesignerDataServrc&sSBO Information Design Tod SBOBI4 servers (pfogram for drentjHphcafiotiServerLoadControl terRtjqucsl Processing t t)cution ControlSQL ParserMDXSQL ScrtpfCalc EngineRchbonal Ejigmesftow StoraColurm StoreTransactionManagerAuthonzatiooManagerMetadataManagerPage
15、Managewent er$ist?nce L ayrLoggermtn volumesDi 妹 StorageLOQVOllXnH* MS Excel - BI Analysis for MS-Office Edition,是个插件用来浏览报表用的* BI4 - Web Intelligence可以用来做基于 Universe 发布的报表,稍微比Explorer灵活点Administration - 管理* HANA的维护管理例如备份和恢复都是在IMCE Studio里面做的,和Information Modeling 同一个界面,只是切换到管理视图的话,就可以看到用户,角色, schema
16、等,以及HANA的服务的一些系统状态。IMCE StudioAdministrationModeling* Persistence Layer 持久层HANA的服务器中用于储存数据的非闪存空间HANA中的数据都是保存在内存中的,一拉闸停电,数据就没有了,虽然服务器掉电的情况发生很少,但是这里还是解决了这个问题, 当然不是专门为停电而解决的, 比如数据库休克了或者HAN用艮务器死机了,必须重启的情况。它有以下的功能 记录Log信息,包含last save point和因为停电而没有写入数据库中的那些10g信息。TimeII III II IData savepointto persistent
17、storageIf ORo.% er failureLog writtento persistent storage(committed Van sactio n s)这里可以看到从 HANA的内存写到 Persistence Layer的数据,包含了 2个部分:Data和Log ,这个过程是持续不断的过程,当然中间有一定的时间间隔,其实Persistence Layer就是HANA勺内存数据库的某个时点的一个完整的镜像拷贝,以及这个拷贝之后所所有发生的数据库更新的Log信息(在停电前成功执行完毕的)为什么不直接写入磁盘保存呢?因为HANA基于内存数据库(newDB),这种实时数据同步操作或者
18、实时数据的更新是很快的,但是磁盘的读写速度往往和内存的速度有差异,为了解决这个问题,在硬件层面提供了一个闪存(即使断电,还有数据,有点像快速缓存,这个 闪存有24 TB左右)用来同步保存内存数据库中的log信息,并且生成 Save Point ,然后写入真正的持久的磁盘存储。* Disk Storage,硬盘/固态存储Disk Storage用于保存和备份 HANA的数据库,因为 Persistence Layer 的容积是有限的,所以 HANA的备份都是放在外部的物理存储的,比如高速率的硬盘或者其他的设备。在备份数据和恢复数据的时候会用到,比如重启服务器。Page ManagementPer
19、sistence LayerLoggerLog VolumesDisk StorageData Volumes备份是从Persistence Layer 到Disk ,原因上面已经解释了,为了不影响 HANA的运行,以及读写速率差异的问题。备份可以设定时间,比如每天一次,还是一周一次等。汪忠:文中特别之处,当前的版本1.0 (SP12)不支持Log的备份以及Configuration文件的备份,这些必须手动的拷贝出来备份,下个一个版本应该会解决这些问题。Backup & Restore 备份和恢复数据备份,从Persistence Layer备份到外部的存储系统,自动化处理(二)工具:IMCo
20、mputing Studio中有备份和恢复的功能可以使用11物10g备份,暂时没有自动化,需要手工,不是体力活哦Configuration 备份,没有自动化,需要手工,具体的系统恢复 的话,需要:最后一个 SAVE POINT以及发生在这个save point之后成功被写入持久层的关于是损坏的文件)DB更新的log (不可以I III II/OData backupto external backupdestinationII III IIILog writtento persistent storage(committed transactions 恢复到什么地方到,看上面图片,红线之前的数据库的状态能全部还原。 TimeDisk failure (data volumes)