1、集群环境下网络空间信息服务高性能内存缓存方法 黄颖 郭明强 谢忠 吴亮 武汉中地数码科技有限公司 中国地质大学信息工程学院 摘 要: 针对现有集群环境下网络空间信息服务性能优化策略的特点和弊端进行分析, 提出集群环境下网络空间信息服务高性能内存缓存方法, 重点研究网络空间信息服务高性能内存缓存体系结构、可扩展的高性能内存缓存控制设计、内存缓存工作流程, 最终实现集群环境下基于内存缓存的网络空间信息服务的加速, 解决传统 WebGIS 模型中存在的 I/O 瓶颈问题。最后, 使用五个常用的网络空间信息服务类型对文中提出的方法进行实验, 结果证明与传统的集群环境下网络空间信息服务相比, 文中设计的
2、网络空间信息服务高性能内存缓存方法能够有效地提升服务并发处理能力, 具有良好的可扩展性。关键词: 网络空间信息服务; 集群; 缓存; 高性能; 可扩展; 作者简介:黄颖 (1981-) , 女, 高级工程师, 博士后.收稿日期:2016-11-21基金:国家博士后科学基金资助项目 (2014M552115) Research on high performance memory cache of WebGIS under cluster environmentHUANG Ying GUO Mingqiang XIE Zhong WU Liang Wuhan Zondy Cyber Techno
3、logy Ltd., Co.; School of Information Abstract: Aiming at the characteristics and drawbacks of existing performance optimizing strategies under WebGIS cluster environment, this paper proposes a new WebGIS model based on high performance memory cache under cluster environment, which mainly focuses on
4、 the high performance memory cache architecture of WebGIS, the scalable high performance memory cache module and the workflow of memory cache, thus realizing the high performance memory cache under WebGIS cluster environment, and solving the I/O bottleneck problem in traditional WebGIS model.Finally
5、, five frequently-used services are used in WebGIS to conduct the simulation experiment.The result shows that, compared with the traditional WebGIS cluster environment, the new model based on high performance memory cache designed in this paper can effectively improve the concurrent processing capab
6、ility of WebGIS cluster, which has good scalability.Keyword: WebGIS; cluster; memory cache; high performance; scalability; Received: 2016-11-21在大数据时代, 空间数据的海量特性日益凸显出来1, 为了应对海量空间数据在网络环境下的大规模用户并发访问, 高性能已成为网络空间信息服务2-7需要解决的首要问题8。制约网络空间信息服务并发处理能力的因素众多, 必须从其体系架构出发, 分析网络空间信息服务体系中各个层次的存储、传输和计算流程9-10, 找到性能瓶颈
7、所在, 针对性地对性能瓶颈进行优化, 才能够提升网络空间信息服务的并发处理能力。1 相关研究为了应对网络空间信息服务面临的海量空间数据发布和大规模用户并发访问的挑战, 已有较多的学者对网络空间信息服务的性能优化进行了深入研究, 并取得了显著的研究成果, 如渐进式传输11-12, 负载均衡13-15和并行计算16-17。这三种方法均未解决海量空间数据的大规模用户并发访问时的存储设备的 I/O 瓶颈问题, 此瓶颈是目前严重制约网络空间信息服务并发处理性能的关键。因此, 本文研究并设计了一种集群环境下网络空间信息服务高性能内存缓存方法, 采用高性能内存缓存技术将空间数据请求内容进行缓存, 减少海量空
8、间数据在存储设备上的 I/O 次数, 以有效地提升网络空间信息服务的并发处理性能。2 网络空间信息服务高性能内存缓存方法2.1 网络空间信息服务高性能内存缓存架构为了解决传统网络空间信息服务集群体系结构存在的弊端, 解决大规模用户并发访问场景下空间数据存储设备存在的 I/O 瓶颈问题, 本文提出了一种网络空间信息服务高性能内存缓存架构, 如图 1 所示。其主要的改进之处:1) 图 1 中的 Load Balancer (负载均衡器) 在调度来自客户端的并发请求任务时, 不再每次都将请求转发给 GIS Server Cluster (GIS 服务器集群) 中的服务结点进行处理, 而是先从 Cac
9、he Server Cluster (内存缓存集群) 中检索当前请求任务对应的结果缓存, 若缓存命中, 则直接将缓存的结果返回给客户端, 如果缓存未命中, 才从 GIS Server Cluster 中选择一个最优的服务结点处理当前请求任务。这样在大规模用户并发访问下, 可以减少相同的并发请求任务被重复地发送到 GIS Server Cluster 中, 从而减少 GIS 服务器对空间数据库的访问次数, 有效解决空间数据存储设备 I/O 瓶颈问题。2) 图 1 中架构与传统网络空间信息服务集群最大的不同在于增加了 Cache Server Cluster, 目前服务器硬件配置发展速度快, 内存
10、容量已能轻易扩展至128GB 甚至更高, 在海量空间数据应用场景下, 可以借助多个内存缓存服务器组成的缓存集群, 扩充网络空间信息服务集群的内存缓存容量, 缓存容量越大, 缓存的命中率就越高, GIS 服务器和空间数据存储设备的负载就越低, 从而最大程度的避免 I/O 瓶颈对网络空间信息服务并发处理能力的影响。2.2 可扩展的高性能内存缓存控制设计内存缓存技术目前已广泛应用于各个大型互联网服务网站中, 具有代表性的内存缓存技术有 Memcached 和 Redis, 亚马逊和阿里云均提供了支持这两种内存缓存的云服务产品, 用于支持大规模用户并发访问场景下的并发请求结果数据缓存, 网络空间信息服
11、务的每一个网络请求地址均对应一个请求结果, 这种特性非常符合内存缓存技术的特点。因此, 可以将 Memcached 和 Redis 内存缓存技术引入到网络空间信息服务中, 实现基于内存缓存的网络空间信息服务的加速。图 1 网络空间信息服务高性能内存缓存架构 下载原图为了支持不同的内存缓存技术, 本文设计的网络空间信息服务高性能内存缓存架构遵循了模块可扩展的设计原则, 如图 2 所示, 定义了一个通用的内存缓存操作接口 ICacheServer, 不同的内存缓存服务只需要实现该接口中定义的函数即可, 如 MemCacheServer 用于支持 Memcached 内存缓存服务, RedisSer
12、ver 用于支持 Redis 内存缓存服务。CacheManager 是提供给 Load Balancer 的内存缓存集群的操作类, 其提供了重要的内存缓存的获取和存储函数。ThirdPartCacheConfig 类是高性能内存缓存的全局配置类, 其包含了不同内存缓存服务的配置信息、内存缓存开关、缓存有效期、接口权限控制信息等参数配置。MemCacheConfig 和 RedisConfig 分别是 Memcached 和 Redis 内存缓存服务的参数配置类, CacheInterfaceControl是网络空间信息服务接口的控制类, 用于控制各个服务接口的缓存权限和缓存数据的有效期, 实
13、现接口粒度的网络空间信息服务高性能内存缓存控制。2.3 高性能内存缓存工作流程当 Load Balancer 接收到来自客户端的并发请求后, 对每个请求的具体处理流程如下 (见图 3) 。1) Load Balancer 根据每个请求的类型获取当前请求对应的缓存项的 Key, 以瓦片地图服务为例, 可以使用瓦片地图服务名称, 瓦片的行号、列号和级数来生成缓存项的 Key, 格式为tileName_lev-el_row_col;图 2 可扩展的内存缓存控制类 下载原图图 3 内存缓存工作流程 下载原图2) 同时根据接口类型获取接口缓存权限控制类 Control;3) 根据 Key, Contro
14、l 和缓存数据的类型 (T) , 调用 CacheManager 的GetCache 方法从内存缓存集群中检索当前请求的 Key 对应的结果数据缓存项, 若缓存命中, 则直接将检索到的缓存数据返回给客户端, 结束。若缓存未命中, 转 (4) 。4) 将当前请求任务转发到 GIS Server Cluster 中的 GIS 服务器结点, GIS 服务器进行空间数据检索、提取和处理后, 将结果返回至 Load Balancer。5) Load Balancer 调用 CacheManger 的 SetCache 方法将 GIS 服务器返回的结果存储到内存缓存集群中, Key 存储的内容为 GIS
15、服务器返回的字节数组 byte。同时将结果返回至客户端。3 实验设计与结果3.1 实验参数为了验证本文提出的高性能内存缓存架构的性能, 本文使用网络空间信息服务中常用的且适合进行内存缓存的五大服务接口来进行验证测试。WMTS GetTile是瓦片地图服务接口, WMTS GetCapabilities 是瓦片地图服务元数据信息获取接口, 目录服务接口是获取网络空间信息服务平台发布的地图服务目录信息, 地形服务是用于获取三维地球上的地形数据, 三维模型服务用于获取在三维视图中显示的三维模型数据。本文使用位于高速局域网内的服务器构建试验床, 采用全国 1:25 万地质图数据进行实验, 使用 500
16、 并发访问用户量对本文提出的方法进行实验, 并与传统集群下的网络空间信息服务进行对比。3.2 实验结果分析在网络空间信息服务中, Load Balancer 每秒能够成功完成的请求数是衡量集群环境下网络空间信息服务并发处理性能的关键指标之一, 每秒能够成功处理的请求数越多, Load Balancer 的并发处理能力越强。从图 4 中可以分析得出: (1) 传统的无内存缓存的网络空间信息服务集群的每秒处理请求数显著低于本文提出的采用高性能内存缓存的集群架构。以 WMTS GetTile 服务接口为例, 在无内存缓存情况下, Load Balancer 的每秒处理请求数仅 121 次, 而在新的
17、架构中可以提升到每秒 700 次以上, 获得超过 5 倍的性能提升。 (2) 在新的网络空间信息服务高性能内存缓存架构中, 主流的Memcached 和 Redis 内存缓存服务均能获得稳定的加速性能, 大多数常用的网络空间信息服务接口的并发处理能力均能达到约 700 次/s, 表现出本方法对第三方内存缓存服务的良好的可扩展性, 有利于其它类型的内存缓存服务快速稳定的扩展到本文设计的网络空间信息服务高性能内存缓存架构中。图 4 负载均衡器每秒处理请求数 下载原图4 结束语本文针对现有集群环境下的网络空间信息服务体系架构的弊端进行研究, 重点考虑到网络空间信息服务在大规模用户并发访问场景下的空间
18、数据存储设备I/O 性能瓶颈, 设计了新的具有高性能内存缓存集群的网络空间信息服务集群架构, 实现了 Memcached 和 Redis 两种主流的第三方内存缓存服务的扩展, 以减少负载均衡器和 GIS 服务器之间的请求次数, 有效地降低 GIS 服务器和空间数据库的负载, 从而有效地降低空间数据存储设备的 I/O 次数。实验中使用了常用的五种网络空间信息服务接口进行验证测试, 实验结果表明, 与传统的网络空间信息服务体系结构相比, 本文提出的支持高性能内存缓存的网络空间信息服务集群能够获得显著的性能提升, 并且在 Memcached 和 Redis 两种主流的内存缓存服务中均表现稳定, 证明
19、了本文提出的方法有效性和可扩展性。下一步工作会将亚马逊和阿里云中的内存缓存服务扩展到本文设计的网络空间信息服务架构中, 以将其运用到云环境的生产与实践中。参考文献1ZHANG L, YANG C, TONG X, et al.Visualization of large spatial data in networking environmentsJ.Computers and Geosciences, 2007, 33 (9) :1130-1139. 2刘晓童, 马文波, 马雪涛.基于 WebGIS 的建设用地监管系统设计与实现J.交通科技与经济, 2013 (6) :114-117. 3杨
20、超, 潘东峰.基于 Flex 和 ArcGIS Server 的 WebGIS 开发关键技术研究J.测绘与地理信息空间, 2016, 39 (6) :90-92. 4江明明.基于 WebGIS 的城市地铁施工监测信息管理系统分析J.测绘与地理信息空间, 2016, 39 (9) :86-87. 5杨娟, 陶叶青.基于 WEBGIS 的管理维护系统J.交通科技与经济, 2009 (6) :110-112. 6宁方志, 季民, 陈许霞.基于 WebGIS 的武都精细化扶贫系统的设计与开发J.测绘与地理信息空间, 2016, 39 (7) :39-41. 7李月华.基于 WebGIS 的环境监管云平
21、台设计与建设J.测绘与地理信息空间, 2016, 39 (1) :121-124. 8WANG S, ANSELIN L, BHADURI B, et al.CyberGIS software:a synthetic review and integration roadmapJ.International Journal of Geographical Information Science, 2013, 27 (11) :2122-2145. 9YANG B, PURVES R, WEIBEL R.Efficient transmission of vector data over the
22、 InternetJ.International Journal of Geographical Information Science, 2007, 21 (2) :215-237. 10MUSTAFA N H, KRISHNAN S, VARADHAN G, et al.Dynamic simplification and visualization of large maps.J.International Journal of Geographical Information Science, 2006, 20 (3) :273-302. 11YANG L, ZHANG L, MA J
23、, et al.Efficient Simplification of Large Vector Maps Rendered onto 3DLandscapesJ.Computer Graphics&Applications IEEE, 2011, 31 (2) :14-23. 12ZHANG L, REN Y, GUO Z.Transmission and visualization of large geographical mapsJ.ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66 (1) :73-80. 13陈一
24、骄, 卢锡城, 时向泉, 等.一种面向会话的自适应负载均衡算法J.软件学报, 2008, 19 (7) :1828-1836. 14李忠民, 喻占武, 朱莉.基于空间数据内容的动态负载均衡方法J.武汉大学学报 (信息科学版) , 2009, 34 (5) :622-625. 15王浩, 喻占武, 李锐, 等.基于开销代价的网络地理信息服务负载均衡算法研究J.测绘学报, 2009, 38 (3) :242-249. 16YANG C, WONG D W, YANG R, et al.Performance-improving techniques in web-based GISJ.International Journal of Geographical Information Science, 2005, 19 (3) :319-342. 17PESQUER L, CORTS A, PONS X.Parallel ordinary kriging interpolation incorporating automatic variogram fittingJ.Computers&Geosciences, 2011, 37 (4) :464-473.