1、缓存技术浅谈,Robbin Fan,缓存是什么,解决什么问题?,Cache是高速缓冲存储器 一种特殊的存储器子系统,其中复制了频繁使用的数据以利于快速访问 凡是位于速度相差较大的两种硬件/软件之间的,用于协调两者数据传输速度差异的结构,均可称之为 Cache,基于Web应用的系统架构图,数据库,应用服务器,Web服务器,存储设备,浏览器,Web应用架构,操作系统的文件系统,Web应用系统存在哪些速度差异?,读取文件系统 读取磁盘 读取数据库内存 读取文件系统 读取应用内存 访问数据库服务器 读取静态文件 访问应用服务器 读取浏览器缓存 访问网站,缓存技术分类,操作系统磁盘缓存 减少磁盘机械操作
2、 数据库缓存 减少文件系统I/O 应用程序缓存 减少对数据库的查询 Web服务器缓存 减少应用服务器请求 客户端浏览器缓存 减少对网站的访问,操作系统缓存概述,文件系统提供的Disk Cache:操作系统会把经常访问到的文件内容放入到内存当中,由文件系统来管理 当应用程序通过文件系统访问磁盘文件的时候,操作系统从Disk Cache当中读取文件内容,加速了文件读取速度 Disk Cache由操作系统来自动管理,一般不用人工干预,但应当保证物理内存充足,以便于操作系统可以使用尽量多的内存充当Disk Cache,加速文件读取速度 特殊的应用程序对文件系统Disk Cache有很高的要求,会绕开文
3、件系统Disk Cache,直接访问磁盘分区,自己实现Disk Cache策略Oracle的raw device(裸设备) 直接抛弃文件系统MySQL的InnoDB: innodb_flush_method = O_DIRECT,Windows的Disk Cache,Linux的Disk Cache,数据库缓存的重要性,为什么数据库非常依赖缓存?数据库通常是企业应用系统最核心的部分数据库保存的数据量通常非常庞大数据库查询操作通常很频繁,有时还很复杂以上原因造成数据库查询会引起非常频繁的磁盘I/O读取操作,迫使CPU挂起等待,数据库性能极度低下 数据库有哪些缓存策略?Query CacheDat
4、a Buffer,Query Cache,以SQL作为key值缓存查询结果集一旦查询涉及的表记录被修改,缓存就会被自动删除设置合适的Query Cache会极大提高数据库性能 Query Cache并非越大越好,过大的Qquery Cache会浪费内存。 MySQL: query_cache_size= 128M,MySQL Query Cache监控工具,show status like Qcache%; mysqlreport脚本 MySQL Administrator,Query Cache状态示例,_ Query Cache _ Memory usage 25.77M of 64.00
5、M %Used: 40.26 Block Fragmnt 24.73% Hits 6.98M 3.2/s Inserts 100.87M 46.9/s Insrt:Prune 34.15:1 45.5/s Hit:Insert 0.07:1,Data Buffer,data buffer是数据库数据在内存中的容器 data buffer的命中率直接决定了数据库的性能 data buffer越大越好,多多益善 MySQL的InnoDB buffer:innodb_buffer_pool_size = 2G MySQL建议buffer pool开大到服务器物理内存60-80%,MySQL buff
6、er 监控工具,show innodb statusG show status like innodb%; mysqlreport脚本 innotop,InnoDB buffer状态示例,_ InnoDB Buffer Pool _ Usage 1000.00 of 1000.00 %Used: 100.00 Read hit 99.99% PagesFree 0 %Total: 0.00Data 59.69k 93.26 % Drty: 0.02Misc 4311 6.74Latched 0 0.00 Reads 60.30G 28.0k/sFrom file 7.01M 3.3/s 0.0
7、1Ahead Rnd 98684 0.0/sAhead Sql 9548 0.0/s Writes 86.79M 40.3/s Flushes 14.08M 6.5/s Wait Free 0 0/s,应用程序缓存概述,对象缓存 查询缓存 页面缓存动态页面静态化Servlet缓存页面内部缓存,对象缓存,由O/R Mapping框架例如Hibernate提供,透明性访问,细颗粒度缓存数据库查询结果,无需业务代码显式编程,是最省事的缓存策略 当软件结构按照O/R Mapping框架的要求进行针对性设计,使用对象缓存将会极大降低Web系统对于数据库的访问请求 良好的设计数据库结构和利用对象缓存,能够
8、提供极高的性能,对象缓存适合OLTP(联机事务处理)应用,对象缓存分类,对映射数据库表记录的entity对象进行缓存 对1对n关系的集合进行缓存 对n对1关系的关联对象进行缓存,Hibernate对象缓存配置,Entity Cache(usage = CacheConcurrencyStrategy.NONSTRICT_READ_WRITE) public class Forest . ,配置entity对象缓存,配置关联集合的缓存,OneToMany(cascade=CascadeType.ALL, fetch=FetchType.EAGER) JoinColumn(name=“CUST_I
9、D“) Cache(usage = CacheConcurrencyStrategy.NONSTRICT_READ_WRITE) public SortedSet getTickets() return tickets; ,仅仅添加Annotation就可以了,无须编码,即可自动享受对象缓存。Hibernate会拦截对象的CRUD操作,针对对象读取操作进行缓存,针对对象修改操作自动清理缓存,Hibernate二级缓存是提升web应用性能的法宝,OLTP类型的web应用,由于应用服务器端可以进行群集水平扩展,最终的系统瓶颈总是逃不开数据库访问; 哪个框架能够最大限度减少数据库访问,降低数据库访问
10、压力,哪个框架提供的性能就更高; 针对数据库的缓存策略: 对象缓存:细颗粒度,针对表的记录级别,透明化访问,在不改变程序代码的情况下可以极大提升web应用的性能。对象缓存是ORM的制胜法宝。 对象缓存的优劣取决于框架实现的水平,Hibernate是目前已知对象缓存最强大的开源ORM 查询缓存:粗颗粒度,针对查询结果集,应用于数据实时化要求不高的场合,查询缓存,对数据库查询结果集进行缓存,类似数据库的Query Cache 适用于一些耗时,但是时效性要求比较低的场景。查询缓存和对象缓存适用的场景不一样,是互为补充的 当查询结果集涉及的表记录被修改以后,需要注意清理缓存,Hibernate查询缓存
11、,在配置文件中打开Query Cache hibernate.cache.use_query_cache true 在查询的时候显式编码使用Cache List blogs = sess.createQuery(“from Blog blog where blog.blogger = :blogger“) .setEntity(“blogger“,blogger) . setMaxResults(15) . setCacheable(true) . setCacheRegion(“frontpages“) . list();,Hibernate查询缓存特征,并非缓存整个查询结果集,而是缓存查询
12、结果集entity对象的id集合blogId1, blogId2, blogId3,在遍历结果集的时候,再按照blogId去查询blog对象,例如 select blog.* from blog where id=?如果此时blog配置了对象缓存,则自动读取对象缓存 Hibernate查询缓存会自动清理过期缓存一旦结果集涉及的entity被修改,查询缓存就被自动清理,页面缓存,页面缓存的作用是什么?针对页面的缓存技术不但可以减轻数据库服务器压力,还可以减轻应用服务器压力好的页面缓存可以极大提高页面渲染速度页面缓存的难点在于如何清理过期的缓存 页面缓存技术有哪些?动态页面静态化Servlet缓存
13、页面局部缓存,动态页面静态化,利用模板技术将访问过一次的动态页面生成静态html,同时修改页面链接,下一次请求直接访问静态链接页面 动态页面静态化技术的广泛应用于互联网CMS/新闻类Web应用,但也有BBS应用使用该技术,例如Discuz! 无法进行权限验证,无法显示个性化信息 可以使用AJAX请求弥补动态页面静态化的某些缺点,Servlet缓存,针对URL访问返回的页面结果进行缓存,适用于粗粒度的页面缓存,例如新闻发布 可以进行权限的检查 OScache提供了简单的Servlet缓存(通过web.xml中的配置) 也可以自己编程实现Servlet缓存,OSCache Servlet缓存示例,
14、CacheFiltercom.opensymphony.oscache.web.filter.CacheFiltertime600scopesessionCacheFilter/news/* ,页面局部缓存,针对动态页面的局部片断内容进行缓存,适用于一些个性化但不经常更新的页面(例如博客) OSCache提供了简单的页面缓存 可以自行扩展JSP Tag实现页面局部缓存,OSCache的页面局部缓存, . some jsp content . some jsp content .“ time=“1800“ refresh=“. some jsp content .“ cron=“0 2 * *
15、*“ refresh=“. some jsp content . ,应用缓存的缓存服务器,EHCache适合充当对象缓存和Hibernate集成效果很好,Gavin King也是EHCache作者之一OSCache充当Servlet和页面缓存在一个Web应用当中可以同时使用OSCache和EHCacheJBossCache在Java群集环境下使用支持缓存在节点之间的复制,在JBoss AS上被用来实现HTTP Session的内存复制功能,非Java实现的通用缓存产品,Memcached在大规模互联网应用下使用每秒支撑1.5万2万次请求Tokyo Tyrant 兼容memcached协议,可以
16、持久化存储支持故障切换,对缓存服务器有高可靠性要求可以使用每秒支撑0.5万0.8万次请求,Web服务器端缓存技术,基于代理服务器模式的Web服务器端缓存squid/nginx Web服务器缓存技术被用来实现CDN(内容分发网络 content delivery network)被国内主流门户网站大量采用不需要编程,但仅限于新闻发布类网站,页面实时性要求不高,基于AJAX技术的浏览器缓存,使用AJAX调用的时候,将数据库在浏览器端缓存 只要不离开当前页面,不刷新当前页面,就可以直接读取缓存数据 只适用于使用AJAX技术的页面,1. 2. 3. 27. 28. 29. “ onclick=“gop
17、age(+,this)“ type=“button“ 30. page:1 31. data area,未使用AJAX缓存代码,# # 1) ) # /如果缓存存在,则直接调用缓存数据,不用再去服务器进行数据请求 # alert(cache hit); # $(“#data2“).html(cache_datapage); # $(“#page2“).html(page); # return true; # # $(“#page2“).html(page); # obj.disabled = true; # $(“#data2“).html(“loading(cache enabled).“)
18、; # $(“#data2“).load(url, # limit: 25, # function(responseText) obj.disabled = false; # cache_datapage = responseText;/将当前的数据存入到内存(缓存变量)中 # ); # # # # / # # # “ onclick=“gopageCache(+,this)“ type=“button“ # page:1 # data area,使用AJAX缓存代码,基于HTTP协议的资源缓存,Etag “12523074“ Last-Modified Thu, 29 May 2008 09:43:46 GMT,/blog,/blog,If-Modified-Since Thu, 29 May 2008 09:43:46 GMT If-None-Match “12523074 “,304 Not Modified,基于资源的缓存示例,CacheFilterStaticContentcom.opensymphony.oscache.web.filter.CacheFilterexpirestimeCacheFilterStaticContent*.jsp ,谢 谢!,