1. 引言
性能是衡量系统运行是否高效稳定的重要指标,我们从缓存的应用场景,缓存存在哪些好处,同时会带来一些什么问题,最后通过对比并结合一些成熟的缓存框架进一步整合出一套高效,稳定的内部通用的内存框架,提供系统应用。
1.1. 缓存优化对象
数据需要分类,才能更好的使用缓存以及一些策略来达到优化的目的。
1、 冷热数据
2、 哪些数据量很大,读取会严重影响IO
3、 哪些数据查多改少(日志数据,爬虫数据)
4、 哪些数据又是经过很复杂的计算得到的结果(这些珍贵的数据需要好好保存利用)
一句话概况:更快读写的存储介质+减少IO+减少CPU计算=性能优化。
2. 缓存分类
CPU缓存:存储介质;(CPU和内存之间的临时存储器)高速缓存>内存
浏览器缓存:缓存一些静态资源
CDN缓存:互联网基础之上的一层智能虚拟的网络
数据库缓存:在应用和数据库直接加一层CACHE
业务层缓存:更加细粒度的缓存
3. 缓存带来的好处
显而易见,缓存给我们带来最直接的体验就是“快”
1、 通过减少IO(包括磁盘和网络)来提高吞吐量,减少计算量(CPU计算)释放CPU,这些都是提高系统的响应速度。
2、 通过切面的处理方式,可以在各层进行插拔,是所有性能优化最简单有效的解决方案。
4. 缓存带来的困扰
1、 数据的一致性、实时性受影响。
(需要对数据的一致性,时效性进行评估,进而确定是否要缓存或设定缓存的过期时间,比如个性化的数据是否值得缓存。)
2、 缓存介质带来的不可靠性。
(一般使用内存做缓存的话,若机器故障,如何保证缓存的高可用?可考虑对缓存进行分布式做成高可用,同时,需要接受这种不可靠不安全会给数据带来的问题,在异常情况下进行补偿处理,定期持久化等方式)
3、 缓存的数据使得更难排查问题。因为缓存命中是随着访问随时变化的,缓存的行为难以重现,使得出现BUG很难排查。
4、 进程内缓存可能会增加GC压力:大量长寿命的缓存对象会增加垃圾收集的时间和次数。
使用缓存之前我们需要对数据进行分类,对访问行为进行评估,思考哪些数据需要缓存,缓存时需要采用什么策略?这样才不被缓存所困扰,才能规避这些问题。
5. 常用的缓存工具
1、 Ehcache:可以通过组播的方式实现集群。主要运用于本地缓存,数据库上层的缓存。
2、 Memcache:是一套分布式的高速缓存系统,提供key-value这样简单的数据存储,可以充分的利用CPU多核,无持久化功能。主要可以用于Session共享,页面对象缓存。
3、 Redis:高性能的key-value系统,提供丰富的数据类型,单核CPU有抗并发能力,有持久化和主从复制的功能。主要使用redis的redis sentinel,根据不同业务分为多组。
6. Ehcache+redis构建两级缓存
场景:我们的应用系统是分布式集群的,可横向扩展的。应用中某个接口操作满足以下一个或多个条件:
1. 接口运行复杂代价大,
2. 接口返回数据量大,
3. 接口的数据基本不会更改,
4. 接口数据一致性要求不高(只需满足最终一致)。
高可用分布式的缓存集群 + 持久化功能
备选方案:ehcache集群 或者 redis主备(sentinel)
Ehcahe集群因为节点之间数据通过通过组播的方式,可能带来的问题:节点间大量数据复制带来额外的开销,在节点多的情况下此问题越发严重,N个节点出现N-1次网络传输数据同步。(如下图,缓存集群中有三台机器,其中一台接受到数据,需要拷贝到其他机器,一次input后需要copy两次,两次copy是需要网络传输消耗的)
Redis主备由于作为中心节点提供缓存,其他节点都向redis中心节点取数据,所以一次网络传输即可。(当然此处的一次网络代价跟组播是不一样的)但是,随着访问量增大,大量的缓存数据访问使得应用服务器和缓存服务器之间的网络I/O消耗越大。(见下图,同样三台应用服务器,redis sentinel作为中心节点缓存。所谓中心,即所有应用服务器以redis作为缓存中心)不再像ehcache集群,缓存是分散存放在应用服务器中,需要互相同步的,任何一台应用服务器的input,都会经过一次copy网络传输到redis,由于redis是中心共享的,那么就可以不用同步的步骤,其他应用服务器只需get取即可。但是,我们会发现多了N台服务器的get网络开销。
所以就需要两级缓存解决,在redis的方案上做一步优化,在缓存到远程redis的同时,缓存一份到本地进程ehcache(此处的ehcache不用做集群,避免组播带来的开销),取缓存的时候会先取本地,没有会向redis请求,这样就会减少应用服务器和缓存服务器redis之间的网络开销。
Spring集成ehcache和redis实现两级缓存
1、Spring和ehcache集成
主要获取ehcache作为操作ehcache的对象。
2、Spring和redis集成
主要获取redisTemplate作为操作redis的对象。
Ehcache作为一级缓存,redis作为二级缓存。
通过注解的方式获取缓存。
问题:一次缓存访问命中一定次数后更新redis
问题:方法key为对象时,key会很大,通过spEL表达式再将key进行md5加密,可缩短节省内存空间。
利用spring注解Cacheable,可以对服务接口直接切入自定义二级缓存。
网友评论