美文网首页
二级缓存实现分析及思路

二级缓存实现分析及思路

作者: Bill_Li_GB | 来源:发表于2019-08-08 16:59 被阅读0次

    1. 引言

    性能是衡量系统运行是否高效稳定的重要指标,我们从缓存的应用场景,缓存存在哪些好处,同时会带来一些什么问题,最后通过对比并结合一些成熟的缓存框架进一步整合出一套高效,稳定的内部通用的内存框架,提供系统应用。

    1.1. 缓存优化对象

    数据需要分类,才能更好的使用缓存以及一些策略来达到优化的目的。

    1、 冷热数据

    2、 哪些数据量很大,读取会严重影响IO

    3、 哪些数据查多改少(日志数据,爬虫数据)

    4、 哪些数据又是经过很复杂的计算得到的结果(这些珍贵的数据需要好好保存利用)

    一句话概况:更快读写的存储介质+减少IO+减少CPU计算=性能优化。

    2. 缓存分类

    CPU缓存:存储介质;(CPU和内存之间的临时存储器)高速缓存>内存

    浏览器缓存:缓存一些静态资源

    CDN缓存:互联网基础之上的一层智能虚拟的网络

    数据库缓存:在应用和数据库直接加一层CACHE

    业务层缓存:更加细粒度的缓存

    3. 缓存带来的好处

    显而易见,缓存给我们带来最直接的体验就是“快”

    1、 通过减少IO(包括磁盘和网络)来提高吞吐量,减少计算量(CPU计算)释放CPU,这些都是提高系统的响应速度。

    2、 通过切面的处理方式,可以在各层进行插拔,是所有性能优化最简单有效的解决方案。

    4. 缓存带来的困扰

    1、 数据的一致性、实时性受影响。

    (需要对数据的一致性,时效性进行评估,进而确定是否要缓存或设定缓存的过期时间,比如个性化的数据是否值得缓存。)

    2、 缓存介质带来的不可靠性。

    (一般使用内存做缓存的话,若机器故障,如何保证缓存的高可用?可考虑对缓存进行分布式做成高可用,同时,需要接受这种不可靠不安全会给数据带来的问题,在异常情况下进行补偿处理,定期持久化等方式)

    3、 缓存的数据使得更难排查问题。因为缓存命中是随着访问随时变化的,缓存的行为难以重现,使得出现BUG很难排查。

    4、 进程内缓存可能会增加GC压力:大量长寿命的缓存对象会增加垃圾收集的时间和次数。

    使用缓存之前我们需要对数据进行分类,对访问行为进行评估,思考哪些数据需要缓存,缓存时需要采用什么策略?这样才不被缓存所困扰,才能规避这些问题。

    5. 常用的缓存工具

    1、 Ehcache:可以通过组播的方式实现集群。主要运用于本地缓存,数据库上层的缓存。

    2、 Memcache:是一套分布式的高速缓存系统,提供key-value这样简单的数据存储,可以充分的利用CPU多核,无持久化功能。主要可以用于Session共享,页面对象缓存。

    3、 Redis:高性能的key-value系统,提供丰富的数据类型,单核CPU有抗并发能力,有持久化和主从复制的功能。主要使用redis的redis sentinel,根据不同业务分为多组。

    6. Ehcache+redis构建两级缓存

    场景:我们的应用系统是分布式集群的,可横向扩展的。应用中某个接口操作满足以下一个或多个条件:

    1. 接口运行复杂代价大,

    2. 接口返回数据量大,

    3. 接口的数据基本不会更改,

    4. 接口数据一致性要求不高(只需满足最终一致)。

    高可用分布式的缓存集群 + 持久化功能

    备选方案:ehcache集群 或者 redis主备(sentinel)

    Ehcahe集群因为节点之间数据通过通过组播的方式,可能带来的问题:节点间大量数据复制带来额外的开销,在节点多的情况下此问题越发严重,N个节点出现N-1次网络传输数据同步。(如下图,缓存集群中有三台机器,其中一台接受到数据,需要拷贝到其他机器,一次input后需要copy两次,两次copy是需要网络传输消耗的)

    Redis主备由于作为中心节点提供缓存,其他节点都向redis中心节点取数据,所以一次网络传输即可。(当然此处的一次网络代价跟组播是不一样的)但是,随着访问量增大,大量的缓存数据访问使得应用服务器和缓存服务器之间的网络I/O消耗越大。(见下图,同样三台应用服务器,redis sentinel作为中心节点缓存。所谓中心,即所有应用服务器以redis作为缓存中心)不再像ehcache集群,缓存是分散存放在应用服务器中,需要互相同步的,任何一台应用服务器的input,都会经过一次copy网络传输到redis,由于redis是中心共享的,那么就可以不用同步的步骤,其他应用服务器只需get取即可。但是,我们会发现多了N台服务器的get网络开销。

    所以就需要两级缓存解决,在redis的方案上做一步优化,在缓存到远程redis的同时,缓存一份到本地进程ehcache(此处的ehcache不用做集群,避免组播带来的开销),取缓存的时候会先取本地,没有会向redis请求,这样就会减少应用服务器和缓存服务器redis之间的网络开销。

    Spring集成ehcache和redis实现两级缓存

    1、Spring和ehcache集成

    主要获取ehcache作为操作ehcache的对象。

    2、Spring和redis集成

    主要获取redisTemplate作为操作redis的对象。

    Ehcache作为一级缓存,redis作为二级缓存。

    通过注解的方式获取缓存。

    问题:一次缓存访问命中一定次数后更新redis

    问题:方法key为对象时,key会很大,通过spEL表达式再将key进行md5加密,可缩短节省内存空间。

    利用spring注解Cacheable,可以对服务接口直接切入自定义二级缓存。

    相关文章

      网友评论

          本文标题:二级缓存实现分析及思路

          本文链接:https://www.haomeiwen.com/subject/ywjqxftx.html