美文网首页
分布式缓存集群的伸缩性设计

分布式缓存集群的伸缩性设计

作者: 代码的搬运工 | 来源:发表于2019-11-27 10:14 被阅读0次

1、Memcached分布式缓存集群的访问模型

以Memcached为代表的分布式缓存,访问模型如下图所示:

应用程序通过Memcached客户端访问Memcached服务器集群,Memcached客户端主要由一组API、Memcached服务器集群路由算法、Memcached服务器集群列表及通信模块构成。

其中路由算法负载根据应用程序输入的缓存数据KEY计算得到应该将数据写入到Memcached的哪台服务器或者应该从哪台服务器读取数据。

一个典型的缓存写操作如上图所示。应用程序输入需要写缓存的数据<'BEIJING',DATA>,API将KEY('BEIJING')输入路由算法模块,路由算法根据KEY和Memcached集群服务器列表计算得到一台服务编号(NODE1),进而得到该机器的IP地址和端口(10.0.0.0:91000)。API调用通信模块和编号为NODE1的服务器通信,将数据<'BEIJING',DATA>写入该服务器。完成一次分布式缓存的写操作。

读缓存的过程和写缓存一样,由于使用同样的路由算法和服务器列表,只要应用程序提供相同的KEY('BEIJING'),Memcached客户端总是访问相同的服务器(NODE1)去读取数据。只要服务器还缓存着该数据,就能保证缓存命中。

2、Memcached分布式缓存集群的伸缩性挑战

由上述讨论可得知,在Memcached分布式缓存系统中,对于服务器集群的管理,路由算法至关重要,和负载均衡算法一样,决定着究竟该访问集群中的哪台服务器。

简单的路由算法可以使用余数Hash:用服务器数目初一缓存数据KEY的Hash值,余数为服务器列表下标编号。假设上图中'BEIJING'的Hash值是490806430(JAVA中的HashCode()返回值),用服务器数目3除以该值,得到余数1,对应节点NODE1。由于HashCode具有随机性,因此使用余数Hash路由算法可保证缓存数据在整个Memcached服务器集群中比较均衡的分布。

对余数Hash路由算法稍加改进,就可以实现和负载均衡算法中加权负载均衡一样的加权路由。事实上,如果不需要考虑缓存服务器集群伸缩性,余数Hash几乎可以满足绝大多数的缓存路由需求。

但是,当分布式缓存集群需要扩容的时候,事情就变得棘手了。

假设由于业务发展,网站需要将3台缓存服务器扩容至4台。更改服务器列表,仍旧使用余数Hash,用4除以'BEIJING'的Hash值49080643,余数为2,对应服务器NODE2。由于数据<'BEIJING',DATA>缓存在NODE1,对NODE2的读缓存操作失败,缓存没有命中。

很容易就可以计算出,3台服务器扩容至4台服务器,大约有75%被缓存了的数据不能正确命中,随着服务器集群规模的增大,这个比例线性上升。当100台服务器的集群中加入一台新服务器,不能命中的概率是99%。

这个结果显然是不能接受的,在网站业务中,大部分的业务数据读操作请求事实上是通过缓存获取的,只有少量读操作请求会访问数据库,因此数据库的负载能力是以有缓存为前提而设计的。当大部分被缓存了的数据因为服务器扩容而不能正确读取时,这些数据访问的压力就落到了数据库的身上,这将大大超过数据库的复杂你能力,严重的可能会导致数据库宕机。

一种解决办法是在网站访问量最少的时候扩容缓存服务器集群,这时候对数据库的负载冲击最小。然后通过模拟请求的方法逐渐预热缓存,使缓存服务器中的数据重新分布。但是这种方案对业务场景有要求,还需要技术团队通宵加班(网站访问低谷通常是在半夜)。

能不能通过改进路由算法,使得新加入的服务器不影响大部分缓存数据的正确命中呢?目前比较流行的算法是一致性Hash算法。

3、分布式缓存的一致性Hash算法

具体内容请看:https://www.jianshu.com/p/6ad87a1f070e 里面的一致性Hash算法。

相关文章

  • 理解一致性哈希算法

    场景分析 在分布式缓存的伸缩性设计中,最主要的目标就是在新加入缓存服务器后,应该使整个服务器集群中已经缓存的数据尽...

  • 分布式缓存集群的伸缩性设计

    1、Memcached分布式缓存集群的访问模型 以Memcached为代表的分布式缓存,访问模型如下图所示: 应用...

  • redis(集群搭建、集群分区原理、集群操作)

    分布式缓存技术redis学习系列(四)——redis高级应用(集群搭建、集群分区原理、集群操作) windows环...

  • 高并发解决方案

    应用和静态资源分离 页面缓存 集群和分布式 静态资源集群和应用集群。应用集群要考虑session同步。负载均衡。 ...

  • 一致性hash

    应用领域(数据分布式存储) 数据缓存集群(redis、memcache) hadoop ESearch 分布式数据...

  • 大型网站架构演变过程

    web动静资源分离 缓存处理 web server集群 + 读写分离 CDN、分布式缓存、分库分表 多数据中心+分...

  • JAVA架构师之路-分布式缓存应用设计

    分布式缓存应用设计 缓存概述 缓存是分布式系统中的重要组件,主要解决高并发,大数据场景下,热点数据访问的性能问题。...

  • 分布式理论(八)—— Consistent Hash(一致性哈希

    前言 在分布式系统中,常常需要使用缓存,而且通常是集群,访问缓存和添加缓存都需要一个 hash 算法来寻找到合适的...

  • Apache-Ignite入门实战之三 - 分布式锁

    在 Ignite 的分布式缓存中还有一种常见应用场景是分布式锁,利用分布式锁我们可以实现简单的集群master选举...

  • 面试题问题整理

    1、缓存redis:如何保证大量数据修改的时效性;2、异步刷新缓存:消费速率太慢如何解决;3、redis分布式集群...

网友评论

      本文标题:分布式缓存集群的伸缩性设计

      本文链接:https://www.haomeiwen.com/subject/wvwuwctx.html