缓存在分布式系统中的应用

作者: garyond | 来源:发表于2017-04-19 13:21 被阅读293次

【转】缓存在分布式系统中的应用
缓存在分布式系统中的应用
分布式系统-思维图
谈如何处理分布式事务
到底什么是分布式系统？
2018-10-11 Java 分布式应用追踪系统 skywal
分布式相关
java消息中间件
zookeeper 实现分布式锁
分布式中的log

缓存在分布式系统中的应用

摘要

缓存是分布式系统中的重要组件，主要解决高并发，大数据场景下，热点数据访问的性能问题。提供高性能的数据快速访问。

本文是缓存在分布式应用第一篇文章，介绍缓存的原理，缓存的分类，缓存的设计，CDN缓存（原理，架构参考和技术实践），反向代理缓存（原理，Squid架构实践和常用代理缓存之间的比较）等。

1. 缓存概述

缓存是分布式系统中的重要组件，主要解决高并发，大数据场景下，热点数据访问的性能问题。提供高性能的数据快速访问。

1.1 缓存原理

将数据写入/读取速度更快的存储（设备）；
将数据缓存到离应用最近的位置；
将数据缓存到离用户最近的位置。

1.2 缓存分类

在分布式系统中，缓存的应用非常广泛，从部署角度有以下几个方面的缓存应用。

CDN缓存；
反向代理缓存；
分布式Cache；
本地应用缓存；

1.3 缓存媒介

常用中间件：Varnish，Ngnix，Squid，Memcache，Redis，Ehcache等；
缓存的内容：文件，数据，对象；
缓存的介质：CPU，内存（本地，分布式），磁盘（本地，分布式）

1.4 缓存设计

缓存设计需要解决以下几个问题：

（1）缓存什么？

  哪些数据需要缓存：1.热点数据；2.静态资源；

（2）缓存的位置？

  CDN，反向代理，分布式缓存服务器，本机（内存，硬盘）

（3）如何缓存的问题？

  - 过期策略
  
    1. 固定时间：比如指定缓存的时间是30分钟；
    2. 相对时间：比如最近10分钟内没有访问的数据；

  - 同步机制
    
    1. 实时写入（PUSH）
    2. 异步刷新（PUSH & PULL）

2. CDN缓存

CDN主要解决将数据缓存到离用户最近的位置，一般缓存静态资源文件（页面，脚本，图片，视频，文件等）。国内网络异常复杂，跨运营商的网络访问会很慢。为了解决跨运营商或各地用户访问问题，可以在重要的城市，部署CDN应用。使用户就近获取所需内容，降低网络拥塞，提高用户访问响应速度和命中率。

2.1 CDN原理

CDN的基本原理是广泛采用各种缓存服务器，将这些缓存服务器分布到用户访问相对集中的地区或网络中，在用户访问网站时，利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上，由缓存服务器直接响应用户请求。

未部署CDN应用前

未部署CDN应用前应用架构

网络路径：

请求：本机网络（局域网）--> 运营商网络 --> 应用服务器机房

响应：应用服务器机房 --> 运营商网络 --> 本机网络（局域网）

在不考虑复杂网络的情况下，从请求到响应需要经过3个节点，6个步骤完成一次用户访问操作。

部署CDN应用后

网络路径：

请求：本机网络（局域网）--> 运营商网络

响应：运营商网络 --> 本机网络（局域网）

在不考虑复杂网络的情况下，从请求到响应需要经过2个节点，2个步骤完成一次用户访问操作。

与不部署CDN服务相比，减少了1个节点，4个步骤的访问。极大的提高的系统的响应速度。

2.2 CDN优缺点

优点
- 本地Cache加速：提升访问速度，尤其含有大量图片和静态页面站点；
- 镜像服务：消除了不同运营商之间互联的瓶颈造成的影响，实现了跨运营商的网络加速，保证不同网络中的用户都能得到良好的访问质量；
- 远程加速：远程访问用户根据DNS负载均衡技术智能自动选择Cache服务器，选择最快的Cache服务器，加快远程访问的速度；
- 带宽优化：自动生成服务器的远程Mirror（镜像）cache服务器，远程用户访问时从cache服务器上读取数据，减少远程访问的带宽、分担网络流量、减轻原站点WEB服务器负载等功能。
- 集群抗攻击：广泛分布的CDN节点加上节点之间的智能冗余机制，可以有效地预防黑客入侵以及降低各种D.D.o.S攻击对网站的影响，同时保证较好的服务质量。
缺点
- 动态资源缓存，需要注意实时性；
  
  解决办法：主要缓存静态资源，动态资源建立多级缓存或准实时同步等。
- 如何保证数据的一致性和实时性需要权衡考虑。
  
  解决办法：设置缓存失效时间；数据版本号等。

2.3 CDN架构参考

CDN架构参考

2.4 CDN技术实践

目前，中小型互联网公司，综合成本考虑，一般租用第三方CDN服务，大型互联网公司，采用自建或第三方结合的方式。比如淘宝刚开始使用第三方的，当流量很大后，第三方公司无法支撑其CDN流量，淘宝最后采用自建CDN的方式实现。

例如淘宝的CDN架构，如下图所示：

淘宝CDN架构

3. 反向代理缓存

反向代理是指在网站服务器机房部署代理服务器，实现负载均衡，数据缓存，安全控制等功能。

3.1 反射代理缓存原理

反向代理位于应用服务器机房，处理所有对WEB服务器的请求。如果用户请求的页面在代理服务器上有缓冲的话，代理服务器直接将缓冲内容发送给用户。如果没有缓冲则先向WEB服务器发出请求，取回数据，本地缓存后再发送给用户。通过降低向WEB服务器的请求数，从而降低了WEB服务器的负载。

反射代理缓存原理

反向代理一般缓存静态资源，动态资源转发到应用服务器处理。常用的缓存应用服务器有Varnish，Ngnix，Squid。

3.2 SQUID反向代理示例

Squid 反向代理一般只缓存静态资源，动态程序默认不缓存。根据从 WEB 服务器返回的 HTTP 头标记来缓冲静态页面。有四个最重要 HTTP 头标记：

Last-Modified: 告诉反向代理页面什么时间被修改
Expires: 告诉反向代理页面什么时间应该从缓冲区中删除
Cache-Control: 告诉反向代理页面是否应该被缓冲
Pragma: 用来包含实现特定的指令，最常用的是 Pragma:no-cache

image

Squid 反向代理加速网站实例

通过DNS的轮询技术，将客户端的请求分发给其中一台 Squid 反向代理服务器处理；
如果这台 Squid 缓存了用户的请求资源，则将请求的资源直接返回给用户；
否则这台 Squid 将没有缓存的请求根据配置的规则发送给邻居 Squid 和后台的 WEB 服务器处理；
这样既减轻后台 WEB 服务器的负载，又提高整个网站的性能和安全性。

3.3 代理缓存比较

常用的代理缓存有Varnish，Squid，Ngnix，简单比较如下：

（1）varnish和squid是专业的cache服务，nginx需要第三方模块支持；
（2）Varnish采用内存型缓存，避免了频繁在内存、磁盘中交换文件，性能比Squid高；
（3）Varnish由于是内存cache，所以对小文件如css,js,小图片啥的支持很棒，后端的持久化缓存可以采用的是Squid或ATS；
（4）Squid功能全而大，适合于各种静态的文件缓存，一般会在前端挂一个HAProxy或nginx做负载均衡跑多个实例；
（5）Nginx采用第三方模块ncache做的缓冲，性能基本达到varnish，一般作为反向代理使用，可以实现简单的缓存。

4. 分布式缓存

CDN缓存、反向代理缓存，主要解决静态文件，或用户请求资源的缓存，数据源一般为静态文件或动态生成的文件（有缓存头标识）。

分布式缓存，主要指缓存用户经常访问数据的缓存，数据源为数据库。一般起到热点数据访问和减轻数据库压力的作用。

目前分布式缓存设计，在大型网站架构中是必备的架构要素。常用的中间件有Memcached、Redis。

4.1 Memcached缓存

Memcache是一个高性能，分布式内存对象缓存系统，通过在内存里维护一个统一的巨大的hash表，它能够用来存储各种格式的数据，包括图像、视频、文件以及数据库检索的结果等。简单的说就是将数据调用到内存中，然后从内存中读取，从而大大提高读取速度。

Memcache特性：

（1）使用物理内存作为缓存区，可独立运行在服务器上。每个进程最大2G，如果想缓存更多的数据，可以开辟更多的memcache进程（不同端口）或者使用分布式memcache进行缓存，将数据缓存到不同的物理机或者虚拟机上。
（2）使用key-value的方式来存储数据，这是一种单索引的结构化数据组织形式，可使数据项查询时间复杂度为O(1)。
（3）协议简单：基于文本行的协议，直接通过telnet在memcached服务器上可进行存取操作，简单，方便多种缓存参考此协议；
（4）基于libevent高性能通信：Libevent是一套利用C开发的程序库，它将BSD系统的kqueue,Linux系统的epoll等事件处理功能封装成一个接口，与传统的select相比，提高了性能。
（5）内置的内存管理方式：所有数据都保存在内存中，存取数据比硬盘快，当内存满后，通过LRU算法自动删除不使用的缓存，但没有考虑数据的容灾问题，重启服务，所有数据会丢失。
（6）分布式：各个memcached服务器之间互不通信，各自独立存取数据，不共享任何信息。服务器并不具有分布式功能，分布式部署取决于memcache客户端。
（7）缓存策略：Memcached的缓存策略是LRU（最近最少使用）到期失效策略。在memcached内存储数据项时，可以指定它在缓存的失效时间，默认为永久。当memcached服务器用完分配的内时，失效的数据被首先替换，然后也是最近未使用的数据。在LRU中，memcached使用的是一种Lazy Expiration策略，自己不会监控存入的key/vlue对是否过期，而是在获取key值时查看记录的时间戳，检查key/value对空间是否过期，这样可减轻服务器的负载。

4.1.1 Memcached原理

Memcached工作流程

MemCached的工作流程如下：

（1）先检查客户端的请求数据是否在Memcached中，如有，直接把请求数据返回，不再对数据库进行任何操作；
（2）如果请求的数据不在Memcached中，就去查数据库，把从数据库中获取的数据返回给客户端，同时把数据缓存一份到memcached中（Memcached客户端不负责，需要程序实现）；
（3）每次更新数据库的同时更新Memcached中的数据，保证一致性；
（4）当分配给Memcached内存空间用完之后，会使用LRU（Least Recently Used，最近最少使用）策略加上到期失效策略，失效数据首先被替换，然后再替换掉最近未使用的数据。

4.1.2 Memcached集群

Memcached 虽然称为 “ 分布式 ” 缓存服务器，但服务器端并没有 “ 分布式 ” 功能。每个服务器都是完全独立和隔离的服务。 memcached 的分布式，是由客户端程序实现的。

当向Memcached集群存入/取出key value时，memcached客户端程序根据一定的算法计算存入哪台服务器，然后再把key value值存到此服务器中。

因此，存取数据分二步走：

第一步，选择服务器；
第二步，存取数据。

Memcached存取数据

分布式算法

选择服务器算法有两种，一种是根据余数来计算分布，另一种是根据散列算法来计算分布。

余数算法：
- 先求得键的整数散列值，再除以服务器台数，根据余数确定存取服务器。
- 优点：计算简单，高效；
- 缺点：在memcached服务器增加或减少时，几乎所有的缓存都会失效。
散列算法（一致性Hash）：
- 先算出memcached服务器的散列值，并将其分布到0到2的32次方的圆上，然后用同样的方法算出存储数据的键的散列值并映射至圆上，最后从数据映射到的位置开始顺时针查找，将数据保存到查找到的第一个服务器上，如果超过2的32次方，依然找不到服务器，就将数据保存到第一台memcached服务器上。

散列算法

如果添加了一台memcached服务器，只在圆上增加服务器的逆时针方向的第一台服务器上的键会受到影响。

一致性Hash算法：解决了余数算法增加节点命中大幅额度降低的问题，理论上，插入一个实体节点，平均会影响到：虚拟节点数/2 的节点数据的命中。

4.2 Redis缓存

Redis 是一个开源（BSD许可）的，基于内存的，多数据结构存储系统。可以用作数据库、缓存和消息中间件。支持多种类型的数据结构，如字符串（strings），散列（hashes），列表（lists），集合（sets），有序集合（sorted sets）与范围查询， bitmaps， hyperloglogs 和地理空间（geospatial）索引半径查询。

内置了复制（replication），LUA脚本（Lua scripting）， LRU驱动事件（LRU eviction），事务（transactions）和不同级别的磁盘持久化（persistence），并通过 Redis哨兵（Sentinel）和自动分区（Cluster）提供高可用性（high availability）。

4.2.1 Redis常用数据类型

String类型
- 常用命令：set,get,decr,incr,mget
- 应用场景：String是最常用的一种数据类型，与Memcache的key value存储方式类似。
- 实现方式：String在redis内部存储默认就是一个字符串，被redisObject所引用，当遇到incr,decr等操作时会转成数值型进行计算，此时redisObject的encoding字段为int。
Hash类型
- 常用命令：hget,hset,hgetall
- 应用场景：以存储一个用户信息对象数据为例：
  
  image
- 实现方式：Hash类型对应的Value，内部实际就是一个HashMap，实际这里会有2种不同实现。
  - Hash的成员比较少时Redis为了节省内存会采用类似一维数组的方式来紧凑存储，而不会采用真正的HashMap结构，对应的value redisObject的encoding为zipmap；
  - 当成员数量增大时会自动转成真正的HashMap,此时encoding为ht。
List类型
- 常用命令：lpush,rpush,lpop,rpop,lrange
- 应用场景：List类型的应用场景非常多，也是Redis最重要的数据结构之一，比如twitter的关注列表，粉丝列表等都可以用Redis的list结构来实现。
- 实现方式：List的实现为一个双向链表，可以支持反向查找和遍历，方便操作。不过带来了部分额外的内存开销，Redis内部的很多实现，包括发送缓冲队列等也都是用的这个数据结构。
Set类型
- 常用命令：sadd,spop,smembers,sunion
- 应用场景：Set类型对外提供的功能与list类似是一个列表的功能，特殊之处在于set是可以自动排重的，当你需要存储一个列表数据，又不希望出现重复数据时，set 是一个很好的选择，并且set提供了判断某个成员是否在一个set集合内的重要接口，这个也是list所不能提供的。
- 实现方式：Set类型的内部实现是一个value永远为null的HashMap，实际就是通过计算hash的方式来快速排重的，这也是set能提供判断一个成员是否在集合内的原因。
Sorted Set类型
- 常用命令：zadd,zrange,zrem,zcard；
- 使用场景：Sorted Set的使用场景与set类似，区别是set不是自动有序的，而sorted set可以通过用户额外提供一个优先级(score)的参数来为成员排序，并且是插入有序的，即自动排序。当你需要一个有序的并且不重复的集合列表，可以选择sorted set数据结构，比如twitter 的public timeline可以以发表时间作为score来存储，这样获取时就是自动按时间排好序的。
- 实现方式：Sorted set的内部使用HashMap和跳跃表(SkipList)来保证数据的存储和有序，HashMap里放的是成员到score的映射，而跳跃表里存放的是所有的成员，排序依据是HashMap里存的score,使用跳跃表的结构可以获得比较高的查找效率，并且在实现上比较简单。

4.2.2 Redis集群

通过KeepAlived实现的高可用方案

通过KeepAlived实现的高可用方案

- 切换流程：
  1. 当Master挂了后，VIP漂移到Slave；Slave 上keepalived 通知redis 执行：slave of no one, 开始提供业务
  2. 当Master起来后，VIP 地址不变，Master的keepalived通知redis执行slave of slave IP host，开始作为从同步数据
  3. 依次类推
   
- 主从同时宕机情况：
  1. 非计划性，不做考虑，一般也不会存在这种问题
  2. 计划性重启，重启之前通过运维手段SAVE DUMP 主库数据；需要注意顺序：
    1). 关闭其中一台机器上所有redis，是得master全部切到另外一台机器（多实例部署，单机上既有主又有从的情况）；并关闭机器
    2). 依次dump主上redis服务
    3). 关闭主库
    4). 启动主库，并等待数据load完毕
    5). 启动从库 
    6). 删除DUMP文件（避免重启加载慢）

使用Twemproxy实现集群方案

Twemproxy由Twitter公司开源的c版本proxy，同时支持memcached和redis，Twitter用它主要减少前端与缓存服务间网络连接数。

Twemproxy方案的特点：快速、轻量级、减少后端Cache Server连接数、易配置、支持ketama、modula、random、常用hash分片算法等。

Twemproxy集群方案

注：图中使用Keepalived实现高可用主备方案，解决proxy单点问题。

Twemproxy方案的优点：
1. 对于客户端而言，redis集群是透明的，客户端简单，遍于动态扩容
2. Proxy为单点、处理一致性hash时，集群节点可用性检测不存在脑裂问题
3. 高性能，CPU密集型，而redis节点集群多CPU资源冗余，可部署在redis节点集群上，不需要额外设备

4.3 Memcached与Redis的比较

数据结构：Memcache只支持key value存储方式，Redis支持更多的数据类型，比如Key value，hash，list，set，zset；
多线程：Memcache支持多线程，redis支持单线程；CPU利用方面Memcache优于redis；
持久化：Memcache不支持持久化，Redis支持持久化；
内存利用率：memcache高，redis低（采用压缩的情况下比memcache高）；
过期策略：memcache过期后，不删除缓存，会导致下次取数据数据的问题，Redis有专门线程，清除缓存数据。

5. 本地缓存

本地缓存是指应用内部的缓存，标准的分布式系统，一般有多级缓存构成。本地缓存是离应用最近的缓存，一般可以将数据缓存到硬盘或内存。

硬盘缓存

将数据缓存到硬盘到，读取时从硬盘读取。原理是直接读取本机文件，减少了网络传输消耗，比通过网络读取数据库速度更快。可以应用在对速度要求不是很高，但需要大量缓存存储的场景。

内存缓存

直接将数据存储到本机内存中，通过程序直接维护缓存对象，是访问速度最快的方式。

6. 缓存架构示例

缓存架构示例

职责划分：
- CDN：存放HTML,CSS,JS等静态资源；
- 反向代理：动静分离，只缓存用户请求的静态资源；
- 分布式缓存：缓存数据库中的热点数据；
- 本地缓存：缓存应用字典等常用数据；
请求过程：
- 浏览器向客户端发起请求，如果CDN有缓存则直接返回；
- 如果CDN无缓存，则访问反向代理服务器；
- 如果反向代理服务器有缓存则直接返回；
- 如果反向代理服务器无缓存或动态请求，则访问应用服务器；
- 应用服务器访问本地缓存；如果有缓存，则返回代理服务器，并缓存数据；（动态请求不缓存）
- 如果本地缓存无数据，则读取分布式缓存；并返回应用服务器；应用服务器将数据缓存到本地缓存（部分）；
- 如果分布式缓存无数据，则应用程序读取数据库数据，并放入分布式缓存。

参考文献

【转】缓存在分布式系统中的应用
【转】缓存在分布式系统中的应用缓存在分布式系统中的应用摘要缓存是分布式系统中的重要组件，主要解决高并发，大数...
缓存在分布式系统中的应用
缓存在分布式系统中的应用摘要缓存是分布式系统中的重要组件，主要解决高并发，大数据场景下，热点数据访问的性能问题...
分布式系统-思维图
介绍分布式系统中存在关键点：
谈如何处理分布式事务
只要你系统不是一个独立(不和其他进程交互)的单体应用，那就存在分布式事务。什么是分布式事务？在一次调用中，针...
到底什么是分布式系统？
分布式系统背景说分布式系统必须要说集中式系统，集中式系统中整个项目就是一个独立的应用，整个应用也就是整个项目，所...
2018-10-11 Java 分布式应用追踪系统 skywal
# Java 分布式应用追踪系统 skywalking SkyWalking: 针对分布式系统的APM（应用性能监...
分布式相关
盘点 Zookeeper 在分布式架构中的应用 [译] 分布式系统经典论文：Google Bigtable 的设计...
java消息中间件
大型系统的演变必然的发展方向是分布式，而在分布式系统中应用与应用之间互相连接越来越紧密，在应用之间的消息传递就像家...
zookeeper 实现分布式锁
简介 zookeeper为分布式系统调度框架, 用于解决分布式应用中数据管理问题，比如同步锁，分布式应用配置管理等...
分布式中的log
log在当前互联网中的应用: 分布式数据系统中有序的数据变化，数据分布式化消息系统----消息系统是事件驱动架构...