一、背景
- 线上redis架构,总共大概250套主从
- 架构以1主1从为主,少部分1主多从
- 大部分主库抗业务,从库做持久化及定时备份
- 少部分主从(大概30多套)通过应用配置读写域名实现读写分离
二、关于目前Redis读写分离方案的一些看法
- 目前线上的读写分离是否有必要(单实例扛不住的原因在哪里)
- 从库做持久化对请求的影响(需要额外挂从库做持久化)
-
如果真的需要做读写分离,应该怎么做
image.png
三、业界成熟Redis高可用架构介绍
1. sentinel
sentinel架构sentinel 检测原理
- 每隔10s,每个sentinel会向主节点和从节点发送info replication命令获取最新的主从拓扑结构
- 每隔2s,每个sentinel节点向redis节点的__ sentinel __:hello频道发送该sentinel节点对主节点判断及当前sentinel信息,其他sentinel节点也会订阅该频道,了解各个sentinel节点以及他们对主节点的判断
- 每隔1s,每个sentinel节点会向所有redis节点以及其他sentinel节点发送ping命令做一次心跳检测,确认各个节点是否可达
sentinel 切换原理
主观下线:sentinel节点通过每2秒的ping心跳检测,超过down-after-milliseconds主观判断redis节点下线
客观下线:sentinel节点判断主观下线后,通过发送sentinel ismaster-down-by-addr到其他sentinel节点询问对主节点的判断,当超过quonum个数,则判断该redis主节点客观下线
故障转移过程
- sentinel节点判断redis节点主观下线
- sentinel节点判断redis节点客观下线
- sentinel节点发起选举,一旦节点获得max(quorum,num(sentinels)/2+1)的票数,即成为leader(选举过程非常快,基本上谁先完成客观下线,谁就是leader)
- 由sentinel leader节点进行redis failover
redis failover 包括提升redis从库为主库,将其他从库挂载到新主库等操作
特点
- 一套sentinel集群至少3个节点,sentinel节点通过raft算法选举,节点个数为奇数
- 1套sentinel集群可以监控多套redis主从
- 建议部署方式:相同业务使用同一套sentinel集群进行监控。
- Client 端需要修改连接方式,配置由原来直连域名,修改为配置sentinel集群信息+redis主节点标识名
- sentinel只对主节点进行failover,从节点故障只做主观下线判断,没有后续的处理操作
- sentinel不是中间件,应用只会在初次连接的时候请求sentinel返回一个redis主节点的连接池,实际上是直连redis主节点的。(持续订阅sentinel,当redis发生故障切换,会重新返回一个主节点连接池)
痛点
- 客户端原生JedisSentinelPool只拿到redis主节点的连接池,无法支持读写分离
- 应用端需要修改连接配置(这个其实不算很痛,可以逐步推进)
2. Redis-Cluster
redis-cluster特点
- 无中心分布式架构,解决高可用,扩展性问题
- 集群中数据节点个数为奇数。每个节点代表一套redis主从(主库读写,从库备用)
- 通过虚拟槽hash到各节点(总共16384个slots),实现数据分片
- 无代理层,client端配置集群所有节点信息。连接集群中任一节点皆可访问整个集群数据(自动路由)
-
据说存在不少坑,需要先部署测试一段时间再上线
四、适合荔枝的Redis高可用架构
从荔枝整体redis环境看,redis多为单主从,实例数据大部分在10G以内,不同业务之间实例相互独立。sentinel是最合适的高可用方式。主要解决读写分离和域名切换的问题,这里给出2种方案
1. sentinel+consul
sentinel 负责故障主从切换,consul 主要提供DNS,健康检测,服务发现,域名切换
consul简介
整体架构
consul+sentinel redis高可用
说明
- 客户端需要改成特定后缀的域名格式(比如.consul)
- 每台缓存机器部署一个consul client,用于该机器所有redis实例的服务发现,健康检测
- consul可以实现从节点的故障转移
2. sentinel(取消读写分离) + redis-cluster(个别大数据量高并发实例)
整体架构
说明
- 这套架构可以满足目前90%的redis高可用需求,架构复杂度低,建议优先考虑
- python redis库支持读写分离,可以通过master标识名拿到从库连接。jedis待测试
>>> from redis.sentinel import Sentinel
>>> sentinel = Sentinel([('localhost', 26379)], socket_timeout=0.1)
>>> master = sentinel.master_for('mymaster', socket_timeout=0.1)
>>> master.set('foo', 'bar')
>>> slave = sentinel.slave_for('mymaster', socket_timeout=0.1)
>>> slave.get('foo')
- 对于现有的小部分做了读写分离的实例,先评估是否可以取消掉读写分离,接入sentinel
- 对于大数据量,高并发的实例,考虑接入Redis-Cluster
网友评论