来自腾讯架构师对，Redis的实践及思考

作者: 勤奋的码农 | 来源:发表于2019-08-23 21:16 被阅读3次

来自腾讯架构师对，Redis的实践及思考
如何做好游戏内实时语音体验
Redis集群配置之一主多从
牢记注意力才是自己所拥有的最宝贵资源
内存优化
监控最佳实践--redis及业务接口
Elasticsearch最佳实践之分片使用优化
redis有序集合对象
redis集合对象
redis哈希对象

来自腾讯架构师对，Redis的实践及思考

导语：当面临存储选型时是选择关系型还是非关系型数据库？如果选择了非关系型的redis，redis常用数据类型占用内存大小如何估算的？redis的性能瓶颈又在哪里？

背景

前段时间接手了一个业务，响应时间达到10s左右。阅读源码后发现，每一次请求都是查询多个分表数据（task1,task2….），然后再join其他表(course,teacher..)，时间全部花在了大量磁盘I/O上。脑袋一拍，重构，上redis！

为什么选择redis

拍脑袋做技术方案肯定是不行的，得用数据和逻辑说服别人才可以。

时延

时延=后端发起请求db（用户态拷贝请求到内核态）+ 网络时延 + 数据库寻址和读取

如果想要降低时延，只能减少请求数（合并多个后端请求）和减少数据库寻址和读取得时间。从降低时延的角度，基于单线程和内存的redis，每秒10万次得读写性能肯定远远胜过磁盘读写性能。

数据规模

以redis一组K-V为例（”hello” -> “world”），一个简单的set命令最终会产生4个消耗内存的结构。

来自腾讯架构师对，Redis的实践及思考

关于Redis数据存储的细节，又要涉及到内存分配器（如jemalloc），简单说就是存储170字节，其实内存分配器会分配192字节存储。Java架构圈子

来自腾讯架构师对，Redis的实践及思考

那么总的花费就是

一个dictEntry，24字节，jemalloc会分配32字节的内存块
一个redisObject，16字节，jemalloc会分配16字节的内存块
一个key，5字节，所以SDS(key)需要5+9=14个字节，jemalloc会分配16字节的内存块
一个value，5字节，所以SDS(value)需要5+9=14个字节，jemalloc会分配16字节的内存块

综上，一个dictEntry需要32+16+16+16=80个字节。

上面这个算法只是举个例子，想要更深入计算出redis所有数据结构的内存大小，可以参考这篇文章。

笔者使用的是哈希结构，这个业务需求大概一年的数据量是200MB，从使用redis成本上考虑没有问题。

需求特点

笔者这个需求背景读多写少，冷数据占比比较大，但数据结构又很复杂（涉及多个维度数据总和），因此只要启动定时任务离线增量写入redis，请求到达时直接读取redis中的数据，无疑可以减少响应时间。

来自腾讯架构师对，Redis的实践及思考

[ 最终方案 ]

redis瓶颈和优化

HGETALL

最终存储到redis中的数据结构如下图。

来自腾讯架构师对，Redis的实践及思考

采用同步的方式对三个月（90天）进行HGETALL操作，每一天花费30ms，90次就是2700ms！redis操作读取应该是ns级别的，怎么会这么慢？利用多核cpu计算会不会更快？

来自腾讯架构师对，Redis的实践及思考

常识告诉我，redis指令执行速度 >> 网络通信(内网) > read/write等系统调用。因此这里其实是I/O密集型场景，就算利用多核cpu，也解决不到根本的问题，最终影响redis性能，****其实是网卡收发数据和**用户态内核态数据拷贝******。

pipeline

这个需求qps很小，所以网卡也不是瓶颈了，想要把需求优化到1s以内，减少I/O的次数是关键。换句话说，充分利用带宽，增大系统吞吐量。

于是我把代码改了一版，原来是90次I/O，现在通过redis pipeline操作，一次请求半个月，那么3个月就是6次I/O。很开心，时间一下子少了1000ms。

来自腾讯架构师对，Redis的实践及思考

pipeline携带的命令数

代码写到这里，我不经反问自己，为什么一次pipeline携带15个HGETALL命令，不是30个，不是40个？换句话说，一次pipeline携带多少个HGETALL命令才会发起一次I/O？

我使用是golang的redisgo 的客户端，翻阅源码发现，redisgo执行pipeline逻辑是把命令和参数写到golang原生的bufio中，如果超过bufio默认最大值（4096字节），就发起一次I/O，flush到内核态。

来自腾讯架构师对，Redis的实践及思考

redisgo编码pipeline规则如下图，*表示后面参数加命令的个数，$表示后面的字符长度，一条HGEALL命令实际占45字节。

那其实90天数据，一次I/O就可以搞定了（90 * 45 < 4096字节）!

来自腾讯架构师对，Redis的实践及思考

果然，又快了1000ms，耗费时间达到了1秒以内

来自腾讯架构师对，Redis的实践及思考

对吞吐量和qps的取舍

笔者需求任务算是完成了，可是再进一步思考，redis的pipeline一次性带上多少HGETALL操作的key才是合理的呢？换句话说，服务器吞吐量大了，可能就会导致qps急剧下降（网卡大量收发数据和redis内部协议解析，redis命令排队堆积，从而导致的缓慢），而想要qps高，服务器吞吐量可能就要降下来，无法很好的利用带宽。

对两者之间的取舍，同样是不能拍脑袋决定的，用压测数据说话！

简单写了一个压测程序，通过比较请求量和qps的关系，来看一下吞吐量和qps的变化，从而选择一个适合业务需求的值。

来自腾讯架构师对，Redis的实践及思考

windows上单机版redis结果如下：

来自腾讯架构师对，Redis的实践及思考

扩展（分布式方案下pipeline操作）

需求最终是完成了，可是转念一想，现在都是集群版的redis，pipeline批量请求的key可能分布在不同的机器上，但pipeline请求最终可能只被一台redis server处理，那不就是会读取数据失败吗？于是，笔者查找几个通用的redis 分布式方案，看看他们是如何处理这pipeline问题的。

redis cluster

redis cluster 是官方给出的分布式方案。 Redis Cluster在设计中没有使用一致性哈希，而是使用数据分片（Sharding）引入哈希槽（hash slot）来实现。一个 Redis Cluster包含16384（0~16383）个哈希槽，存储在Redis Cluster中的所有键都会被映射到这些slot中，集群中的每个键都属于这16384个哈希槽中的一个，集群使用公式slot=CRC16 key/16384来计算key属于哪个槽。比如redis cluster有5个节点，每个节点就负责一部分哈希槽，如果参数的多个key在不同的slot，在不同的主机上，那么必然会出错。

因此redis cluster分布式方案是不支持pipeline操作，如果想要做，只有客户端缓存slot和redis节点的关系，在批量请求时，就通过key算出不同的slot以及redis节点，并行的进行pipeline。

github.com/go-redis就是这样做的，有兴趣可以阅读下源码。

来自腾讯架构师对，Redis的实践及思考

codis

市面上还流行着一种在客户端和服务端之间增设代理的方案，比如codis就是这样。对于上层应用来说，连接 Codis-Proxy 和直接连接原生的 Redis-Server 没有的区别，也就是说codis-proxy会帮你做上面并行分槽请求redis server，然后合并结果在一起的操作，对于使用者来说无感知。

总结

在做需求的过程中，发现了很多东西不能拍脑袋决定，而是前期做技术方案的时候，想清楚，调研好，用数据和逻辑去说服自己。

粉丝福利

来自腾讯架构师对，Redis的实践及思考

来自腾讯架构师对，Redis的实践及思考
如果对java微服务、分布式、高并发、高可用、大型互联网架构技术、面试经验交流。
可以加我Java架构圈子: 领取资料，里面每天更新资料，免费领取。

网友评论

Java

本文标题：来自腾讯架构师对，Redis的实践及思考

本文链接：https://www.haomeiwen.com/subject/wrdxectx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

来自腾讯架构师对，Redis的实践及思考

背景

为什么选择redis

redis瓶颈和优化

扩展（分布式方案下pipeline操作）

总结

粉丝福利

相关文章

来自腾讯架构师对，Redis的实践及思考

如何做好游戏内实时语音体验

Redis集群配置之一主多从

牢记注意力才是自己所拥有的最宝贵资源

内存优化

监控最佳实践--redis及业务接口

Elasticsearch最佳实践之分片使用优化

redis有序集合对象

redis集合对象

redis哈希对象

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Java

来自腾讯架构师对，Redis的实践及思考

背景

为什么选择redis

redis瓶颈和优化

扩展 （分布式方案下pipeline操作）

总结

粉丝福利

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

扩展（分布式方案下pipeline操作）