一、Redis
1、什么是Redis?
答:Redis全称:remote dictionary service(远程数据服务器),是一个基于内存的高性能的key-value数据库
2、Redis支持的数据类型?
答:Redis支持五中数据类型:
(1)String
Redis最基本的数据,二进制安全类型(可以包含任何数据),一个 redis 中字符串 value 最多可以是 512M。
应用场景:常规计数:粉丝数、微博数等。
(2)List
list 列表,它是简单的字符串列表,按照插入顺序排序,你可以添加一个元素到列表的头部(左边)或者尾部(右边),它的底层实际上是个链表。
应用场景:最新消息排行、构建队列系统等。
(3)Hash
键值对集合(适合存储对象),是一个 string 类型的 key和 value 的映射表,key 还是key,但是value是一个键值对(key-value)。类比于 Java里面的 Map<String,Map<String,Object>> 集合。
应用场景:存储部分变更的数据,如用户信息等。
(4)Set(集合)
Redis 的 set 是 string 类型的无序集合(一堆不重复值的组合),set中的元素是没有顺序的。
应用场景:共同关注、共同喜好、二度好友等。
(5)zset(sorted set:有序集合)
和set相比,sorted set增加了一个权重参数score,使得集合中的元素能够按score进行有序排列。
应用场景:排行榜应用,取TOP N操作。
(6)HyperLogLog
HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。
应用场景:海量数据的计算。
(7)Pub/Sub
Pub/Sub 从字面上理解就是发布(Publish)与订阅(Subscribe),在Redis中,你可以设定对某一个key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。
应用场景:实时消息系统,比如普通的即时聊天,群聊等功能
扩展类型:Redis Module。
3、Redis的优势
(1)速度快,因为数据在内存中;
(2)支持丰富的数据类型,string、list、set、set、hash等;
(3)丰富的特性,可用于缓存、消息、按key设置过期时间,过期后将会自动删除;
(4)支持事务,操作都是原子性的(对数据的更改要么全部执行,要么全部不执行);
4、Redis相比memcached的优势?
(1)memcached所有值只是简单的字符串,Redis拥有更加丰富的数据类型:list、zset等;
(2)Redis的速度比memcached快很多;
(3)Redis支持持久化数据(数据存在硬盘上);
5、memcached和Redis的区别?
(1)支持的数据类型不一样;
(2)存储方式 Memecache把数据全部存在内存之中,断电后会挂掉,数据不能超过内存大小。 Redis有部份存在硬盘上,这样能保证数据的持久性;
(3)它们之间底层实现方式、以及与客户端之间通信的应用协议不一样。 Redis直接自己构建了VM 机制(一般系统调用系统函数,会浪费一定的时间去请求)。
6、为什么Redis是单线程的?
答:Redis是单线程的,其利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销。
7、Redis的持久化机制是什么?各自的优缺点?
Redis提供了两种持久化机制RDB和AOF机制
(1)RDB(Redis DataBase)持久化方式:
用数据集快照的方式(半持久化模式)记录Redis数据库的所有键值对,,在某个时间点将数据写入一个临时文件,持久化结束后,用这个临时文件替换上次持久化的文件,达到数据恢复。
优点:
*只有一个文件dump.rdb,方便持久化;
*容灾性好,一个文件可以保存到安全的磁盘;
*性能最大化,fork子进程来完成写操作,让主进程继续处理命令,所以是IO最大化;
*相对于数据集大时,比AOF的启动效率更高;
缺陷:
*数据安全性低:RDB是间隔一段时间进行持久化,如果持久化之间redis发生故障,会发生数据丢失。
所以这种方式更适合数据要求不严谨的时候
(2)AOF(Append-Only file)持久化方式:
是指所有的命令行记录以redis命令请求协议的格式(完全持久化存储)保存为aof文件。
优点:
*数据安全,aof持久化可以配置appendfsync属性,有always,每进行一次命令操作就记录到aof文件中一次;
*通过append模式写文件,即使中途服务器宕机,可以通过redis-check-aof工具解决数据一致性问题;
*AOF机制的rewrite模式。(AOF文件没被rewrite之前(文件过大时会对命令进行合并重写),可以删除其中的某些命令(比如误操作的flushall))
缺陷:
*AOF文件比RDB文件大,且恢复速度慢;
*数据集大的时候,比rdb启动效率低;
8、redis过期键的删除策略?
(1)定时删除:在设置键的过期时间的同时,创建一个定时器(timer). 让定时器在键的过期时间来临时,立即执行对键的删除操作。
(2)惰性删除:放任键过期不管,但是每次从键空间中获取键时,都检查取得的键是否过期,如果过期的话,就删除该键;如果没有过期,就返回该键。
(3)定期删除:每隔一段时间程序就对数据库进行一次检查,删除里面的过期键。至于要删除多少过期键,以及要检查多少个数据库,则由算法决定。
9、Redis的回收策略(淘汰策略)?
(1)volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰;
(2)volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰;
(3)volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰;
(4)allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰;
(5)allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰;
(6)no-enviction永不回收的策略;
注:volatile和allkeys规定了是对已设置过期时间的数据集淘汰数据还是从全部数据集淘汰数据。
使用策略规则:
1、如果数据呈现幂律分布,也就是一部分数据访问频率高,一部分数据访问频率低,则使用allkeys-lru
2、如果数据呈现平等分布,也就是所有的数据访问频率都相同,则使用allkeys-random
10、Redis常见性能问题和解决方案
(1) 如果数据比较重要,某个Slave开启AOF备份数据,策略设置为每秒同步一次;
(2)尽量避免在压力很大的主库上增加从库;
(3)为了主从复制的速度和连接的稳定性,Master和Slave最好在同一个局域网内;
(4)Master最好不要写内存快照,如果Master写内存快照,save命令调度rdbSave函数,会阻塞主线程的工作,当快照比较大时对性能影响是非常大的,会间断性暂停服务;
(5)主从复制不要用图状结构,用单向链表结构更为稳定,即:Master <- Slave1 <- Slave2 <- Slave3…这样的结构方便解决单点故障问题,实现Slave对Master的替换。如果Master挂了,可以立刻启用Slave1做Master,其他不变;
11、为什么edis需要把所有数据放到内存中?
(1)Redis为了达到最快的读写速度将数据都读到内存中,并通过异步的方式将数据写入磁盘。所以redis具有快速和数据持久化的特征。
(2)如果不将数据放在内存中,磁盘I/O速度会严重影响redis的性能。在内存越来越便宜的今天,redis将会越来越受欢迎;如果设置了最大使用的内存,则数据已有记录数达到内存限值后不能继续插入新值。
12、Redis的同步机制了解么?
Redis可以使用主从同步,从从同步。第一次同步时,主节点做一次bgsave,并同时将后续修改操作记录到内存buffer,待完成后将rdb文件全量同步到复制节点,复制节点接受完成后将rdb镜像加载到内存。加载完成后,再通知主节点将期间修改的操作记录同步到复制节点进行重放就完成了同步过程。
13、Pipeline(管道)有什么好处,为什么要用pipeline?
可以将多次IO往返的时间缩减为一次,前提是pipeline执行的指令之间没有因果相关性。使用redis-benchmark进行压测的时候可以发现影响redis的QPS峰值的一个重要因素是pipeline批次指令的数目。
注:客户端向服务端发送一个查询请求,并监听Socket返回,通常是以阻塞模式,等待服务端响;管道技术可以在服务端未响应时,客户端可以继续向服务端发送请求,并最终一次性读取所有服务端的响应。
14、是否使用过Redis集群,集群的原理是什么?
(1)Redis Sentinal(哨兵)着眼于高可用,在master宕机时会自动将slave提升为master,继续提供服务。
(2)、Redis Cluster(簇、丛)着眼于扩展性,在单个redis内存不足时,使用Cluster进行分片存储。
15、Redis集群方案什么情况下会导致整个集群不可用?
答:有A,B,C三个节点的集群,在没有复制模型的情况下,如果节点B失败了,那么整个集群就会以为缺少5501-11000这个范围的槽而不可用。
16、Redis支持的Java客户端都有哪些?官方推荐用哪个?
答:Redisson、Jedis、lettuce等等,官方推荐使用Redisson。
17、Jedis与Redisson对比有什么优缺点?
(1)Jedis是Redis的Java实现的客户端,其API提供了比较全面的Redis命令的支持;
(2)Redisson实现了分布式和可扩展的Java数据结构,和Jedis相比,功能较为简单,不支持字符串操作,不支持排序、事务、管道、分区等Redis特性。Redisson的宗旨是促进使用者对Redis的关注分离,从而让使用者能够将精力更集中地放在处理业务逻辑上。
18、Redis如何设置密码及验证密码?
设置密码:config set requirepass 123456
授权密码:auth 123456
19、说说Redis哈希槽的概念?
Redis集群没有使用一致性hash,而是引入了哈希槽的概念,Redis集群有16384个哈希槽,每个key通过CRC16校验后对16384取模来决定放置哪个槽,集群的每个节点负责一部分hash槽。
20、Redis集群的主从复制模型是怎样的?
答:为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有N-1个复制品.
21、Redis集群会有写操作丢失吗?为什么?
答:Redis并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢失写操作。
22、Redis集群之间是如何复制的?
答:异步复制
23、Redis集群最大节点个数是多少?
答:16384个。
24、Redis集群如何选择数据库?
答:Redis集群目前无法做数据库选择,默认在0数据库。
25、怎么测试Redis的连通性?
答:使用ping命令。
26、怎么理解Redis事务?
(1)事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。
(2)事务是一个原子操作:事务中的命令要么全部被执行,要么全部都不执行。
27、Redis事务相关的命令有哪几个?
MULTI:标记一个事务块的开始;
EXEC:执行所有事务块内的命令;
DISCARD:取消事务,放弃执行事务块内的所有命令;
WATCH:监视一个(或多个) key ,如果在事务执行之前这个(或这些) key 被其他命令所改动,那么事务将被打断;
UNWATCH:取消 WATCH 命令对所有 key 的监视;
28、Redis key的过期时间和永久有效分别怎么设置?
EXPIRE:
PERSIST:
29、Redis如何做内存优化?
答:尽可能使用散列表(hashes),散列表(是说散列表里面存储的数少)使用的内存非常小,所以你应该尽可能的将你的数据模型抽象到一个散列表里面。
比如你的web系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的key,而是应该把这个用户的所有信息存储到一张散列表里面。
30、Redis回收进程如何工作的?
答:一个客户端运行了新的命令,添加了新的数据。Redi检查内存使用情况,如果大于maxmemory的限制, 则根据设定好的策略进行回收。一个新的命令被执行,等等。所以我们不断地穿越内存限制的边界,通过不断达到边界然后不断地回收回到边界以下。如果一个命令的结果导致大量内存被使用(例如很大的集合的交集保存到一个新的键),不用多久内存限制就会被这个内存使用量超越。
31、redis的分区类型
(1)范围分区
最简单的分区方式是按范围分区,就是映射一定范围的对象到特定的Redis实例。不足就是要有一个区间范围到实例的映射表。这个表要被管理,同时还需要各 种对象的映射表。
(2)哈希分区
用一个hash函数将key转换为一个数字,比如使用crc32 hash函数。对key执行crc32会输出类似93024922的整数。对这个整数取模(分区数N),就可以将这个整数映射到N个Redis实例中的一个。
32、都有哪些办法可以降低Redis的内存使用情况呢?
答:如果你使用的是32位的Redis实例,可以好好利用Hash,list,sorted set,set等集合类型数据,因为通常情况下很多小的Key-Value可以用更紧凑的方式存放到一起。
33、Redis的内存用完了会发生什么?
答:如果达到设置的上限,Redis的写命令会返回错误信息(但是读命令还可以正常返回。)或者你可以将Redis当缓存来使用配置淘汰机制,当Redis达到内存上限时会冲刷掉旧的内容。
34、一个Redis实例最多能存放多少的keys?List、Set、Sorted Set他们最多能存放多少元素?
答:理论上Redis可以处理多达232的keys,任何list、set、和sorted set都可以放232个元素。换句话说,Redis的存储极限是系统中的可用内存值。
35、MySQL里有2000w数据,redis中只存20w的数据,如何保证redis中的数据都是热点数据?
答:Redis内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略。
Redis提供6种数据淘汰策略:
*voltile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰;
*volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰;
*volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰;
*allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰;
*allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰;
*no-enviction(驱逐):禁止驱逐数据;
36、Redis最适合的场景?
(1)会话缓存(Session Cache)
最常用的一种使用Redis的情景是会话缓存(session cache)。用Redis缓存会话比其他存储(如Memcached)的优势在于:Redis提供持久化。
(2)全页缓存(FPC)
除基本的会话token之外,Redis还提供很简便的FPC平台。回到一致性问题,即使重启了Redis实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极大改进。
(3)队列
Reids在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得Redis能作为一个很好的消息队列平台来使用。
(4)排行榜/计数器
Redis在内存中对数字进行递增或递减的操作实现的非常好。集合(Set)和有序集合(Sorted Set)也使得我们在执行这些操作的时候变的非常简单,Redis只是正好提供了这两种数据结构。
(5)发布/订阅
我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至用Redis的发布/订阅功能来建立聊天系统!
37、假如Redis里面有1亿个key,其中有10w个key是以某个固定的已知的前缀开头的,如果将它们全部找出来?
(1)使用keys指令可以扫出指定模式的key列表。
对方接着追问:如果这个redis正在给线上的业务提供服务,那使用keys指令会有什么问题?
(2)redis的单线程的。keys指令会导致线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候可以使用scan指令,scan指令可以无阻塞的提取出指定模式的key列表,但是会有一定的重复概率,在客户端做一次去重就可以了,但是整体所花费的时间会比直接用keys指令长。
38、如果有大量的key需要设置同一时间过期,一般需要注意什么?
如果大量的key过期时间设置的过于集中,到过期的那个时间点,redis可能会出现短暂的卡顿现象。一般需要在时间上加一个随机值,使得过期时间分散一些。
39、使用过Redis做异步队列么,你是怎么用的?
(1)一般使用list结构作为队列,rpush生产消息,lpop消费消息。当lpop没有消息的时候,要适当sleep一会再重试。
如果对方追问可不可以不用sleep呢?
(2)list还有个指令叫blpop,在没有消息的时候,它会阻塞住直到消息到来。如果对方追问能不能生产一次消费多次呢?使用pub/sub主题订阅者模式,可以实现1:N的消息队列。
40、pub/sub有什么缺点?
在消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列如RabbitMQ等。
41、redis如何实现延时队列?
使用sortedset,拿时间戳作为score,消息内容作为key调用zadd来生产消息,消费者用zrangebyscore指令获取N秒之前的数据轮询进行处理。
42、使用过Redis分布式锁么,它是什么回事?
(1)先拿setnx来争抢锁,抢到之后,再用expire给锁加一个过期时间防止锁忘记了释放。
如果在setnx之后执行expire之前进程意外crash或者要重启维护了,那会怎么样?
(2)这个锁就永远得不到释放了;我记得set指令有非常复杂的参数,这个应该是可以同时把setnx和expire合成一条指令来用的!
43、如何解决Redis缓存雪崩问题?
什么是缓存雪崩:
缓存失效,数据库请求全部跑到数据库中,而不是查询的Redis缓存;
Redis缓存数据设置的过期时间是相同的,并且Redis恰好将这部分数据全部删除了,
导致在这段时间内,这些缓存同时失效,全部请求到数据库中;
这就是缓存雪崩:
1、Redis挂掉了,请求全部走数据库;
2、对缓存数据设置了相同的过期时间,导致某段时间内缓存全部失效,请求全部走数据库;
如何解决缓存雪崩:
1、针对Redis挂掉造成的雪崩:
(1)事发前:实现Redis的高可用(主从架构或者Redis cluster-集群),尽量避免这种情况;
(2)事发中:设置本地缓存ehcache+限流hystrix,尽量避免数据库被干掉;
(2)事发后:Redis的持久化,重启后自动从磁盘上加载数据,快速恢复缓存数据;
2、在缓存的时候给过期时间加上一个随机值,这样就会大幅度减少缓存在同一时间过期;
44、如何解决缓存穿透?
什么是缓存穿透:
比如我们有一张表,id都是由1开始的;但是现在有恶意的请求每次请求的id都是负数,
这样就导致我们的缓存就没用了,每次请求都到数据库去了;
指查询一个一定不存在的数据,由于缓存不命中,
并且处于容错的考虑,如果从数据库查询不到数据则不写入缓存,
这样导致这个不存在的数据每次的请求都到数据库去查询(迟早GG),
失去了缓存的意义,这就是缓存穿透;
如何解决缓存穿透:
1、当我们从数据库找不到数据时,我们也将这个空对象设置到缓存中去(较短的过期的时间),下次请求的时候,直接从缓存取;
2、由于请求参数的不合法,我们可以设置一个布隆过滤器或者压缩过滤器提前拦截,不合法的请求不允许请求到数据库;
45、如何保证缓存与数据库双写时一致的问题?
一般的读取数据操作:
如果数据在缓存中,直切去缓存中的数据,否则取数据库中的数据,
将数据库查询出来的数据写到缓存中,最后将数据返回给请求;
什么是缓存与数据库双写一致问题?
仅仅查询时是没问题的,但是更新的时候,就有可能导致数据库和缓存数据不一致;
理论上只要我们设置了键的过期时间,我们就能保证缓存和数据库的数据始终是一致的,
因为缓存数据过期就会被删除,重新从数据库读取写入缓存;
对于更新操作:
要么先操作数据库再操作缓存;要写先操作缓存再操作数据库;
所以,若果原子性被破坏了的话,就会出现要么数据库成功,缓存失败;
要么缓存成功,数据库失败;
综上:对于更新
1、操作缓存:直接删除
(1)高并发情况下,无论先更新哪个,都容易造成数据库和缓存不一致问题;
(2)每次更新数据库都要更新缓存,倒不如直接删掉,
等再次读取的时候,缓存没有再从数据库获取写入缓存(懒加载);
2、将删除缓存、修改数据库、读取缓存等操作积压到队列里面,实现串行化。
3、高并发时:先更新数据库,后删除缓存;
原子性被破坏时:先删除缓存,后更新数据库;
网友评论