美文网首页
【转载】点赞功能,用mysql还是redis?

【转载】点赞功能,用mysql还是redis?

作者: 毛福林 | 来源:发表于2020-07-22 22:46 被阅读0次

    点赞功能是目前app/web开发中基本的功能

    今天我们就来聊聊 点赞、评论、收藏等这些场景的db数据库设计问题

    1. 场景的需求:

    a. 显示点赞数量
    b.判断用户是否点过赞,用于去重,必须的判断
    c. 显示个人点赞列表,一般在用户中心'
    d.显示文章点赞列表

    我们先看一下头条和微博的例子
    今日头条新闻点赞的例子:


    今日头条点赞的例子

    微博点赞的例子:


    微博点赞的例子

    这两家APP用户数量都在亿级以上,在点赞功能上后端设计必然会很复杂,今天主要聊一下大众如何实现点赞功能

    2 通用方案

    2.1 使用mysql的方案

    mysql方案, 随着nosql的流行,大数据的持续热点,但是mysql仍然不可替代,对于大多数的中小项目,低于千万级的数据量,采用mysql分表+cache,是完全可以胜任的,而且稳定性是其他方案无可比拟的:
    
     # 创建文章表
    create table post {
            post_id int(11) NOT NULL AUTO_INCREMENT,
            ......
            star_num int(11) COMMENT '点赞数量'
    }
    
    # 创建用户表
    create table user {
            user_id int(11) NOT NULL AUTO_INCREMENT,
            ......
            star_num int(11) COMMENT '点赞数量'
    }
    
    # 创建点赞记录表
    create table star {
            id int(11) NOT NULL AUTO_INCREMENT,
            post_id,
            user_id,
            ......
    }
    

    经常使用到的查询如下:

    查询用户点赞过的文章 select post_id from star where user_id=?
    
    查询文章的点赞用户 select user_id from star where post_id=?
    

    点赞数量可以通过定时异步统计更新到post和user 表中。数据量不大的时候,这种设计基本可以满足需求了。

    作为一个有上进心的程序员,我们不能仅实现基本功能,还要应对高并发以及大量数据的请求那么这套方案有什么缺点呢?

    缺点:

    数据量大时,一张表在查询时压力巨大,需要分表,而不论用post_id还是user_id来hash分表都与我们的需求有冲突,唯一的办法就是做两个表冗余。这增加了存储空间和维护工作量,还可能有一致性问题。

    2.2 redis 方案

    当数据量达到上亿的量,使用cache是必经的阶段,由于点赞这种动作很随意,很多人看到大拇指就想点,所以数据量增长很快,数据规模上来后,对mysql读写都有很大的压力,这时就要考虑memcache、redis进行存储或cache。

    为什么一般都选择redis, redis作为流行的nosql,有着丰富的数据类型,可以适应多个场景的需求。

    采用redis有两种用途,一种是storage,一种是纯cache,需要和mysql一起使用。纯cache就是把数据从mysql先写入redis,用户先读cache,如果数据不存在的话,再拉取MySQL,同时cache做同步。

    缓存示意图

    多数场景二者是同时使用的,并不冲突。
    下面说下redis作为storage的方案:

    场景a :显示点赞数量

    在点赞的地方,只是显示一个点赞数量,能区分用户是否点赞过,一般用户不关心这个列表,这个场景只要一个数字就可以了,当数量比较大时,一般显示为"7k" ,"10W" 这样。

    以文章id为key

    //以文章id=888为例 
    127.0.0.1:6379[2]> set star:tid:888 898 //设置点赞数量 
    OK 
    127.0.0.1:6379[2]> incr star:tid:888 //实现数量自增 (integer) 
    899
    

    场景b:点赞去重,避免重复点赞

    要实现这个需求,必须有文章点赞的uid列表,以uid为key

    场景c:一般在用户中心,可以看到
    这个需求可以使用场景b的数据来实现

    查看用户点赞列表

    场景d:文章的点赞列表
    类似场景b,以文章id为key

    //以文章id=888为例 
    127.0.0.1:6379[2]> sadd star:list:tid:888 123 456 789  //点赞uid列表 (integer) 
    3 
    127.0.0.1:6379[2]> sismember star:list:tid:888 456  //判断是否点赞 (integer) 
    1
    

    点赞的地方,如果点赞过显示红色,没有则显示黑白色,

    今日头条是没有地方可以看到点赞列表的,而微博点进去,详情页可以看到点赞列表,但是只会显示最近的几十条,没有分页显示。

    如下图,我选了一条热点,拥有众多粉丝的“猪猪”


    某微博用户点赞列表

    通常情况下,某条微博的点赞列表仅显示几十条,可能有人觉得,点赞列表没人关心,存储又会浪费大量资源,不如不存!但是,这个数据是必须要有的。两点:

    • 去重。点赞数可以不精确,但去重必须是精确的
    • 数据。用户行为的一点一滴都需要记录,对于后续的用户行为分析和数据挖掘都是有意义的。

    上面使用string存储的用户点赞数量,除了string,还可以用hash来存储,对文章id分块,每100个存到一个hash,分别存入hash table,每个文章id为hash的一个key,value存储点赞的用户id,如果点赞用户很多,避免id过多产生性能问题,可以单列出来,用sorted set结构保存,热点的毕竟是少数。

    使用hash的方案的优缺点
    优点: 使用了更少的全局key ,节省了内存空间;
    缺点: 增加系统复杂性,如何根据文章id路由到对应的hash?查找一个用户id是在hash还是set?存在不确定性

    3. 数据一致性

    redis作为storage使用时,一定要做好数据的持久化,必须开启 rdb 和 aof,这会导致业务只能使用一半的机器内存,所以要做好容量的监控,及时扩容。

    另外只要有数据copy,就会有一致性问题,这就是另外一个很重要的话题了。以后有时间再细聊吧!

    4 参考链接

    一起web编程: 点赞功能,用mysql还是redis?

    相关文章

      网友评论

          本文标题:【转载】点赞功能,用mysql还是redis?

          本文链接:https://www.haomeiwen.com/subject/vldxlktx.html