美文网首页Project - IM
IM - 消息四大特性与实现方案

IM - 消息四大特性与实现方案

作者: 红薯爱帅 | 来源:发表于2021-08-31 20:07 被阅读0次

    1. 概述

    本文介绍即时通讯软件中,消息的几个特性如何保证

    • 实时性
    • 安全性
    • 有序性
    • 可靠性(不重不漏)

    2. 实时性

    消息的传输过程,分为三个阶段:

    • 消息上行
    • 消息处理
    • 消息下行

    其中,消息上下行,通过C/S全双工通信保证,并且有HeartBeat保证通道的可用性

    消息处理由im-server实现,主要包含消息鉴权、消息审计、消息拆包,须保证稳定高效,可通过独立服务实现,保证其可扩展性

    message-transfer.png

    消息鉴权

    单聊情况

    • 鉴权关系:sender与receiver是否好友(或同事)

    群聊情况

    • 鉴权关系:sender是否是群组成员

    消息审计

    • 审计内容:消息内容是否合法,不包含反党叛国、黄赌毒等语义
    • 审计设备:移动设备不能接收文件

    消息拆包

    对于群组消息,需要拆包,1个发送包生成N个接收包,N是当前群组成员数

    如果当前群组超过500人,例如10000人,可以考虑采用消息广播机制,提高消息下行效率。

    具体做法是,发送到MQ前,不拆分成10000个Package,而是X个Package,X等于SessionManager实例数。每个SessionManager实例收到Package后,自行拆包并发送到对应的TCP通道,Client即可实时接收到消息。

    3. 安全性

    • 传输过程中,采用https和wss,或者gRPC证书,保证消息安全
    • 登录安全,采用JWT登录认证机制,防止身份信息被盗用

    另外,发送时加密可进一步加强消息的安全性,但是不利于项目前期开发与调试,故优先级低

    4. 有序性

    4.1. 场景假设

    场景1

    在user1和user2的单聊会话中,user1发送3条消息,分别是aa、bb、cc。

    其中aa和cc发送成功,bb由于网络或设备问题,在client自动重试3分钟之后,最终发送失败,会展示一个是否重发的小button,用户可以自行决定是否重发。

    如果用户点击按钮重发bb,user1和user2的消息列表会怎么展示?

    user1aa、cc、bb,其中bb是从aacc中间删除,并append到最后

    user2aa、cc、bb

    场景2

    在user1和user2的单聊会话中,user1发送3条消息,分别是aa、bb、cc。

    其中aa发送成功,正在自动重发bb和cc时,user2发送了dd和ee,且user2发送成功。之后,bb和cc自动重发成功。

    那么,user1和user2的消息列表会怎么展示?

    user1aa、bb、cc、dd、ee,切换一次session,再回到当前session,看到的消息是aa、dd、ee、bb、cc

    user2aa、dd、ee、bb、cc

    场景3

    在user1、user2和user3的群聊会话中,user1和user2在同一时刻发送消息到im-server,甚至im-server生成的timestamp也一样。

    那么,user1、user2和user3的消息列表如何展示?

    尚未模拟,期望由MQ来决定,先到达客户端,则排在前面

    从上下文语义来讲,两条timestamp一样的消息,前后顺序不重要

    小结

    与场景1相比,场景2有两个不同点

    • 对于发送失败的消息,在自动发送成功后,原始顺序不变;如果是手动重发,则删除后追加到最后
    • 对于多条发送失败的消息,在自动发送成功后,receiver收到的顺序不应发生变化;如果是手动重发,则依赖手动触发重发的顺序

    场景1和场景2的相同点

    • 最终的消息顺序,依赖服务端的timestamp,即消息顺序的最终一致性

    4.2. 有序的定义

    消息的有序性,更多是一种用户体验

    • 允许同一session中,不同成员看到的消息顺序不一致
    • 允许同一session中,某个成员的当前消息和历史消息顺序不一致
    • 不允许同一session中,所有成员的历史消息顺序不一致
    • 不允许单个user消息流乱序
    • 不允许当前session消息列表存在中间插入的情况,允许首尾追加中间删除的情况

    4.3. 有序的实现

    sequenceId

    • 生成规则:在client发送消息给server时,由sender生成,全局唯一,可以是{userId}-{sessionId}-{timestamp}-{autoIncrementNum}
    • 作用1:sender基于sequenceId,接收send-ack(包含server生成的messageId
    • 作用2:server基于sequenceId,完成消息去重(建议保存最近10条最长10分钟即可)
    • 作用3:receiver基于sequenceId,完成消息去重
    • 作用4:receiver基于sequenceId,解析得到userIdtimestampautoIncrementNum,校验单user消息流顺序(非session的消息流)。如果消息顺序不一致,则报错,但是,仍然追加到消息列表末尾

    messageId

    • 生成规则:在server收到client的消息发送请求时,由server生成,全局唯一,统一标识某一消息,可以是{timestamp}-{uuid}-{messageType}
    • 作用1:client基于messageId,解析得到timestamp,完成session消息流排序
    • 作用2:client基于messageId,完成消息的增值功能,例如消息撤回消息编辑表情回复

    单packge支持多message

    • 消息收发的数据包,需要支持多个message,例如一次发送多条message,或者一次接收多条message
    • 作用1:Client当前正在发送的消息数据包最多1个,对于待发送的消息,可以按顺序打包成一个消息数据包,一起发送
    • 作用2:在超大群组聊天时,服务端可以实现消息合并算法,即对receiver在x时间内的n条message进行打包发送

    5. 可靠性(不重不漏)

    如何实现消息的可靠性,保证消息不重不漏,需要从消息传输的三个环节着手

    5.1. 消息上行

    在c->s的过程中,采用send-ack的方式,如果client没有收到send-ack,则自动重发。

    此过程,可保证消息不漏。但是,server收到的消息可能会重复。如果有重复sequenceId的消息,server须去重。

    注意:server须在投递RabbitMQ成功、且RabbitMQ持久化之后,再返回send-ack。否则,消息可能丢失。

    5.2. 消息处理

    Server处理消息的流程可能有多个服务参与,例如SessionManager、Auditor。

    为了保证消息的可靠性,每次与RabbitMQ的交互,需要保证成功投递安全消费

    • 成功投递,RabbitMQ完成持久化后才算成功投递
    • 安全消费,消息处理成功,且有下一个服务明确接棒,才算安全消费

    5.3. 消息下行

    在s->c的过程中,采用receive-ack的方式,如果server没有收到receive-ack,则自动重发。

    此过程,可保证消息不漏。但是,receiver收到的消息可能会重复。如果有重复sequenceId的消息,receiver须去重。

    如果receiver不在线,当receiver上线时,可通过API获取历史消息,并对历史消息列表进行二次校验(Server端须完成第一次校验),确保无重复sequenceId的消息。

    注意:server须在receiver返回receive-ack后,再告知RabbitMQ消费成功。否则,消息可能丢失。

    5.4. 参考

    6. 总结

    IM系统是不标准的,虽然XMPP协议试图解决这个问题,但事实证明根本不现实。

    各家IM厂商几乎都是自已的私有协议,以及不同的实现逻辑,这也决定了即使同一个技术问题,对于IM来说很难有固定的实现套路和标准的解决方案。

    不过,对于IM系统的几个硬性指标,是必须实现的。

    实现过程中,需要考虑性价比,是追求更高的系统并发,还是更可靠的数据流;是追求更大的系统吞吐,还是更好的可扩展性和容灾。

    最后,推荐一个IM专栏:
    https://segmentfault.com/u/jackjiang

    相关文章

      网友评论

        本文标题:IM - 消息四大特性与实现方案

        本文链接:https://www.haomeiwen.com/subject/tpttwltx.html