美文网首页Project - IM
IM - 消息四大特性与实现方案

IM - 消息四大特性与实现方案

作者: 红薯爱帅 | 来源:发表于2021-08-31 20:07 被阅读0次

1. 概述

本文介绍即时通讯软件中,消息的几个特性如何保证

  • 实时性
  • 安全性
  • 有序性
  • 可靠性(不重不漏)

2. 实时性

消息的传输过程,分为三个阶段:

  • 消息上行
  • 消息处理
  • 消息下行

其中,消息上下行,通过C/S全双工通信保证,并且有HeartBeat保证通道的可用性

消息处理由im-server实现,主要包含消息鉴权、消息审计、消息拆包,须保证稳定高效,可通过独立服务实现,保证其可扩展性

message-transfer.png

消息鉴权

单聊情况

  • 鉴权关系:sender与receiver是否好友(或同事)

群聊情况

  • 鉴权关系:sender是否是群组成员

消息审计

  • 审计内容:消息内容是否合法,不包含反党叛国、黄赌毒等语义
  • 审计设备:移动设备不能接收文件

消息拆包

对于群组消息,需要拆包,1个发送包生成N个接收包,N是当前群组成员数

如果当前群组超过500人,例如10000人,可以考虑采用消息广播机制,提高消息下行效率。

具体做法是,发送到MQ前,不拆分成10000个Package,而是X个Package,X等于SessionManager实例数。每个SessionManager实例收到Package后,自行拆包并发送到对应的TCP通道,Client即可实时接收到消息。

3. 安全性

  • 传输过程中,采用https和wss,或者gRPC证书,保证消息安全
  • 登录安全,采用JWT登录认证机制,防止身份信息被盗用

另外,发送时加密可进一步加强消息的安全性,但是不利于项目前期开发与调试,故优先级低

4. 有序性

4.1. 场景假设

场景1

在user1和user2的单聊会话中,user1发送3条消息,分别是aa、bb、cc。

其中aa和cc发送成功,bb由于网络或设备问题,在client自动重试3分钟之后,最终发送失败,会展示一个是否重发的小button,用户可以自行决定是否重发。

如果用户点击按钮重发bb,user1和user2的消息列表会怎么展示?

user1aa、cc、bb,其中bb是从aacc中间删除,并append到最后

user2aa、cc、bb

场景2

在user1和user2的单聊会话中,user1发送3条消息,分别是aa、bb、cc。

其中aa发送成功,正在自动重发bb和cc时,user2发送了dd和ee,且user2发送成功。之后,bb和cc自动重发成功。

那么,user1和user2的消息列表会怎么展示?

user1aa、bb、cc、dd、ee,切换一次session,再回到当前session,看到的消息是aa、dd、ee、bb、cc

user2aa、dd、ee、bb、cc

场景3

在user1、user2和user3的群聊会话中,user1和user2在同一时刻发送消息到im-server,甚至im-server生成的timestamp也一样。

那么,user1、user2和user3的消息列表如何展示?

尚未模拟,期望由MQ来决定,先到达客户端,则排在前面

从上下文语义来讲,两条timestamp一样的消息,前后顺序不重要

小结

与场景1相比,场景2有两个不同点

  • 对于发送失败的消息,在自动发送成功后,原始顺序不变;如果是手动重发,则删除后追加到最后
  • 对于多条发送失败的消息,在自动发送成功后,receiver收到的顺序不应发生变化;如果是手动重发,则依赖手动触发重发的顺序

场景1和场景2的相同点

  • 最终的消息顺序,依赖服务端的timestamp,即消息顺序的最终一致性

4.2. 有序的定义

消息的有序性,更多是一种用户体验

  • 允许同一session中,不同成员看到的消息顺序不一致
  • 允许同一session中,某个成员的当前消息和历史消息顺序不一致
  • 不允许同一session中,所有成员的历史消息顺序不一致
  • 不允许单个user消息流乱序
  • 不允许当前session消息列表存在中间插入的情况,允许首尾追加中间删除的情况

4.3. 有序的实现

sequenceId

  • 生成规则:在client发送消息给server时,由sender生成,全局唯一,可以是{userId}-{sessionId}-{timestamp}-{autoIncrementNum}
  • 作用1:sender基于sequenceId,接收send-ack(包含server生成的messageId
  • 作用2:server基于sequenceId,完成消息去重(建议保存最近10条最长10分钟即可)
  • 作用3:receiver基于sequenceId,完成消息去重
  • 作用4:receiver基于sequenceId,解析得到userIdtimestampautoIncrementNum,校验单user消息流顺序(非session的消息流)。如果消息顺序不一致,则报错,但是,仍然追加到消息列表末尾

messageId

  • 生成规则:在server收到client的消息发送请求时,由server生成,全局唯一,统一标识某一消息,可以是{timestamp}-{uuid}-{messageType}
  • 作用1:client基于messageId,解析得到timestamp,完成session消息流排序
  • 作用2:client基于messageId,完成消息的增值功能,例如消息撤回消息编辑表情回复

单packge支持多message

  • 消息收发的数据包,需要支持多个message,例如一次发送多条message,或者一次接收多条message
  • 作用1:Client当前正在发送的消息数据包最多1个,对于待发送的消息,可以按顺序打包成一个消息数据包,一起发送
  • 作用2:在超大群组聊天时,服务端可以实现消息合并算法,即对receiver在x时间内的n条message进行打包发送

5. 可靠性(不重不漏)

如何实现消息的可靠性,保证消息不重不漏,需要从消息传输的三个环节着手

5.1. 消息上行

在c->s的过程中,采用send-ack的方式,如果client没有收到send-ack,则自动重发。

此过程,可保证消息不漏。但是,server收到的消息可能会重复。如果有重复sequenceId的消息,server须去重。

注意:server须在投递RabbitMQ成功、且RabbitMQ持久化之后,再返回send-ack。否则,消息可能丢失。

5.2. 消息处理

Server处理消息的流程可能有多个服务参与,例如SessionManager、Auditor。

为了保证消息的可靠性,每次与RabbitMQ的交互,需要保证成功投递安全消费

  • 成功投递,RabbitMQ完成持久化后才算成功投递
  • 安全消费,消息处理成功,且有下一个服务明确接棒,才算安全消费

5.3. 消息下行

在s->c的过程中,采用receive-ack的方式,如果server没有收到receive-ack,则自动重发。

此过程,可保证消息不漏。但是,receiver收到的消息可能会重复。如果有重复sequenceId的消息,receiver须去重。

如果receiver不在线,当receiver上线时,可通过API获取历史消息,并对历史消息列表进行二次校验(Server端须完成第一次校验),确保无重复sequenceId的消息。

注意:server须在receiver返回receive-ack后,再告知RabbitMQ消费成功。否则,消息可能丢失。

5.4. 参考

6. 总结

IM系统是不标准的,虽然XMPP协议试图解决这个问题,但事实证明根本不现实。

各家IM厂商几乎都是自已的私有协议,以及不同的实现逻辑,这也决定了即使同一个技术问题,对于IM来说很难有固定的实现套路和标准的解决方案。

不过,对于IM系统的几个硬性指标,是必须实现的。

实现过程中,需要考虑性价比,是追求更高的系统并发,还是更可靠的数据流;是追求更大的系统吞吐,还是更好的可扩展性和容灾。

最后,推荐一个IM专栏:
https://segmentfault.com/u/jackjiang

相关文章

网友评论

    本文标题:IM - 消息四大特性与实现方案

    本文链接:https://www.haomeiwen.com/subject/tpttwltx.html