WebRTC 系列之视频辅流

作者: kimliang | 来源:发表于2020-12-04 09:47 被阅读0次

WebRTC 系列之视频辅流
WebRTC 系列之视频辅流
webrtc源码分析之视频编码之三
iOS音视频开源框架WebRTC入门-编译(前序)
iOS音视频开源框架WebRTC入门-简单应用
iOS音视频开源框架WebRTC入门-AppRTCMobile
iOS音视频开源框架WebRTC入门-本地/远端图像等比缩放
iOS音视频开源框架WebRTC入门-外网通信
iOS音视频开源框架WebRTC入门-编译(后序)
完整的直播系统

WebRTC在PlanB方案下，只支持一条视频流发送，这条视频流，我们称之为”主流”。何为视频”辅流”？视频辅流是指第二条视频流，一般用于屏幕共享。

项目背景介绍

目前的SDK分享屏幕过程中，需要用摄像头采集的通道分享屏幕，该方案下，分享者只有一路上行视频流，该场景中要么上行摄像头画面，要么上行屏幕画面，两者是互斥的。

除非实例一个新的SDK专门采集并发送屏幕画面，但实例两个SDK的方案在业务层处理起来十分麻烦且会存在许多问题，例如如何处理两个流间的关系等。

在RTC场景中，还存在一种可以单独为屏幕分享开启一路上行视频流的方案，并称之为“辅流（subStream）”，辅流分享即共享者同时发布摄像头画面和屏幕画面两路画面。有了这个辅流的通道，同时也可以为新版本的iPhone支持前后2路摄像头发送视频数据奠定基础。

技术背景介绍

前期SDK的架构设计是一个多PeerConnection的模型，即：一个PeerConnection对应一路音视频流。随着新的SDP格式（UnifyPlan）的推出和支持，一个PeerConnection可以对应多路音视频流，即单PeerConnection模型。

基于单PC的架构，允许创建多个Transceiver，用于发送多条视频流。

概要介绍

目前视频流主要分为3类：Camera流、屏幕共享流、自定义输入视频流。

1.将Camera流作为主流，支持Simulcast

2.将自定义视频输入（非屏幕共享）作为主流，不支持Simulcast

3.将屏幕共享作为辅流，不支持Simulcast，有单独的屏幕共享编码策略

由于iOS屏幕共享的特殊性，其通过自定义视频输入的方式获取视频数据，因此存在如下图所示的流程图：

综上所述：iOS的自定义输入既可以使用主流的通道发送视频（非屏幕共享），也可以使用辅流的通道发送视频（屏幕共享）。

关键类图

上述提到的单PC架构，目前会有2个RtpTransceiver，一个是AudioTransceiver，一个是VideoTransceiver，而辅流的屏幕共享会在新增一个RtpTransceiver。一个VideoRtpSender会包含一个VideoMediaChannel。

1.信令层面需要支持多路视频流，使用mediaType用于区分上述的Camera流(Video)、屏幕共享流(ScreenShare)、自定义视频输入流(externalVideo)。

2.重构跨平台层的Capture和Source的管理。

3.重构用户和渲染画布的管理，从一个uid对应一个render，过渡到一个uid的sourceId对应一个render，每个uid可能会包含2个sourceId。

4.互动直播的服务器推流和录制需要支持主流和辅流的合流录制。

5.主流和辅流的拥塞控制方案的落地。

6.主流和辅流的码率分配方案的落地。

7.主流和辅流的编码器性能优化。

8.PacedSender发送策略、音画同步等方案的调整。

9.服务器Qos下行码率的分配方案的调整。

10. 辅流相关的统计数据的汇总。

11. 产品的计费问题。

码率分配

带宽分配的主要流程：

1.CC评估出来的总带宽分配会分给音频流、主流、辅流

2.主流内部再由Simulcast模块分配大小流的码率，不开Simulcast时就直接给大流

辅流会在上图的基础上再新增一个VideoSendStream。

目前关于码率分配的流程如下图所示,概括起来有一下几步：

1.cc的码率通过 transport controller 传递到 call 中

2.然后经过 BitrateAllocator 分配到各个注册的流中（目前就是视频模块）

3.视频模块拿到分配的码率，分配给 fec 和重传，剩下来的分配给 video encoder bitrate

4.视频编码器模块拿到 video encoder bitrate，按照我们的策略，分配给大流、小流使用

拥塞控制

1、按照rfc2327(https://tools.ietf.org/html/rfc2327)，使用"b=<modifier>:<bandwidth-value>"的方式来指定建议带宽，有两种modifier(修饰符)：

AS：单一媒体带宽

CT：会话总带宽，表示所有媒体的总带宽

目前SDK使用b=AS:的方式指定摄像头码流或屏幕共享码流的建议带宽，并把这个值作为CC模块的估计值上限。

2、新的需求要求在同一会话中，可同时发送摄像头码流和屏幕共享码流，因此应把两路媒体的建议带宽值相加得到整个会话的建议带宽值，作为CC模块的估计值上限

3、WebRTC支持b=AS:方式(单路媒体)，在WebRTC内部对多路媒体进行相加处理即可满足需求，而WebRTC目前不支持b=CT:方式。所以建议使用b=AS:方式，改动相对较少。

处理流程

pub码流能力更新，通过sdp方式(b=AS:)的同步设置"最大带宽"到CC模块，当新增一路媒体流时，通过启动probe快速探测的方式，迅速上探到可用带宽：

快速带宽评估

突然增加一路媒体流时，需要能够很快上探到真实带宽值，使用probe快速探测算法实现这一目标：

1.如果探测成功，CC估计值迅速收敛，在带宽充足场景中收敛为CC上限，带宽受限场景中为真实带宽；

2.如果探测失败(如高丢包率场景)，CC估计值缓慢收敛，在带宽充足场景中最终收敛为CC上限，带宽受限场景中为真实带宽。

Paced Sender处理

1.辅流与主流的视频大小流的发送优先级一致，所有视频媒体数据，使用预算和pacing multiplier的方式做平滑发送处理。

2.增加一个视频码流类型，kVideoSubStream = 3，与主流的大小流视频数据区分开来。

3.probe快速探测期间，当编码数据不足的情况下，发送padding数据弥补，以保证发送码率满足要求。

统计上报

1、发送端和接收端MediaInfo获取

当前SDK的MediaInfo获取逻辑为：a）遍历当前所有transceiver，获取每个transceiver的video_channel和voice_channel，从而获取到video_media_channel和voice_media_channel；b)根据media_channel 的getstats获取当前channel的MediaInfo；c)将获取的MediaInfo放在vertor media_infos中，便于上报；

主流和辅流同时发送场景，只是增加了一个transceiver，因此此逻辑适用于主流和辅流同时发送的场景，如下图：