美文网首页
WebRTC中的SDP

WebRTC中的SDP

作者: 拉普拉斯妖kk | 来源:发表于2022-11-14 17:03 被阅读0次

    SDP简介

    在WebRTC的通信过程中,SDP是其中重要的协议。SDP(Session Description Protocol)全称是会话描述协议。主要用于两个会话实体之间的媒体协商。WebRTC引入SDP来描述媒体信息,用于媒体协商时决定双方是否可以进行通信,以及用何种方式进行通信。SDP作为WebRTC的信令系统的一部分,驱动着WebRTC的运转。从这个角度来说,SDP是WebRTC的灵魂。

    标准SDP规范

    标准SDP结构由一个会话级描述和多个媒体级描述组成,通常SDP中都会包含一个音频媒体描述和一个视频媒体描述。

    每条描述信息都是 <type> = <value> 的形式("=" 两侧不允许有空格存在。)。其中,<type>是描述的目标,它由单个字符构成;<value>是对<type>的解释或约束。会话和媒体都有各自的<type>,另外还有一些公共的<type>。

    常见的<type>如下:

    会话级
    v=(protocol version,协议版本)
    o=(owener/creator and session identifier,会话的创建者)
    s=(session name,会话名称)
    t=(time the session is active,会话存活时间)
    
    媒体级
    m=(media,媒体)
    
    公共
    c=(connection information,网络信息)
    a=(attribute,属性)
    

    这是一个典型简化后的的SDP示例:

    v=0
    o=- 5910110687297165449 2 IN IP4 127.0.0.1
    s=-
    t=0 0
    ...
    
    //第一个媒体流,音频流
    m=audio 54797 UDP/TLS/RTP/SAVPF 8
    ...
    
    //第2个媒体流,视频流
    m=video 9 UDP/TLS/RTP/SAVPF 125
    ...
    

    WebRTC中的SDP

    WebRTC对标准SDP规范做了一些调整,按功能分成会话描述和媒体描述。其中,会话描述属于标准SDP中的内容,通常我们不需要了解它。媒体描述中有WebRTC增加的内容,需要了解一下的。媒体描述的内容可以分成四个大类:媒体信息、网络描述、安全描述、和服务质量描述。如图所示:

    sdp.png

    媒体信息

    媒体信息是标准SDP的内容,属于SDP中的核心内容。其格式如下所示:

    m=<media> <port>/<numbers> <transport> <fmt>
    
    • <media>:媒体类型,audio、video等。
    • <port>/<numbers>:端口,通常不会被使用。
    • <transport>:传输协议,UDP、TCP等。
    • <fmt>:媒体数据类型,通常为PayloadType列表。其具体含义需要在“a=rtpmap”中说明。

    这里有几个重要的属性说明一下:

    a=ssrc

    ssrc是媒体源的唯一标识,每一路媒体流都有唯一的ssrc来标识它。另外,在ssrc这一行中有时还能看到cname,这是就是该媒体流的别名。ssrc不同的媒体流可以有相同的cname,表示他们属于同一个媒体流(比如,重传流的cname就和原始流的相同)。

    a=rtpmap

    rtpmap是一张PayloadType与编码器的映射表。其格式如下所示:

    a=rtpmap:<payload type> <encoding name>/<clock rate>[/<encodingparameters>]
    
    • <payload type>:负载类型,与m line中的fmt中的对应。
    • <encoding name>:端口,编码器名称,如VP8,VP9,OPUS等。
    • <clock rate>:采样率。
    • <encodingparameters>:编码参数,如音频的声道数信息。
    a=fmtp

    fmtp用于指定媒体数据格式。其格式如下所示:

    a=fmtp:<payload type> <format specific parameters>
    
    • <payload type>:负载类型,与m line中的fmt中的对应。
    • <format specific parameters>:参数信息,其含义需要参考相关草案。

    网络描述

    网络描述也是标准SDP的内容。其中记录了传输媒体数据时使用的网络信息。下面几个是其中比较重要的属性:

    a=candidate

    描述了候选地址信息,是一个已经被废弃的属性,但因一些流媒体服务器上海有使用,所以WebRTC依然做了兼容

    a=group:BUNDLE

    指明哪些媒体数据可以复用同一个传输通道,以节约ICE资源。

    a=rtcp-mux

    指明RTP与RTCP是否复用同一端口,也是用以节约ICE资源。

    a=rtcp-rsize

    指明在用户带宽不足时,缩减RTCP非关键包的大小。

    a=ice-options

    指明WebRTC收集ICE Candidate的策略。一般默认为trickle(只要有可用的Candidate就进行交换,不需要等待所有的Candidate收集完成才交换)。

    安全描述

    这部分内容是WebRTC新增到SDP规范中去的。WebRTC的媒体通信提供了一套很好的安全机制。下面几个是其中比较重要的属性:

    a=ice-ufrag和a=ice-pwd

    指明ICE的账号和密码,用于验证用户的合法性。

    a=fingerprint

    指明DTLS握手时的证书指纹,用于验证加密证书的有效性。

    a=setup:(active/passive/actpass)

    指明终端的角色,决定DTLS时是作为主动握手方还是被动连接方或是都可以。

    服务质量

    这部分内容也是WebRTC新增到SDP规范中去的。这个内容只控制WebRTC中很小一部分服务质量的开关。WebRTC中还包含有非常多的服务质量内容。只有以下一个属性:

    a=rtcp-fb

    在媒体协商过程中,发起方的SDP中指明要开启哪些RTCP反馈,而应答方则在回复的SDP中确认可以开启哪些RTCP反馈。例如:

    • nack:丢包重传
    • fir:申请关键帧
    • transport-cc、goog-remb:拥塞控制算法。

    Plan B和Unified Plan

    目前,WebRTC中的SDP包含两种规格,Plan B和Unified Plan。其中,Plan B是由标准SDP演化而来的,而Unified Plan是用来代替Plan B的新规格。两者会在表达传输多路同类媒体流的时候格式会有区别。

    在Plan B中,只有两个媒体描述(m line),即音频媒体描述(m=audio...)和视频媒体描述(m=video...)。如果有多路同类媒体流则需要通过其媒体描述中的SSRC来区分。
    而在Unified Plan中,每个媒体流都有一个媒体描述(m line)。

    WebRTC SDP示例

    v=0
    //sdp版本号,一直为0,rfc4566规定
    o=- 7017624586836067756 2 IN IP4 127.0.0.1
    //username,没有的话使用-代替,7017624586836067756是整个会话的编号,2表明会话版本
    s=-
    //会话名,没有的话使用-代替
    t=0 0
    //两个值分别是会话的起始时间和结束时间,这里都是0表明没有限制
    a=group:BUNDLE audio video data
    //须要共用一个传输通道传输的媒体,若是没有这一行,音视频,数据就会分别单独用一个udp端口来发送
    a=msid-semantic: WMS h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C
    //WMS是WebRTC Media Stream简称,这一行定义了本客户端支持同时传输多个流,一个流能够包括多个
    //track,通常定义了这个,后面a=ssrc这一行就会有msid,mslabel等属性
    
    m=audio 9 UDP/TLS/RTP/SAVPF 111 103 104 9 0 8 106 105 13 126
    //m=audio说明本会话包含音频,9表明音频使用端口9来传输,在webrtc中通常不使用,
    //若是设置为0,表明不传输音频,UDP/TLS/RTP/SAVPF是表示用户来传输音频支持的协议,
    //udp、tls、rtp表明使用udp来传输rtp包,并使用tls加密;
    //SAVPF表明使用srtcp的反馈机制来控制通讯过程,
    //111 103 104 9 0 8 106 105 13 126表示本会话音频支持的编码,后台几行会有详细补充说明
    
    c=IN IP4 0.0.0.0
    //这一行表示你要用来接收或者发送音频使用的IP地址,webrtc使用ice传输,不使用这个地址
    a=rtcp:9 IN IP4 0.0.0.0
    //用来传输rtcp地地址和端口,webrtc中不使用
    
    a=ice-ufrag:khLS
    a=ice-pwd:cxLzteJaJBou3DspNaPsJhlQ
    //以上两行是ice协商过程当中的安全验证信息
    a=fingerprint:sha-256 FA:14:42:3B:C7:97:1B:E8:AE:0C2:71:03:05:05:16:8F:B9:C7:98:E9:60:43:4B:5B:2C:28:EE:5C:8F3:17
    //以上这行是dtls协商过程当中需要的证书指纹,用来验证DTLS证书的有效性
    
    a=setup:actpass
    //以上这行表明本客户端在dtls协商过程当中,能够作客户端也能够作服务端,参考rfc4145 rfc4572
    a=mid:audio
    //在前面BUNDLE这一行中用到的媒体标识
    a=extmap:1 urn:ietf:params:rtp-hdrext:ssrc-audio-level
    //上一行指出我要在rtp头部中加入音量信息,参考 rfc6464
    a=sendrecv
    //上一行指出我是双向通讯,另外几种类型是recvonly,sendonly,inactive
    a=rtcp-mux
    //上一行指出rtp,rtcp包使用同一个端口来传输
    a=rtpmap:111 opus/48000/2
    //a=rtpmap都是对m=audio这一行的媒体编码补充说明,指出了编码采用的编号,采样率,声道等
    a=rtcp-fb:111 transport-cc
    //以上这行说明opus编码支持使用rtcp来控制拥塞,参考https://tools.ietf.org/html/draft-holmer-rmcat-transport-wide-cc-extensions-01
    a=fmtp:111 minptime=10;useinbandfec=1
    //对opus编码可选的补充说明,minptime表明最小打包时长是10ms,useinbandfec=1表明使用opus编码内置fec特性
    a=rtpmap:103 ISAC/16000
    a=rtpmap:104 ISAC/32000
    a=rtpmap:9 G722/8000
    a=rtpmap:0 PCMU/8000
    a=rtpmap:8 PCMA/8000
    a=rtpmap:106 CN/32000
    a=rtpmap:105 CN/16000
    a=rtpmap:13 CN/8000
    a=rtpmap:126 telephone-event/8000
    a=ssrc:18509423 cname:sTjtznXLCNH7nbRw
    //cname用来标识一个数据源,ssrc当发生冲突时可能会发生变化,可是cname不会发生变化,也会出现在rtcp包中SDEC中,
    //用于音视频同步
    a=ssrc:18509423 msid:h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C 15598a91-caf9-4fff-a28f-3082310b2b7a
    //以上这一行定义了ssrc和WebRTC中的MediaStream,AudioTrack之间的关系,msid后面第一个属性是stream-d,第二个是track-id
    a=ssrc:18509423 mslabel:h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C
    a=ssrc:18509423 label:15598a91-caf9-4fff-a28f-3082310b2b7a
    
    m=video 9 UDP/TLS/RTP/SAVPF 100 101 107 116 117 96 97 99 98
    //参考上面m=audio,含义相似
    
    c=IN IP4 0.0.0.0
    a=rtcp:9 IN IP4 0.0.0.0
    
    a=ice-ufrag:khLS
    a=ice-pwd:cxLzteJaJBou3DspNaPsJhlQ
    a=fingerprint:sha-256 FA:14:42:3B:C7:97:1B:E8:AE:0C2:71:03:05:05:16:8F:B9:C7:98:E9:60:43:4B:5B:2C:28:EE:5C:8F3:17
    
    a=setup:actpass
    a=mid:video
    a=extmap:2 urn:ietf:params:rtp-hdrext:toffset
    a=extmap:3 http://www.webrtc.org/experiments/rtp-hdrext/abs-send-time
    a=extmap:4 urn:3gpp:video-orientation
    a=extmap:5 http://www.ietf.org/id/draft-hol ... de-cc-extensions-01
    a=extmap:6 http://www.webrtc.org/experiments/rtp-hdrext/playout-delay
    a=sendrecv
    
    a=rtcp-mux
    a=rtcp-rsize
    a=rtpmap:100 VP8/90000
    a=rtcp-fb:100 ccm fir
    //ccm是codec control using RTCP feedback message简称,意思是支持使用rtcp反馈机制来实现编码控制,
    //fir是Full Intra Request简称,意思是接收方通知发送方发送帧过来
    a=rtcp-fb:100 nack
    //支持丢包重传,参考rfc4585
    a=rtcp-fb:100 nack pli
    //支持关键帧丢包重传,参考rfc4585
    a=rtcp-fb:100 goog-remb
    //支持使用rtcp包来控制发送方的码流
    a=rtcp-fb:100 transport-cc
    //参考上面opus
    a=rtpmap:101 VP9/90000
    a=rtcp-fb:101 ccm fir
    a=rtcp-fb:101 nack
    a=rtcp-fb:101 nack pli
    a=rtcp-fb:101 goog-remb
    a=rtcp-fb:101 transport-cc
    a=rtpmap:107 H264/90000
    a=rtcp-fb:107 ccm fir
    a=rtcp-fb:107 nack
    a=rtcp-fb:107 nack pli
    a=rtcp-fb:107 goog-remb
    a=rtcp-fb:107 transport-cc
    a=fmtp:107 level-asymmetry-allowed=1;packetization-mode=1;profile-level-id=42e01f
    //h264编码可选的附加说明
    a=rtpmap:116 red/90000
    //fec冗余编码,通常若是sdp中有这一行的话,rtp头部负载类型就是116,不然就是各编码原生负责类型
    a=rtpmap:117 ulpfec/90000
    //支持ULP FEC,参考rfc5109
    a=rtpmap:96 rtx/90000
    a=fmtp:96 apt=100
    //以上两行是VP8编码的重传包rtp类型
    a=rtpmap:97 rtx/90000
    a=fmtp:97 apt=101
    a=rtpmap:99 rtx/90000
    a=fmtp:99 apt=107
    a=rtpmap:98 rtx/90000
    a=fmtp:98 apt=116
    a=ssrc-group:FID 3463951252 1461041037
    //在webrtc中,重传包和正常包ssrc是不一样的,上一行中前一个是正常rtp包的ssrc,后一个是重传包的ssrc
    a=ssrc:3463951252 cname:sTjtznXLCNH7nbRw
    a=ssrc:3463951252 msid:h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C ead4b4e9-b650-4ed5-86f8-6f5f5806346d
    a=ssrc:3463951252 mslabel:h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C
    a=ssrc:3463951252 label:ead4b4e9-b650-4ed5-86f8-6f5f5806346d
    a=ssrc:1461041037 cname:sTjtznXLCNH7nbRw
    a=ssrc:1461041037 msid:h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C ead4b4e9-b650-4ed5-86f8-6f5f5806346d
    a=ssrc:1461041037 mslabel:h1aZ20mbQB0GSsq0YxLfJmiYWE9CBfGch97C
    a=ssrc:1461041037 label:ead4b4e9-b650-4ed5-86f8-6f5f5806346d
    
    m=application 9 DTLS/SCTP 5000
    
    c=IN IP4 0.0.0.0
    
    a=ice-ufrag:khLS
    a=ice-pwd:cxLzteJaJBou3DspNaPsJhlQ
    a=fingerprint:sha-256 FA:14:42:3B:C7:97:1B:E8:AE:0C2:71:03:05:05:16:8F:B9:C7:98:E9:60:43:4B:5B:2C:28:EE:5C:8F3:17
    
    a=setup:actpass
    a=mid:data
    a=sctpmap:5000 webrtc-datachannel 1024
    

    相关文章

      网友评论

          本文标题:WebRTC中的SDP

          本文链接:https://www.haomeiwen.com/subject/aqzxxdtx.html