美文网首页
即时通讯开发移动端实时音视频直播之采集

即时通讯开发移动端实时音视频直播之采集

作者: 可爱的小云朵 | 来源:发表于2022-11-30 10:48 被阅读0次

采集是整个视频推流过程中的第一个环节,它从系统的采集设备中获取原始视频数据,将其输出到下一个环节。视频的采集涉及两方面数据的采集:音频采集和图像采集,它们分别对应两种完全不同的输入源和数据格式。

音频采集

音频数据既能与图像结合组合成视频数据,也能以纯音频的方式采集播放,后者在很多成熟的应用场景如在线电台和语音电台等起着非常重要的作用。音频的采集过程主要通过设备将环境中的模拟信号采集成 PCM 编码的原始数据,然后编码压缩成 MP3 等格式的数据分发出去。常见的音频压缩格式有:MP3,AAC,OGG,WMA,Opus,FLAC,APE,m4a 和 AMR 等。

音频采集和编码主要面临的挑战在于:

延时敏感;

卡顿敏感;

噪声消除(Denoise);

回声消除(AEC);

静音检测(VAD);

各种混音算法等。

在音频采集阶段,参考的主要技术参数有 :

采样率(samplerate):

采样就是把模拟信号数字化的过程,采样频率越高,记录这一段音频信号所用的数据量就越大,同时音频质量也就越高;

位宽:

每一个采样点都需要用一个数值来表示大小,这个数值的数据类型大小可以是:4bit、8bit、16bit、32bit 等等,位数越多,表示得就越精细,声音质量自然就越好,而数据量也会成倍增大。我们在音频采样过程中常用的位宽是 8bit 或者 16bit;

声道数(channels):

由于音频的采集和播放是可以叠加的,因此,可以同时从多个音频源采集声音,并分别输出到不同的扬声器,故声道数一般表示声音录制时的音源数量或回放时相应的扬声器数量。声道数为 1 和 2 分别称为单声道和双声道,是比较常见的声道参数;

音频帧(frame):

音频跟视频很不一样,视频每一帧就是一张图像,而从上面的正玄波可以看出,音频数据是流式的,本身没有明确的一帧帧的概念,在实际的应用中,为了音频算法处理/传输的方便,一般约定俗成取 2.5ms~60ms 为单位的数据量为一帧音频。这个时间被称之为“采样时间”,其长度没有特别的标准,它是根据编解码器和具体应用的需求来决定的;即时通讯开发可以找蔚可云。

根据以上定义,我们可以计算一下一帧音频帧的大小。

图像采集

图像采集的图片结果组合成一组连续播放的动画,即构成视频中可肉眼观看的内容。图像的采集过程主要由摄像头等设备拍摄成 YUV 编码的原始数据,然后经过编码压缩成 H.264 等格式的数据分发出去。常见的视频封装格式有:MP4、3GP、AVI、MKV、WMV、MPG、VOB、FLV、SWF、MOV、RMVB 和 WebM 等。

图像由于其直观感受最强并且体积也比较大,构成了一个视频内容的主要部分。图像采集和编码面临的主要挑战在于:设备兼容性差、延时敏感、卡顿敏感以及各种对图像的处理操作如美颜和水印等。

在图像采集阶段,参考的主要技术参数有:

图像传输格式:

通用影像传输格式(Common Intermediate Format)是视讯会议(video conference)中常使用的影像传输格式;

图像格式:

通常采用 YUV 格式存储原始数据信息,其中包含用 8 位表示的黑白图像灰度值,以及可由 RGB 三种色彩组合成的彩色图像;

传输通道:

正常情况下视频的拍摄只需 1 路通道,随着 VR 和 AR 技术的日渐成熟,为了拍摄一个完整的 360° 视频,可能需要通过不同角度拍摄,然后经过多通道传输后合成;

分辨率:

随着设备屏幕尺寸的日益增多,视频采集过程中原始视频分辨率起着越来越重要的作用,后续处理环节中使用的所有视频分辨率的定义都以原始视频分辨率为基础。视频采集卡能支持的最大点阵反映了其分辨率的性能;

采样频率:

采样频率反映了采集卡处理图像的速度和能力。在进行高度图像采集时,需要注意采集卡的采样频率是否满足要求。采样率越高,图像质量越高,同时保存这些图像信息的数据量也越大。

以上,构成了一个视频采集的主要技术参数,以及视频中音频和图像编码的常用格式。而对于直播 App 开发者来说,了解这些细节很有帮助。

开放式设计

以上从采集内容和采集源两个维度分别介绍了视频采集相关的知识,但对于采集源来说,市场上可见的采集源远远不止这三种,即便是摄像头也有很多分类。对于一个完整的覆盖推流、传输和播放三个环节的直播云服务来说,支持尽可能多的采集源和播放终端是一项既无法规避也很难完成的工作。

相关文章

  • 直播流程是如何实现的

    直播本质 实时推送/拉取过来的音视频数据 直播流程简单梳理一下 主播端采集音视频 CCD:图像传感器,用于图像采集...

  • 视频直播网站开发千万不能忘的一个知识点

    对于视频直播网站开发的技术人员来讲,音视频即时通讯技术是需要熟练掌握的。毕竟像直播这样重视互动和实时性的应用场景,...

  • Android 直播专题2-音视频采集

    Android 直播专题2-音视频采集Android 直播专题2-音视频采集Android 直播专题2-音视频采集...

  • 音视频开发进阶—— DSP视频编解码

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙。原因在于:实时音视频技术 = 音视频处理技术...

  • iOS FFmpeg环境搭建

    一、背景   移动端学习音视频开发,FFmpeg是必学的框架之一。FFmpeg有非常强大的功能,包括视频采集功能、...

  • 音视频开发资源汇总

    即时通讯网 即时通讯音视频开发 系列文章: 即时通讯音视频开发(一):视频编解码之理论概述即时通讯音视频开发(二)...

  • IM音视频技术方案建议

    环信即时通讯平台提供了基于互联网和移动终端的实时语音、实时视频等通讯能力。环信将移动即时通讯能力通过API和客户端...

  • 实时音视频技术资料

    《即时通讯音视频开发(一):视频编解码之理论概述》 《即时通讯音视频开发(二):视频编解码之数字视频介绍》 《即时...

  • iOS音视频开发学习(一)—— 流程、框架了解

    直播业务 1、采集端:需要深入了解 1.1 音视频采集:AVFoundation1.2 视频处理(美颜、滤镜等):...

  • iOS IM即时通讯小结:WebSocket

    参考网站 即时通讯网 移动端IM开发入门文章:《新手入门一篇就够:从零开发移动端IM》 大牛博客IM 即时通讯技术...

网友评论

      本文标题:即时通讯开发移动端实时音视频直播之采集

      本文链接:https://www.haomeiwen.com/subject/bonjfdtx.html