引言百度百科
FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用
LGPL 或 GPL 许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的
音频/视频编解码库 libavcodec,为了保证高可移植性和编解码质量, libavcodec 里很多 code 都是
从头开发的。
FFmpeg 在 Linux 平台下开发,但它同样也可以在其它操作系统环境中编译运行,包括 Windows、
Mac OS X 等。这个项目最早由 Fabrice Bellard 发起,2004年至2015年间由 Michael Niedermayer 主
要负责维护。许多 FFmpeg 的开发人员都来自 MPlayer 项目,而且当前 FFmpeg 也是放在 MPlayer
项目组的服务器上。项目的名称来自 MPEG 视频编码标准,前面的 "FF" 代表 "Fast Forward" 。
1:音视频各阶段的编码格式
image.png2:常用的图像像素格式RGB和YUV
2.1 RGB 格式
一般较为熟悉,RGB图像具有三个通道 R、G、B,分别对应红、绿、蓝三个分量,由三个分量的值决定颜色;通常,会给RGB图像加一个通道alpha,即透明度,于是共有四个分量共同控制颜色。
2.2 YUV 格式
(YCrCb)是指将亮度参量Y和色度参量U/V分开表示的像素格式,主要用于优化彩色视频信号的传输。
YUV像素格式来源于RGB像素格式,通过公式运算,YUV 三分量可以还原出 RGB,YUV 转 RGB 的公式如下:
一般,将 RGB 和 YUV 的范围均限制在 [0, 255] 间,则有如下转换公式:
来源此博客
视频压缩格式
压缩格式 | 使用静态图或视频 | 特征描述 | 应用场景 |
---|---|---|---|
Jpeg/jpeg200 | 静态图 | 两种压缩方法不同 | DSC等 |
M-Jpeg | 视频 | 只是有连续的jpeg图像组成 | PC-CAM,监控等 |
MPEG1 | 视频 | MPEG自制定义的VCD应用程序标准 | VCD等 |
MPEG2 | 视频 | MPEG 组织定义的 DVD ,DVB 应用程序的标准 | DVD ,DVB ,监控等 |
MPEG2 | 视频 | MPEG 组织定义的网络应用程序的标准 | 监控,VOD ,IPTV ,PMP 等 |
H.261 | 视频 | 国际电联定义基本互联网多媒体应用标准 | 监控, 视频会议等 |
H.261 | 视频 | 国际电联定义低带宽互联网多媒体应用标准 | 监控, 视频会议 等 |
H.264 | 视频 | 具有更高压缩效率的下一代标准 | IPTV ,监控 ,多媒体等 |
WMV9 | 视频 | 微软定义的下一代标准 | IPTV , VOD |
AVS1.0 | 视频 | 中国自有专利标准 | -- |
音频压缩格式
格式 描述 备注
格式 | 描述 | 备注 |
---|---|---|
MP3 | 全名是 MPEG Audio Layer-3 ,简单的说就是一种声音文件的压缩格式。1987 年德国的研究机构II(InstituteIntegrierte Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做 EUREKAEUl47 ,即 MP3的前身。之后,这项计划由 IIS 与Erlangen 大学共同合作,开发出一套非常强大的算法,经由 150 国际标准组织认证之后符合 ISOMPEG Audio Layer-3 标准,就成为现在的 MP3。 | MPEG 音频编码的层次越高,编码器越复杂,压缩率也越高(MP1 压缩率 4:1 ,MP2 压缩率6:1 - 8:1 ,MP3 压缩率 10:1 -12:1)。有损压缩——感官编码技术,去除数据中人类感官察觉不到的数据。 |
AAC | 高级音频编码(AdvancedAudio Coding,AAC)一种基于 MPEG-4 的音频编码技术,它由杜比实验室、AT&T 等公司共同研发,目的是替换 MP3 编码方式。作为一种高压缩比的音频压缩算法,AAC 的数据压缩比约为 18:1 ,压缩后的音质可以同未压缩的 CD 音质相媲美。因此,相对于 MP3 、WMA 等音频编码标准来说,在相同质量下码率更低,有效地节约了传输带宽,被广泛得应用于互联网流媒体、IPTV 等领域(低码率,高音质)。 | 特点:1 比特率:AAC- 最高512kbps(双声道时)/MP3-32~320kbps2 采样率:AAC- 最高96kHz / MP3- 最高48kHz3 声道数:AAC– 最高48个全音域声道/MP3 - 两声道4 采样精度:AAC- 最高32bit /MP3 - 最高16bit5 AAC的不足之处是,它属于有损压缩的格式,相对于APE和FLAC主流无损压缩,音色“饱满度”差距比较大。另外,除了流媒体网络传输,其所能支持的设备较少。 |
WAV | 微软和 IBM 共同开发的 PC 标准声音格式,文件后缀名 .wav ,是一种通用的音频数据文件。 | 通常使用 WAV 格式用来保存一些没有压缩的音频,也就是经过PCM 编码后的音频,因此也称为波形文件,依照声音的波形进行存储,因此要占用较大的存储空间。WAV 文件也可以存放压缩音频,但其本身的文件结构使之更加适合于存放原始音频数据并用作进一步的处理。 |
WMA | Windows Media Audio,微软针对网络音频开发的数位音乐文件格式。 | 支持防复制,限制播放时间和播放次数甚至播放设备,支持串流技术,即一边读一边播,轻松实现线上广播。但是算法复杂且封闭。 |
RA | Real Audio,是 RealNetwork 公司推出的一种流式压缩声音格式,是为了解决网络传输带宽资源限制而设计的。 | 支持串流技术,即一边读一边播,轻松实现线上广播。支持使用特殊通讯协议来隐藏音乐文件的真实 URI ,实现仅在线播放不支持下载的功能。 |
MID | MID 是通过数字化乐器接口 MIDI 输入的声音文件的扩展名,这种文件只是像记乐谱一样地记录下演奏的符号,所以体积是所有音频格式中最小的。 | 数据量小,占用存储空间极小,适合在网络上传输。编辑修改灵活方便,可通过音序器自由的改变MIDI文件的曲调、音色、速度等,甚至可以改换不同的乐器。MIDI 声音仅适于重现打击乐或一些电子乐器的声音(音源窄)。 |
网友评论