音视频开发——FFmpeg学习教程

作者: 谁动了我的代码 | 来源:发表于2022-10-20 22:13 被阅读0次

Mac BigSur OS 下 Qt安装以及集成ffmpeg 笔
（二）FFmpeg 简介及iOS端交叉编译
音视频学习
执行编译FFmpeg库
音视频开发——FFmpeg学习教程
Mac终端FFmpeg手动,自动编译
ffmpeg开发播放器学习笔记 - Hello FFmpeg
音视频学习(四)FFmpeg
iOS FFmpeg环境搭建
FFmpeg：音视频编解码开发套件

一、前言

音视频开发学习中，FFmpeg的学习为什么这么重要？

因为FFmpeg 是一个开源软件，采用 LGPL 或 GPL 许可证（需要注意这里的开源协议，它具有『传染性』，会要求它的使用方也开源）。我们可以使用 FFmpeg 来进行多种格式音频和视频的录制、转换、流处理功能。

二、安装ffmpeg、ffmpy

安装ffmpeg

**更新源**

sudo apt update

**添加源**

sudo add-apt-repository ppa:kirillshkrogalev/ffmpeg-next 

**安装ffmpeg**

sudo apt-get install ffmpeg

**查看版本**

ffmpeg -version

**查看编码器和解码器**

ffmpeg -encoders

安装ffmpy

pip install ffmpy==0.2.2   # 需要权限就添加sudo

三、关键指令

查看FFmpeg支持的编码器

ffmpeg configure -encoders

查看FFmpeg支持的解码器

ffmpeg configure -decoders

查看FFmpeg支持的通信协议

ffmpeg configure -protocols

查看FFmpeg所支持的音视频编码格式、文件封装格式与流媒体传输协议

ffmpeg configure --help

播放视频

FFmpeg命令行工具学习(二)：播放媒体文件的工具ffplay

ffplay input.mp4

播放完自动退出

ffplay -autoexit input.mp4

设置视频的屏幕高宽比

ffmpeg -i input.mp4 -aspect 16:9 output.mp4 通常使用的宽高比是：
16:9
4:3
16:10
5:4
2:21:1
2:35:1
2:39:1

编码格式转换

MPEG4编码转成H264编码

ffmpeg -i input.mp4 -strict -2 -vcodec h264 output.mp4

H264编码转成MPEG4编码

ffmpeg -i input.mp4 -strict -2 -vcodec mpeg4 output.mp4

四、视频压缩

ffmpeg -i 2020.mp4 -vcodec h264 -vf scale=640:-2 -threads 4 2020_conv.mp4

ffmpeg -i 1579251906.mp4 -strict -2 -vcodec h264 1579251906_output.mp4

参数解释:

-i 2020.mp4
输入文件，源文件

2020_conv.mp4
输出文件，目标文件

-vf scale=640:-2  
改变视频分辨率，缩放到640px宽，高度的-2是考虑到libx264要求高度是偶数，所以设置成-2,让软件自动计算得出一个接近等比例的偶数高

-threads 4
4核运算

其他参数：

-s 1280x720 
设置输出文件的分辨率，w*h。

-b:v 
输出文件的码率，一般500k左右即可，人眼看不到明显的闪烁，这个是与视频大小最直接相关的。

-preset
指定输出的视频质量，会影响文件的生成速度，有以下几个可用的值 ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow。
与 veryslow相比，placebo以极高的编码时间为代价，只换取了大概1%的视频质量提升。这是一种收益递减准则：slow 与 medium相比提升了5%~10%；slower 与 slow相比提升了5%；veryslow 与 slower相比提升了3%。
针对特定类型的源内容（比如电影、动画等），还可以使用-tune参数进行特别的优化。

-an
去除音频流。

-vn
去除视频流。

-c:a
指定音频编码器。

-c:v
指定视频编码器，libx264，libx265，H.262，H.264，H.265。
libx264：最流行的开源 H.264 编码器。
NVENC：基于 NVIDIA GPU 的 H.264 编码器。
libx265：开源的 HEVC 编码器。
libvpx：谷歌的 VP8 和 VP9 编码器。
libaom：AV1 编码器。

-vcodec copy
表示不重新编码，在格式未改变的情况采用。

-re 
以源文件固有帧率发送数据。

-minrate 964K -maxrate 3856K -bufsize 2000K 
指定码率最小为964K，最大为3856K，缓冲区大小为 2000K。

-y
不经过确认，输出时直接覆盖同名文件。

-crf
参数来控制转码，取值范围为 0~51，其中0为无损模式，18~28是一个合理的范围，数值越大，画质越差。

五、视频拼接

将4个视频拼接成一个很长的视频（无声音）

ffmpeg -i 0.mp4 -i 1.mp4 -i 2.mp4 -i 3.mp4 -filter_complex '[0:0][1:0] [2:0][3:0] concat=n=4:v=1 [v]' -map '[v]' output.mp4

将4个视频拼接成一个很长的视频（有声音）

ffmpeg -i 1.mp4 -i 2.mp4 -i 3.mp4 -filter_complex '[0:0][0:1] [1:0][1:1] [2:0][2:1] concat=n=3:v=1:a=1 [v][a]' -map '[v]' -map '[a]’  output.mp4

参数解释：

[0:0][0:1] [1:0][1:1] [2:0][2:1] 
分别表示第1个输入文件的视频、音频，第2个输入文件的视频、音频，第3个输入文件的视频、音频。

concat=n=3:v=1:a=1 
表示有3个输入文件，输出一条视频流和一条音频流。

[v][a] 
得到的视频流和音频流的名字，注意在 bash 等 shell 中需要用引号，防止通配符扩展。

横向拼接2个视频

ffmpeg -i 0.mp4 -i 1.mp4 -filter_complex "[0:v]pad=iw*2:ih*1[a];[a][1:v]overlay=w" out.mp4

参数解释：

pad
将合成的视频宽高，这里iw代表第1个视频的宽，iw*2代表合成后的视频宽度加倍，ih为第1个视频的高，合成的两个视频最好分辨率一致。

overlay
覆盖，[a][1:v]overlay=w，后面代表是覆盖位置w:0。

竖向拼接2个视频

ffmpeg -i 0.mp4 -i 1.mp4 -filter_complex "[0:v]pad=iw:ih*2[a];[a][1:v]overlay=0:h" out_2.mp4

横向拼接3个视频

ffmpeg -i 0.mp4 -i 1.mp4 -i 2.mp4 -filter_complex "[0:v]pad=iw*3:ih*1[a];[a][1:v]overlay=w[b];[b][2:v]overlay=2.0*w" out_v3.mp4

竖向拼接3个视频

ffmpeg -i 0.mp4 -i 1.mp4 -i 2.mp4 -filter_complex "[0:v]pad=iw:ih*3[a];[a][1:v]overlay=0:h[b];[b][2:v]overlay=0:2.0*h" out_v4.mp4

4个视频2x2方式排列

ffmpeg -i 0.mp4 -i 1.mp4 -i 2.mp4 -i 3.mp4 -filter_complex "[0:v]pad=iw*2:ih*2[a];[a][1:v]overlay=w[b];[b][2:v]overlay=0:h[c];[c][3:v]overlay=w:h" out.mp4

六、视频帧操作

ffmpeg和H264视频的编解码

查看每帧的信息

ffprobe -v error -show_frames gemfield.mp4

从pict_type=I可以看出这是个关键帧，然后key_frame=1 表示这是IDR frame，如果key_frame=0表示这是Non-IDR frame。

截取视频中的某一帧

把gemfield.mp4视频的第1分05秒的一帧图像截取出来。

input seeking

ffmpeg -ss 00:1:05 -i gemfield.mp4 -frames:v 1 out.jpgoutput seeking

ffmpeg -i gemfield.mp4 -ss 00:1:05 -frames:v 1 out1.jpg

参数解释：

-frame:v 1，在video stream上截取1帧。
input seeking使用的是key frames，所以速度很快；而output seeking是逐帧decode，直到1分05秒，所以速度很慢。

重要说明：

ffmpeg截取视频帧有2种 seeking 方式，对应有2种 coding 模式：transcoding 和 stream copying（ffmpeg -c copy）。

transcoding 模式：需要 decoding + encoding 的模式，即先 decoding 再encoding。

stream copying 模式：不需要decoding + encoding的模式，由命令行选项-codec加上参数copy来指定（-c:v copy ）。在这种模式下，ffmpeg在video stream上就会忽略 decoding 和 encoding步骤。

查看视频总帧数

ffprobe -v error -count_frames -select_streams v:0 -show_entries stream=nb_frames -of default=nokey=1:noprint_wrappers=1 gemfield.mp4

查看 key frame 帧数

ffprobe -v error -count_frames -select_streams v:0 -show_entries stream=nb_read_frames -of default=nokey=1:noprint_wrappers=1 -skip_frame nokey gemfield.mp4

查看 key frame 所在的时间

ffprobe -v error -skip_frame nokey -select_streams v:0 -show_entries frame=pkt_pts_time -of csv=print_section=0 gemfield.mp4

查看 key frame 分布的情况

ffprobe -v error -show_frames gemfield.mp4 | grep pict_type

查看 key frame 所在的帧数

ffprobe -v error -select_streams v -show_frames -show_entries frame=pict_type -of csv gemfield.mp4 | grep -n I | cut -d ':' -f 1

重新设置 key frame interval

ffmpeg -i gemfield.mp4 -vcodec libx264 -x264-params keyint=1:scenecut=0 -acodec copy out.mp4

查看视频波特率

ffprobe -v error -select_streams v:0 -show_entries stream=bit_rate -of default=noprint_wrappers=1:nokey=1 gemfield.mp4

七、图片与视频

7.1 图片转视频（规则的名称）

ffmpeg -f image2 -i 'in%6d.jpg' -vcodec libx264 -r 25 -b 200k test.mp4

参数解释：

-r 25 表示每秒播放25帧
-b 200k 指定码率为200k

图片的文件名为"in000000.jpg"，从0开始依次递增。

7.2 图片转视频（不规则的名称）不规则图片名称转视频。

7.2.1 方法一

不规则图片名称合成视频文件。

ffmpeg -framerate 10 -pattern_type glob -i '*.jpg' out.mp4

cat *.png | ffmpeg -f image2pipe -i - output.mp4

参数解释：
-framerate 10：视频帧率
-pattern_type glob：Glob pattern 模糊匹配
-f image2pipe：图像管道，模糊匹配得到图片名称

7.2.2 方法二

不规则图片名称合成视频文件。

先动手把不规则文件重命名规则图片名。
def getTpyeFile(filelist, type):     
    res = []     
    for item in filelist:
         name, suf = os.path.splitext(item) # 文件名，后缀
         if suf == type:
             res.append(item)
     return res

pwd = os.getcwd() # 返回当前目录的绝对路径
dirs = os.listdir() # 当前目录下所有的文件名组成的数组
typefiles = getTpyeFile(dirs, '.jpg')

for i in range(0,len(typefiles)):
     os.rename(typefiles[i],"./%d.jpg" % (i)) #将文件以数字规则命令

将需要合成的图片放在txt中，通过读取txt文件合并成视频。

ffmpeg -f concat -i files.txt output.mp4

7.3 图片格式转换

ffmpeg图片格式转换

webp转换成jpg

ffmpeg -i in.webp out.jpg

webp转换成png

ffmpeg -i in.webp out.png

jpg转换成png

ffmpeg -i in.jpg out.png

jpg转换成webp

ffmpeg -i in.jpg out.webp

png转换成webp

ffmpeg -i in.png out.webp

png转换成jpg

ffmpeg -i in.png out.jpg

八、硬解码与软解码

CPU富余、需要精准控制解码流程、有解码算法的优化、通用性要求高，直接使用软解（也就是CPU解码）; 有其他编解码芯片/模组、CPU不够用，就不得不需要转向硬解码（也就是专用芯片解码）。

以上就是FFmpeg学习的部分浅析，如果想进入音视频开发，那么掌握这些还是远远不够的。音视频开发所学知识要非常的多；想深入学习FFmpeg或者音视频全套技术可以点击获取《音视频全套学习电子册》。里面内容可以参考学习作为辅导资料；免费不吃亏。

文末

FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec，为了保证高可移植性和编解码质量，libavcodec里很多code都是从头开发的。

版本发布

2012年01月27日，FFmpeg 0.9.1 发布，修复了很多 bug 和安全方面的补丁，包括： CVE-2011-3893 and CVE-2011-3895，同时显著提升对 H.264 的检索支持。 [5]
2012年01月29日，FFmpeg 0.10 发布，这是一个主要的发行版本，包含大量的新特性和bug修复。 [6]
2012年04月07日，FFmpeg 0.10.1 发布，FFmpeg 0.10.1 修复了很多安全漏洞，超过 100 个 bug 修复，新增 swapuv 过滤器。 [7]
2012年05月07，FFmpeg 0.10.3 发布，该版本修复了 4xm 分路器、cook 解码器、mm 分路器、mpeg 视频解码器、vqavideo 解码器、xmv 分路器的安全问题，以及包含一些重要的 bug 修复。 [8]
2012年06月09日，FFmpeg 0.11.1 发布，该版本修复了 70 个 bug，其中有一些安全方面的问题。 [9]
2013-07-10, FFmpeg2.2发布
2014-09-15, FFmpeg2.4发布
2014-12-5, FFmpeg2.5发布
2019-6-2，FFmpeg4.2发布 [2]

Mac BigSur OS 下 Qt安装以及集成ffmpeg 笔
前言最近在学习音视频开发技术，开发环境为Qt搭配ffmpeg进行音视频开发学习。虽然网上QT环境搭建教程有许多，...
（二）FFmpeg 简介及iOS端交叉编译
FFmpeg，作为全世界音视频开发者都要掌握的神器，移动端学习音视频开发,FFmpeg可以说是必学的框架,FFmp...
音视频学习
写给小白的实时音视频技术入门提纲 Android 音视频开发学习之路零基础学习FFMPEG 各种音视频编解码学习详解
执行编译FFmpeg库
FFmpeg工具 FFmpeg FFplay FFprobe FFmpeg开发库 Libavcodec 音视频编解...
音视频开发——FFmpeg学习教程
一、前言音视频开发学习中，FFmpeg的学习为什么这么重要？因为FFmpeg 是一个开源软件，采用 LGPL ...
Mac终端FFmpeg手动,自动编译
背景移动端学习音视频开发,FFmpeg可以说是必学的框架,FFmpeg在linux平台下开发，但它同样也可以在其...
ffmpeg开发播放器学习笔记 - Hello FFmpeg
该节是ffmpeg开发播放器学习笔记的开篇《Hello FFmpeg》 ffmpeg是一个跨平台的音视频录制、转...
音视频学习(四)FFmpeg
环境： ffmpeg version 4.1.4 FFmpeg 音视频编解码工具，也是一组音视频编解码开发套件，为...
iOS FFmpeg环境搭建
一、背景移动端学习音视频开发，FFmpeg是必学的框架之一。FFmpeg有非常强大的功能，包括视频采集功能、...
FFmpeg：音视频编解码开发套件
FFmpeg 是什么？ FFmpeg 既是一款音视频编解码工具，同时也是一组音视频编解码开发套件，作为编解码开发套...

音视频开发——FFmpeg学习教程

一、前言

二、安装ffmpeg、ffmpy

安装ffmpeg

安装ffmpy

三、关键指令

播放视频

设置视频的屏幕高宽比

编码格式转换

四、视频压缩

参数解释:

其他参数：

五、视频拼接

将4个视频拼接成一个很长的视频（无声音）

将4个视频拼接成一个很长的视频（有声音）

参数解释：

横向拼接2个视频

参数解释：

竖向拼接2个视频

横向拼接3个视频

竖向拼接3个视频

4个视频2x2方式排列

六、视频帧操作

ffmpeg和H264视频的编解码

查看每帧的信息

截取视频中的某一帧

参数解释：

重要说明：

查看视频总帧数

查看 key frame 帧数

查看 key frame 所在的时间

查看 key frame 分布的情况

查看 key frame 所在的帧数

重新设置 key frame interval

查看视频波特率

七、图片与视频

7.1 图片转视频（规则的名称）

参数解释：

7.2.1 方法一

7.2.2 方法二

7.3 图片格式转换

八、硬解码与软解码

文末

版本发布

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读