美文网首页DNK 开发
Android NDK开发之旅26--NDK--音视频相关基础知

Android NDK开发之旅26--NDK--音视频相关基础知

作者: 小楠总 | 来源:发表于2017-04-02 14:27 被阅读1017次

    音视频基础知识

    视频播放原理

    我们先从一个简单的视频播放器的原理开始讲述,下图是一个最简单的视频播放的过程(不包括视频加密等等过程):

    视频播放原理

    这是一个视频播放的最基本的原理流程图,从这个图可以很整体得看到视频处理的一些主要步骤,后面我们会详细介绍一些这里提到的基本概念。

    注意:我们利用FFmpeg进行编程的时候几乎就是基于这个流程图来进行。比如说,编程的时候我们会拿到解码器,解码读取数据,绘制到屏幕上面的时候可能还需要把YUV数据转换为RGB等等。

    我们常见的封装视频的格式有:flv(音视频分开)、mp4、avi等等。后面我们会详细说明。

    为什么视频需要经过封装处理呢?

    因为摄像头采集到的画面、以及麦克风采集到的音频数据是经过压缩的处理,不然视频文件就会很大。

    也就是说:

    1. 录像、录音,实质是一个压缩采集的图像或者声音的过程。这个过程就是视频编码压缩的过程。
    2. 播放视频、音频文件实质上就是解压缩的过程,这个过程又称为解码。

    视频的封装格式介绍

    封装格式的作用是:视频码流和音频码流按照一定的格式存储在一个文件中。

    封装格式分析工具:Elecard Format Analyzer

    为什么要音视频分开存储呢?因为音视频的编码格式各种各样,同时编码必然会造成混乱。

    常见的视频封装格式有:

    视频封装格式

    以两个格式为例子,介绍一下原理:

    常见视频封装格式原理
    1. MPEG2-TS格式是由一个一个数据大小固定的TS-Packet组成,因此可以支持快进。
    2. FLY格式由FLV HEADER以及一个一个大小不固定的Tag组成。因为FLV格式直接能够用flash(浏览器)播放,因此常用于视频直播邻域。我们在做RTMP推流的时候,一开始就需要发送头信息。因为数据单元大小不固定,因此原生的视频播放器不支持FLV视频的快进(有些播放器进行了处理可以快进)。

    视频编解码常见格式介绍

    视频的压缩算法很多,因此编码格式就会有很多种,下面介绍一些常见的编解码格式:

    视频编解码格式:
    1. 常见的视频编码格式有:H.264、MPEG2、VP8等(谷歌收购的WebRTC视频通话就是用VP8)。
    2. 视频解码得到的像素数据YUV、RGB。YUV格式中,Y代表亮度,UV代表色度,人眼对亮度比较敏感,两者比例为4:1,与生物学的理论有关。
    视频编码格式

    原理分析:

    视频编码格式原理分析

    以H264为例,H264是由大小不固定的NALU构成。(NALU实质是一种数据结构)。H264里面有很多子压缩算法,原理比较复杂,包括了熵编码,环路滤波,帧内检测,帧间检测等知识。H264编码原理比较复杂,因此H264的压缩效率是几百到几千倍。

    我们需要学会FFmpeg即可,因为这个库封装了H264等格式的处理。

    视频解码(摄像机获取)得到的是视频像素数据,保存了屏幕上每个像素点的像素值。常见的像素数据格式有RGB24, RGB32, YUV420P,YUV422P,YUV444P等。压缩编码中一般使用的是YUV格式的像素数据,最为常见的格式为YUV420P。

    YUV视频格式是没有经过压缩的,很大。早期在电视上面用得比较多,比如古老的黑白、彩电。彩电播放早期的黑白视频实质上是只播放了Y(亮度)的数据,因为黑白视频只有Y的数据嘛。

    YUV格式简介

    RGB也有很多种,比如RGB24,不同的RGB编码色彩丰富度不同。

    RGB格式简介
    音视频编解码格式:
    1. 常见的音频编码格式有:AAC、MP3。
    2. 音频解码得到的是音频采样数据,然后喇叭才能播放。常见格式是PCM,实质是一个一个的采样值。单位时间内震动的数据,包括振幅和频率。常用采样率44100,人耳朵能够擦觉到的最高采样率。
    常见的音频编码格式
    在做视频直播的时候:音频常用AAC来进行编码,用FAAC库来处理;视频用H264编码。
    音频编码格式AAC介绍

    音频采样数据PCM:保存了音频中每个采样点的值,音频采样数据体积很大,一般需要进过压缩,我们平常说的“无损”实质上是没有损失的压缩的意思。

    PCM格式简介
    相关播放(编辑)工具
    1. YUV:YUV Player
    2. PCM:Adobe Audition
    3. 查看视频信息:MediaInfo
    4. 视频编码数据:Elecard Format Analyzer
    5. 视频编码分析工具:Elecard Stream Eye

    有兴趣可以下载玩玩。

    FFmpeg介绍

    FFmpeg是开源的C/C++音视频处理的类库,这个库十分优秀,以至于很多大公司都在用。主流的视频播放器几乎都使用了FFmpeg。

    FFmpeg的八个函数库的基本介绍

    如下图所示:

    FFmpeg库简介

    Visual Studio下FFmpeg的项目配置

    前言

    我们一般是在VS中写好代码然后放到Android中的,因此有必要搭建VS的开发环境。

    FFmpeg资源获取

    首先我们需要去FFmpeg的官网去获取源码,因为获取的步骤比较麻烦,固下个笔记记录下来,我们打开http://ffmpeg.org/

    FFmpeg官网.png

    点击官网中大大的Download按钮,跳转到下面的界面:

    下载Windows版本的资源.png

    选择对应的系统,这里我们先介绍Windows版本的,点击下面的Windows Builds,跳转到下面的界面:

    下载Windows版本的资源.png

    我们推荐使用旧版的FFmpeg库,因为如果使用新版的话,除了问题很难去百度。笔者的电脑是64位的,于是就点击All 64-bit Downloads。然后我们会跳转到下面这个仓库页面:

    FFmpeg仓库.png

    其中,我们需要下载的FFmpeg版本是2.8系列的,我们推荐使用2.8或者以下的版本。其中,dev是开发版本的库,shared是一些动态链接库,static是一些已经编译好的exe(Windows版本)可执行文件。这三个我们都需要下载下来。

    如果你嫌麻烦的话,我下面直接给出下载地址:

    https://ffmpeg.zeranoe.com/builds/win64/dev/2015/ffmpeg-20151105-git-c878082-win64-dev.7z

    https://ffmpeg.zeranoe.com/builds/win64/shared/2015/ffmpeg-20151105-git-c878082-win64-shared.7z

    https://ffmpeg.zeranoe.com/builds/win64/static/2015/ffmpeg-20151105-git-c878082-win64-static.7z

    下面并解压的效果如下:

    效果.png

    注意:下面分别用dev、static、shared来代表这三个文件夹。

    在命令行玩一玩static中的可执行文件

    我们打开static文件夹,里面有个bin目录,有三个exe文件。这就是我们即将要玩的东西:

    可执行文件.png

    为了简化操作,我们不妨把bin目录添加到环境变量path中。

    然后我们准备一个测试用的视频,例如笔者准备了一个test.flv视频文件。

    打开命令行,输入:

    ffmpeg -i test.flv test.avi
    

    然后这就完成了一次简单的视频格式转换。相信细心的你也会发现,FFmpeg的官网上面有这么一幅图:

    官网的例子.png

    其实这就是一个最简单的例子。

    下面我们再来搞一个是视频转GIF,在命令行输入下面的语句:

    ffmpeg -ss 0 -t 11 -i test.flv -s 1366x768 -b:v 1500k test.gif
    

    意思就是把test.flv转换为test.gif文件,其中需要指定转换的时间范围,分辨率大小,比特率。

    码率(比特率),单位时间每一帧画面以及音频的大小,也叫作比特每秒,单位时间内播放连续的媒体例如压缩后的音频或者视频的比特数量。码率越高,音视频越清晰。
    把视频转gif是很有意义的,例如微信中的小视频,我们没有点开的时候,其实播放的是一个gif文件(可能使用的是libgif这个NDK库),用户点击打开的时候,才会从服务器下载真正的视频文件。这样做大大降低了服务器的压力。

    最后我们看一个播放器的例子,输入下面的命令,就会打开一个播放器,所以说如果你想研究一个Android平台的播放器,那么需要研究ffplay相关的代码:

    ffplay test.flv
    

    FFmpeg的VS项目配置

    我们首先创建一个空项目,然后把dev中的include、lib两个目录拷贝到项目的根路径下的源代码目录中(默认是与项目名一样)。

    然后在项目属性中配置附加库目录:

    包含目录.png

    然后配置附加库目录:

    附加库目录.png

    然后配置有哪些附加库(附加依赖项),如下面所示:

    avcodec.lib
    avdevice.lib
    avfilter.lib
    avformat.lib
    avutil.lib
    postproc.lib
    swresample.lib
    swscale.lib
    
    附加依赖项配置.png

    最后我们创建一个测试用的CPP文件:

    #include <stdlib.h>
    #include <stdio.h>
    #include <iostream>
    
    using namespace std;
    
    //由于FFmpeg是C和C++混编的,因此使用extern是为了解决兼容问题
    extern "C"{
    #include "libavcodec/avcodec.h"
    }
    
    void main(){
        //输出FFmpeg的配置信息,检查是否配置好
        cout << avcodec_configuration() << endl;
        system("pause");
    }
    

    然后你会发现编译不过,因为我们用的FFmpeg库是64位的,因此需要把我们的平台改为64位的:

    配置平台为64位.png

    然后编译通过,输出的结果如下:

    配置结果.png
    题外话——关于extern关键字的基本解释

    extern可以置于变量或者函数前,以标示变量或者函数的定义在别的文件中,提示编译器遇到此变量和函数时在其他模块中寻找其定义。此外extern也可用来进行链接指定。也就是说extern有两个作用:

    1. 第一个,当它与"C"一起连用时,如: extern "C" void fun(int a, int b);则告诉编译器在编译fun这个函数名时按着C的规则去翻译相应的函数名而不是C++的,C++的规则在翻译这个函数名时会把fun这个名字变得面目全非,可能是fun@aBc_int_int#%$也可能是别的,这要看编译器的"脾气"了(不同的编译器采用的方法不一样),为什么这么做呢,因为C++支持函数的重载啊,在这里不去过多的论述这个问题,如果你有兴趣可以去网上搜索,相信你可以得到满意的解释!
    2. 第二,当extern不与"C"在一起修饰变量或函数时,如在头文件中: extern int g_Int; 它的作用就是声明函数或全局变量的作用范围的关键字,其声明的函数和变量可以在本模块活其他模块中使用,记住它是一个声明不是定义!也就是说B模块(编译单元)要是引用模块(编译单元)A中定义的全局变量或函数时,它只要包含A模块的头文件即可,在编译阶段,模块B虽然找不到该函数或变量,但它不会报错,它会在连接时从模块A生成的目标代码中找到此函数。

    如果觉得我的文字对你有所帮助的话,欢迎关注我的公众号:

    公众号:Android开发进阶

    我的群欢迎大家进来探讨各种技术与非技术的话题,有兴趣的朋友们加我私人微信huannan88,我拉你进群交(♂)流(♀)

    相关文章

      网友评论

      • itarbo:按照你这个来,build成功了,但是运行的时候,提示缺失avcodec-57.dll这个文件:我找到这个帖子http://blog.csdn.net/jfu22/article/details/52790230 ,不知道你有没有遇到这种情况?
        zhang_pan:你需要将shared文件下bin文件夹下的那些dll库放入到你项目的根目录下
        itarbo:@安卓开发热爱者 反正我也找不到旧版的,用的是最新的
        0ed0f321e7ad:= = 为什么在官网找不到win64 旧版 只找到未编译的2.8
      • itarbo:给的那3个链接好像找不到文件的,404 not found ,官网点进去也是比较新的。
        小楠总: @itarbo 官网有历史版本的,找找吧

      本文标题:Android NDK开发之旅26--NDK--音视频相关基础知

      本文链接:https://www.haomeiwen.com/subject/txcpottx.html