Android视频开发进阶(part2-MP4文件的解析)

作者: qing的世界 | 来源:发表于2017-04-21 17:24 被阅读3750次

Android视频开发进阶(part2-MP4文件的解析)
2018-01-22
启动模式
Android中的AIDL
XML解析和Xml转Json
Android音视频开发
Android 从源码角度理解LayoutInflater的解析
起飞！这两份技术点拉满的Android Framework 精编
起飞！这两份技术点拉满的Android Framework 精编
Hencoder学习笔记1-1

上一期文章我分享了一些视频播放里面的术语和基本概念。这一篇文章我会主要介绍容器(container format file)格式文件的细节，以最常见的MP4文件入手。然后会简短的介绍一个标准的播放器的启动，解析，播放流程。本篇还是以基础知识为主，虽然很枯燥，但是对视频开发的学习有非常大的好处，我自己个人的感受就是，如果在很多专有名字，概念都不熟悉的情况下，想要去阅读播放器源码会是相当困难的事情。比如Exoplayer，谷歌的分包策略就是根据播放器的组件来分包。如果不熟悉播放器的基础构建的话，连哪个部分的代码在哪个包都不知道。希望大家如果真的想进阶的话还是耐心的理解好每个基础概念。

Mp4格式文件的构成

Mp4头文件的构成

标准播放器的启动流程

在线视频播放的技术基础(online video streaming)

1. Mp4格式文件的构成

在上期我们大概介绍了Mp4文件的结构

但是这样抽象的介绍可能还是比较难理解，我们深入一些。

1.1 MP4到底是个啥？

通俗的说，MP4其实是一种格式的规范，这个规范是被ISO机构认证的，也就是说，只要你通过Codec生成了一个mp4文件，那么这个文件的格式必须是按照ISO机构的规矩来。。。。既然是规范，那么我们看看到底ISO对mp4做了什么规范:

请大家打开链接->ISO的mp4文件规范

大家可能会有点懵逼，看不懂。其实这个规范很好理解，它定义了一个MP4文件里面，哪些数据应该放在什么位置(以字节为单位)，哪些数据的长度是多少。我截取了一段:

大家看，上面这一段规范定义了ftyp这个头文件header所在的位置和长度(以字节为单位)。
至于这些头文件是有什么用，我在上一篇文章大概提到过，他们属于meta data的一部分。在本章我会更详细的介绍。

所以说，任何容器，包括mp4都是类似的结构化文件，只不过不同的格式文件ISO对其有严格的要求，数据的摆放顺序，排列等等不同而已。有兴趣的同学可以对比一下rmvb，mp4，mkv这些格式的要求有什么不同，优劣势各是什么。

2.Mp4头文件的构成

关于mp4文件的头文件格式（meta data），苹果官网对其进行了详细的描述（这个介绍是基于QuickTime播放器支持的mp4文件来介绍的，quciktime播放器对mp4的要求有些许不同，但是差别不大，我们可以忽略）:

Movie Atom

我们不追究太多细节，有兴趣的同学可以自己查看，我们专注于一些基础的信息。

首先，在Meta Data里面，每一个Header，头文件，我们都叫他们Atom Header(不知道咋翻译)。Atom Header分为Leaf Atom 和 Container Atom。前者代表一个连接着字符串信息的头文件，后者是一个包含了若干个子Atom的头文件，他们互相之间是有层级关系的(参考上图)。每次播放器获取了movie atom之后(moov)，会根据层级关系，向下，或者向下读取相关的其他信息。每一个头文件都会对它的子头文件保存位置的引用，所以只要根据mp4文件的规范获取了最顶级的头文件moov,就可以顺势往下读取其他头文件了。

我们来看看mp4的头文件结构

看起来很复杂，但是对于一个播放器来说，很多信息都不是必须。我们需要知道的最重要的信息是采样索引表(Sample Table Atoms).对应图中“**stbl **”这个atom header。这个索引表保存了mp4文件所有的采样(sample)与视频时间的对应关系(一般以微秒为单位)，还有包括每个采样的大小，在mp4文件中的起始位置(以自己为单位)。

3.标准播放器的启动流程

那么既然我们已经知道一个容器文件的格式规范了，播放器就可以通过解析容器的头文件来控制播放(playback)了。

3.1 播放器

通常播放器由三个部分构成

读取器(Extractor)

渲染器(TrackRenderer)

加载控制器(Load Controller)

数据源(Source)

读取器负责从source文件读取数据，加载控制器负责控制读取数据的策略(比如说在线视频播放的时候缓冲策略)，渲染器负责接收读取器读取的数据，并渲染到屏幕上。

3.2 播放器的播放过程

在播放器可以把数据提交给渲染器之前，播放器需要把必需的头文件全部解析并存入内存，比如之前说的采样索引表。一般播放器在解析完毕后，会构建三个个表，一个存放时间对应采样索引，一个存放采样索引对应在mp4文件中的起始位置(以字节为单位),一个存放采样索引对应大小(以字节为单位)。以下图为例

假设播放器需要从第1微秒开始播放，那么需要把第1微秒的数据放入渲染器。所以会查找下面这三个表。

通过表1，我们知道该微秒对应第1个采样（sample），从第一个和第二个表我们知道，第1个采样的数据范围(在mp4文件内)是从第0字节到300（0+300）字节，那么播放器就会去读取这个范围的数据并且放入渲染器中进行渲染。

同时，加载器会基于当前已经缓存的数据，决定是否还需要不停的读取数据进入内存。一般来说每个播放器都有默认的缓存值，也会有一个基准线，只有当缓存足够数据才能放进渲染器进行渲染。

最后同理，当我们拖动滑动控制器(SeekBar)想快进的时候，我们和第一步一样，通过我们想滑动的时间获取采样的索引，再重新开始读取数据。

综上所述，播放器在正式播放视频文件之前，必须要把头文件全部读取并解析(这会是一段非常耗时的程序)，这也是在线视频播放的等待时间的瓶颈。在接下来的章节我会介绍自适应视频播放(Adaptive Streaming)，这个技术的发明使得了分段式mp4文件(Fragmented Mp4)技术得以诞生，大大的减少了在线视频播放的等待时间。

4.在线视频播放的技术基础(online video streaming)

在线视频的播放其实和播放本地视频的局别就是Extractor读取的Source，数据源不一样，在线播放需要下载数据到内存，再交由Extractor读取分析。但是既然是在线视频播放，我们肯定不能把整个容器文件下载到内存或者硬盘再开始解析播放。我们希望能控制下载的进度，比如我当前在看第10s的视频内容，所以我只想缓存/下载视频内容到第20s的位置。

我们俗称的渐进式下载(Progressive Downloading)就解决了这一难题。

说的好像是很吓人的黑科技啊！！！！

其实就是HTTP1.1协议支持的分段式下载而已。。。。。

在HTTP请求里面假如一个叫RANGE的header，放入起始字节和结束字节，就可以只下载对应部分的数据，这一header的支持也是各种下载软件实现断点下载的基础。每次断网的时候记录下来已经下载的数据的字节数，下次再下载的时候从字节数+1处重新下载并且写入原有文件就可以了。

分割线

所以这次分享就结束啦，下一期分享我会开始进入正题，在安卓平台里面，对视频播放的支持，像api啊等等，以及其变迁历史。

周末愉快！

Android视频开发进阶(part2-MP4文件的解析)
上一期文章我分享了一些视频播放里面的术语和基本概念。这一篇文章我会主要介绍容器(container format ...
2018-01-22
Android事件分发解析（一）关于Android的事件分发机制，一直以来都是开发者进阶路上必须突破的一道关卡，...
启动模式
1、Android进阶系列之启动模式 2、Android 深入解析 Activity 的 launchMode 启...
Android中的AIDL
Android中的AIDL使用详解 AIDL使用解析 Android进阶之AIDL的使用详解
XML解析和Xml转Json
Xml的使用在Android开发中也时不时地遇到，通常xml用来写配置文件。Xml解析也是Android开发人员必...
Android音视频开发
互联网寒冬之下，Android开发的港湾：音视频进阶学习[https://juejin.cn/post/69141...
Android 从源码角度理解LayoutInflater的解析
在Android开发中，我们通过LayoutInflater去解析布局文件生成对应的View对象。方法参数：由...
起飞！这两份技术点拉满的Android Framework 精编
Android Framework 精编内核解析+Flutter 技术进阶精编笔记（Android高级、架构师必备...
起飞！这两份技术点拉满的Android Framework 精编
Android Framework 精编内核解析+Flutter 技术进阶精编笔记（Android高级、架构师必备...
Hencoder学习笔记1-1
HenCoder Android 开发进阶: 自定义 View 1-1 绘制基础视频重点自定义绘制的方式是重写...

网友评论

小伙人不错:我又来啦，学习大神的思路
3df977cdf9fa:虽然看的一脸懵逼，两脸懵逼，对角懵逼，正方体立体懵逼，但是并不影响我点赞，留言
qing的世界:@Weather_Rain 怎么有啥地方看不懂嘛，我觉得很简洁啦？
键盘上的舞者_9d08:可以转载吗part1、part2，在CSDN上
键盘上的舞者_9d08:@qing的世界谢谢
qing的世界:@键盘上的舞者_9d08 可以，转载注明出处和链接就可以
总是说下次:想问一下，如果moov box 在mdat box 后是不是就不能使用分段式下载了？
qing的世界:其实哪一个box在哪里都没关系，因为读文件的时候可以按byte的位置去读取，关键是在ISO的文件里面定义的每一个box都有相应的相对位置，根据那个读取就好了
3c3951db8bac:加载不出来是什么鬼
3c3951db8bac:用简书app加载不出来文章，只能在电脑上看了。
qing的世界:@Lawrence__Wang 什么东西加载不出来？
EdwdChen:大神我想请问一下，如果视频是用 HLS 传输的，改变视频进度到一些非关键帧时需要先或许关键帧再渲染到当前帧，我用 ExoPLayer 实现的，感觉耗时很长，结果参考 youtube 发现也是这样的，但是微博和今日头条就没有这样的问题，这是传输方式不同导致的还是可以用别的方法优化呢？谢谢
qing的世界:@EdwdChen 你说的这个情况，假如先release()了player再重新init的话的确会出现，会把第一帧先渲染。其实youtube的做法不是显示第一帧，而是用视频的thumbnil来遮盖住surfaceview。但是seek我还没见过会渲染第一帧。。。。
我不知道MediaCodec api有没有相关的设置，但是假如没有的话你可以尝试相似的做法，用一个imageview cover住surfaceview，监听ExoPLayer 的 Ready 事件。然后如果想用视频的关键帧去遮盖的话可以尝试用MediaMetaDataRetriver api去获取某一个milli second 的Bitmap，再用他去遮盖，但是这样比较麻烦。不如就用一个固定的图片好了。
EdwdChen:@qing的世界 seek的位置是准确的，就是假如每10秒一个关键帧，我拖动到9秒的时候就需要加载第0秒的关键帧然后再将前面9秒的画面都渲染上去，这里面花费了较长的时间，不知道有没有优化的可能
qing的世界:@EdwdChen 不是大神哈哈。
你说的这个问题应该是解码的不同把，如果是这样的话那应该是mediacodec 这个api的问题了，说实话这样还真没啥办法，可能今日头条他们压根就没用Android 的mediacodec api。
不过话说HLS应该用fragmented mp4把，我播放dash的资源没有发现你说的问题啊，每次seek的时候都是准确的，可以详细说一下嘛？
904c679224d2:厉害了我滴哥，最近在做视频编解码方面的东西，读了你的文章收获很多，非常感谢
qing的世界:@Turisla 不谢不谢！我也是在学习😜
曹通_4eba:
qing的世界:@曹通_4eba 谢谢
qing的世界:@曹通_4eba 谢谢
0ddc1f7125e0:学习了
qing的世界:@0ddc1f7125e0
86654a2d3e1e:可不可以把下一篇链接在文章最后，很不方便

qing的世界:@起名字怎么这么难可以可以，我今天有空编辑一下！谢谢！
Stone_Birds:大神，你的文章都不错，关注啦，谢谢你的分享，有更新立马查看
Stone_Birds: @qing的世界很期待你的文章，part5
qing的世界:哈哈谢谢，不过我不是大神……大家一起加油努力吧
b8b19648081c:大神,有更新@我哦,
b8b19648081c:@qing的世界来了来了
qing的世界:不过更新啦！
qing的世界:@Moustar 哈哈不是什么大神……
ZCJ风飞:。有新的再@我
qing的世界:@ZCJ风飞更新了哈哈
qing的世界:@ZCJ风飞哈哈ok