格式编码详解

作者: 夏源XY | 来源:发表于2018-11-06 11:18 被阅读142次

格式编码详解
滑动宫格验证码都给碰上了？没事儿，看完此文分分钟拿下！
Linux命令参数
【Python】Python3网络爬虫实战-45、微博宫格验证码
Python3网络爬虫开发实战] 8.4-微博宫格验证码的识别
返回码详记
创业者为什么必须控制好心态？
解码
URLEncoder编解🐎
Netty4（四）：Codec 编码与解码

Adobe Media Encoder CC

第一章：视频编码必备知识点（以Davinci及QT格式为例）

一、封装格式VS编码格式

在DaVinci Resolve中举例，封装格式相当于包装盒，编码格式相当于产品在盒内怎么摆放。

常用的封装格式有：Quicktime；MP4 ； MXF ； Cineon；DCP；DPX；EXR；IMF。

常用的编码格式有：DNxHD，DNxHR，ProRes，GoPro Cineform，Grass Valley，H.264，Kakadu JPEG 2000，MPEG，Photo JPEG，Uncompressed（无损）。这些编码格式都可以压进Quicktime这种封装格式里。

这些编码格式都可以压进Quicktime(.mov)这种封装格式里

1.封装格式

(1) MXF：是英文Material exchange Format（素材交换格式）的缩语。MXF是SMPTE（美国电影与电视工程师学会）组织定义的一种专业音视频媒体文件格式。MXF主要应用于影视行业媒体制作、编辑、发行和存储等环节。

MXF文件通常被视为一种“容器”文件格式，也就是说MXF文件格式与内容数据的格式无关，这得益于MXF底层使用了KLV（键-长度-值）三元组编码方式。MXF文件通常包含文件头、文件体和文件尾等几个部分。

(2)Cineon：Cineon 是由 Kodak 开发的，它是一种适合于电子复合、操纵和增强的 10 位/通道数字格式。使用 Cineon 格式可以在不损失图像品质的情况下输出回胶片。此格式在 Cineon Digital Film System 中使用，该系统将源于胶片的图像转换为 Cineon 格式，再输出回胶片。

电影转换为数字格式的一种文件格式（cin dpx）。

Cineon是由柯达公司开发的，是一种使用于电子复合、操纵和增强的10位通道数字格式，此格式可以在不损失图像品质的情况下输出回胶片，在Cineon Digital Film System中使用，Cineon Digital Film System将源于胶片的图像转换为Cineon格式，再输出回胶片。

(3) DPX：DPX是在柯达公司的 Cineon文件格式发展出的基于位图(bitmap)的文件格式。它是SMPTE在Cineon文件格式的基础上加上一系列头文件(header information)后的格式。它是用来储存和表达运动图画或视频流的每一个完整帧而发展出的格式。多个DPX文件可以表示运动图画的片断和序列，用于在多种电子和计算机设备上交换和处理这些以完整帧为单位的运动视频。它是数字电影和DI工作中最重要的文件格式之一。

由于DPX格式常用于高质量的合成、数字电影、和胶片电影等应用，所以应该尽量避免使用以软“代理”软件转换的任何方案。应该使用基于硬件的、原始处理 DPX和Cineon文件的方案。

(4) DCP:数字电影包 (Digital Cinema Package) 。

数字电影包是一种数字文件集，用于存储和转换数字影像的音频、图像和数据流。该术语由数字电影倡导联盟（DCI）在对数字影像的打包建议中做出过定义。通用惯例采用一种文件结构来组织成多个通常有几个G大小的MXF文件，这些文件分别用来存储音频和视频流，以及XML格式的辅助索引文件。MXF文件包含有压缩、编码和加密的数据流，以此来减少所需的大量存储空间和防止未授权使用。图像部分是JPEG 2000压缩文件，然而音频部分是线性PCM（脉冲编码调制）。采用的加密标准是CBC模式中的AES-128位。较新的SMPTE标准用于使不同工具厂商和制片商的建议保持一致性。Interop，遗留的DCP标准仍需要各DCP播放器支持。

(5) EXR:OpenEXR (EXR)是视觉效果行业使用的一种文件格式，适用于高动态范围图像,一种HDR标准。该胶片格式具有适合用于电影制作的颜色高保真度和动态范围。OpenEXR 由 Industrial Light and Magic (工业光魔)开发，支持多种无损或有损压缩方法。OpenEXR 胶片可以包含任意数量的通道，并且该格式同时支持 16 位图像和 32 位图像。

(6) IMF:IMF的全称是Interoperable Master Format，即交付母版文件, 用于整合除了胶片和DCP以外的其他所有数字发行文件。IMF借鉴DCP包的概念制作，因此形式上类似DCP，都是一个包括MXF和XML文件的文件包。不同的是，DCP只是JPEG2000编码，用于影院放映，而IMF增加了OPL文件，是用于生成其他最终发行版本（除DCP）的中间母版文件。

(7)MJ2：2002年Joint Photographic Experts Group(联合图像专家小组:JPEG)制订了基于JPEG2000的运动图像准:Motion JPEG2000(即JPEG2000 part III,简称为MJ2或MJ2K),该标准对视频序列各帧独立采用JPEG2000编码,各帧编码数据完全独立,编码得到的视频序列具有可分级性。与其他视频编码标准相比,Motion JPEG2000抗干扰能力强、生成的编码序列易于编辑,因此目前越来越多地应用于数码相机,数字摄像机、数字影院、视频编辑器、监控、远程医疗等领域,2005年好莱坞7大影业巨头联合确定Motion JPEG2000为未来数字影院标准,得到了工业界和娱乐界支持。

2.编码格式

（1）Grass Valley：

Grass Valley Canopus HQX/HQ （HQX比HQ多了10bit，相当于升级版），小日本Edius公司推出的后期专业编码方案。可自定义尺寸，支持最高的DCI 8K；帧率可自定义；带alpha通道；YUV4:2:2采样；位深：8bit & 10bit；可封装格式：AVI，Quicktime，MXF；VBR可变比特率帧内压缩，码率最高达768 Mb/s。

（2）Kakadu JPEG 2000：一种数字电影压缩方案。

2004年，数字电影组织（DCI）选择使用JPEG2000作为未来数字电影图像的压缩格式。JPEG2000是最新的静态图像压缩国际标准，由联合摄影专家组于2000年制定。作为JPEG的后继者，JPEG2000采用小波变换和位平面编码器，可获得最先进的压缩性能。在数字电影处理过程中，每一帧图像通过JPEG2000压缩算法独立压缩编码后，按照DCI规范对每帧JPEG2000码流进行加密、封装，与音频流、字幕流统一装成为DCP,传输到影院进行放映。

JPEG2000是新一代的静态图像压缩标准，而Kakadu是JPEG2000官方建议的实现代码之一，也是目前效率最高的JPEG2000开源代码。Kakadu作为JPEG2000开源代码的开山鼻祖，其作者David Taubman正是JPEG2000核心编码EBCOT[2]的发明者，可见Kakadu在JPEG2000实现代码中的地位。

（3）MPEG：

MPEG(Moving Pictures Experts Group，运动图像专家组)是在ISO(国际标准化组织)和IEC(国际电工委员会)内运作的一个工作组。1988年成立。原先他们打算开发MPEG1、MPEG2、MPEG3和MPEG4四个版本，以适用于不同带宽和数字影像质量的要求。目前，MPEG1技术被广泛的应用于VCD，而MPEG2标准则用于广播电视和DVD等。MPEG3最初是为HDTV开发的编码和压缩标准，但由于MPEG2的出色性能表现， MPEG3只能是死于襁褓了。

● 目前有5个标准：

MPEG-1：1992年制定，码率约为1.5Mb/s用于数字存贮媒体活动图像及其伴音的编码。生活中的VCD即是。

MPEG-2：1994年制定，码率约为1.5Mb/s~100Mb/s，MPEG-2编码标准希望囊括数字电视、图像通信各领域的编码标准，MPEG-2按压缩比大小的不同分成五个档次(profile)，每一个档次又按图像清晰度的不同分成四种图像格式，或称为级别(level)。五个档次四种级别共有20种组合，但实际应用中有些组合不太可能出现，较常用的是11种组合，分别应用在不同的场合。生活中的DVD即是。

MPEG-4：1998年制定，不仅针对一定比特率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性。我们平时所说的MP4格式就是它。

MPEG-4码流主要包括基本码流和系统流，基本码流包括音视频和场景描述的编码流表示，每个基本码流只包含一种数据类型，并通过各自的解码器解码。系统流则指定了根据编码视听信息和相关场景描述信息产生交互方式的方法，并描述其交互通信系统。

H.264编码，MPEG-4 标准所定义的最新格式，同时也是技术含量最高、代表最新技术水平的视频编码格式之一。MPEG-4不仅仅是一种编码方法，更是一种媒体标准，目前它的标准有27个部分，而第十部分即“高级视频编码AVC（Advanced Video Coding）：定义了更高级的视频编解码器。该部分采用了国际电联ITU的技术建议H.264，故业界亦称该部分为H.264。”

MPEG-7:确切说它不是一种压缩编码方法，而是一种“多媒体内容描述接口”，其目的是生成一种用来描述多媒体内容的标准，这个标准将对信息含义的解释提供一定的自由度，可以被传送给设备和电脑程序，或者被设备或电脑程序查取。

MPEG-21：正式名称是“多媒体框架”或“数字视听框架”，它以将标准集成起来支持协调的技术以管理多媒体商务为目标，目的就是理解如何将不同的技术和标准结合在一起需要什么新的标准以及完成不同标准的结合工作。

◆ 活动数据帧的压缩形式：活动图像的相邻帧的图像信息具有很强的相关性, 因此不需要把每帧图像一一发送, 可以先记录, 存储前一帧图像的全部数据, 后继若干帧图像可以仅仅记录、传输与前一帧图像各点对应不一样的差异信息。在重放和恢复时,利用前一帧图像的全部数据及后帧的差异数据, 经过运算就可以得到后继各帧的全部信息。这样处理可以使传送的数据量大大减少, 数据速率进一步降低。

按照MPEG标准,活动图像的画面可以分成三种类型：

①I画面

I画面,也称I帧, 它为内帧或者说帧内编码帧,I帧使场景变换后的第一个画面, 是一种独立的可作为参照的画面,这个画面的全部数据都要记录、保存与传输,对I帧进行编码时,压缩量最小,其典型的压缩比为每编码帧为1bit。通常,每12或15帧图像需传送一帧I 帧信息,但是场景更换后的第一帧图像要为I帧。

②P画面

P画面,也称P帧, 为预测帧、前向预测编码帧等,该画面利用了前面最近的I帧画面为主体内容上的变换差值及二者的移动矢量, 而不再传送背景等相同信息,这样就省去了许多细节数据, 重放时,可依靠帧存储器, 将I画面的全部信息和P画面各对应像素间的差值信息进行相减运算, 即可以得到P画面的全部数据。对P画面的频率采样采用粗量化的方法, 通常每3帧或4帧传送一帧P帧信息。

③B画面

B画面,也称B帧或双向预测帧, B画面传送的是I、P画面之间的画面内容, 它反映了I、P画面间运动主体变化的情况, 它的数据既要参考前面的I画面,也要参考后面的P画面, 或者均参考前后的P画面。B画面的频率采样采用粗量化处理, 真信息量小,压缩比例最大。

④运动补偿(移动矢量)

运动补偿是利用消除时间冗余的方法来提高P帧和B帧数据压缩比的一种技术。与帧内编码相比,运动补偿可改善压缩比大概3倍。对于活动的图像, 各帧间的某些图像内容是有移动变化的, 因此,预测帧(p帧和I帧)的信息是二个参数, 即当前帧和参考帧的差值已经对应两帧间的移动矢量。为了使预测帧更精确, 就要找与参考宏块最佳匹配图像编码的宏块。也就是说这两个宏块间的数据差值最小,找到最佳宏块后就找到最佳运动矢量(包含x轴和y轴方向的移动矢量)。在图像压缩的过程中,寻找最佳匹配占了相当多的计算时间,匹配越好, 图像重构质量就越高。

二、帧内压缩VS帧间压缩

1.帧内压缩

帧内压缩(Intraframe compression)也称为空间压缩(Spatial compression),仅考虑本帧的数据而不考虑相邻帧之间的冗余信息。这种方法和我们拍照时的压缩方式类似。它的优势是每一帧数据都完整，后期调色时不会损失清晰度，缺点是数据量较大，对存储构成了一定的压力。

2.帧间压缩

帧间压缩(Interframe compression)也称为时间压缩(Temporal compression),是基于许多视频或动画的连续前后两帧具有很大的相关性(即连续的视频其相邻帧之间具有冗余信息)的特点来实现的。通过比较时间轴上不同帧之间的数据实施压缩,进一步提高压缩比。帧间压缩会考虑到两帧之间冗余信息，实际上压缩时只考虑两帧之间变化的信息，这样帧与帧之间就被关联起来。这种压缩的好处在于保证画质的前提下有效减少了视频体积，缺点就是调色时会损失画质，后期的空间也要更小。帧间压缩主要考虑后一个画面相对前一个画面变化的部分。

三、CBR(恒定比特率) VS VBR（可变比特率）

1.CBR（Constants BitRate）即固定码率，静态（恒定）比特率的意思，CBR是一种固定采样率的压缩方式。优点是压缩快，能被大多数软件和硬件设备支持，缺点是占用空间相对大，效果不十分理想。理论上VBR可以完全代替CBR，但实际中有很多的设备限制，所以现实工作中，我们既需要VBR，也需要CBR。例如老的DVD硬件播放器就通常使用兼容较好的CBR。

2.VBR（Variable Bitrate）动态比特率。根据视音频的即时数据量，采用统计复用的方式随时调整比特率，这是以质量为前提兼顾文件大小的方式，推荐编码模式。和传统的CBR编码不同，VBR采取了一种全新的，全程动态调节技术的压缩方法。VBR在控制文件大小的情况下，最大限度的提高了视音频质量。

四、前期拍摄文件：

1. 机内压缩格式类型：R3D；AVCHD(MTS)；XAVC；MXF；MOV；MP4。

各相机厂商一般都会有自己的格式。

2. 针对记录内容的文件形式：LOG文件；RAW文件；HDR文件。

（1）LOG文件：俗称“灰片”，log文件即摄影机在机内编码过程中加入了一种伽马曲线，提高宽容度，保留更多的的细节。各大厂商一般都有自己的LOG,如SONY的S-LOG,DJI的D-LOG，Canon的C-LOG等。

（2）RAW文件：直接从感光元件上获取的未经处理的元数据文件格式，或称为数字底片。分为图片RAW和视频RAW。在视频领域，主要有：RED RAW；ARRI RAW；CINEMA DNG。

CINEMA DNG是Adobe开发的一种开源RAW封装格式，既用于视频领域，也用于图片领域，开源的特性使得任何摄影机厂商都可用DNG来封装RAW。目前BlackMagic公司的BMCC和BMPC采用DNG封装RAW。

（3）HDR文件：High-Dynamic Range(高动态范围图像)，动态范围是指图像中所包含的从“最亮”至“最暗”的比值，也就是图像从“最亮”到“最暗”之间灰度划分的等级数；动态范围越大，所能表示的层次越丰富，所包含的色彩空间也越广。那高动态范围(HDR)顾名思义就是从“最亮”到“最暗”可以达到非常高的比值。HDRI（High-Dynamic Range Image）就是记录采用了HDR技术的图象数据文件。常用的HDRI文件有OpenEXR、Radiance RGBE、FloatTIFF三种格式。

①OpenEXR文件格式：OpenEXR是由工业光魔（Industrial Light & Magic）开发的一种HDR标准。OpenEXR文件的扩展名为.exr，常见的OpenEXR文件是FP16（16bit Float Point，也被称为half Float Point）数据图像文件，每个通道的数据类型是FP16，一共四个通道64bpp，每个通道1个bit位用来标志“指数”，5个bit用来存放指数的值，10个bit存放色度坐标（u，v）的尾数，其动态范围从6.14 × 10 ^ -5到6.41 × 10 ^ 4。在OpenEXR的算法里面共使用16bit来表示光照数据。虽然看起来和使用16bit亮度通道运算位数相同，但是OpenEXR巧妙的采用了1个bit位用来标志“指数”，5个bit用来存放指数的值，10个bit存放色度坐标的尾数。这样就轻易的解决了浮点数值由于位数少而精度不高的问题。大大的拓宽的在FP16下的动态范围。

②Radiance RGBE文件格式：RGBE文件的扩展名为.hdr，RGBE正式名称为Radiance RGBE格式。这个本来是BR、FR等作为radiance材质的一种格式，也叫做radiance map，后来成为流行的一种HDR格式。所谓E，就是指数。Radiance RGBE文件每个通道为8bit BYTE数据类型，4个通道一共是32 bit。RGBE可以使用RLE压缩编码压缩，也可以不压缩。由文件头、RGBE数据组成。

③FloatTiff文件格式：Tiff文件的扩展名为.tif(.tiff)，FloatTiff每个通道为FP32(32bit Float Point)类型，一共3个通道96bpp。用Tiff文件存储HDR数据，直接将HDR的FP32保存到TIFF文件中，有官方库可以利用。

Davinci Resolve Studio

第二章：专业编码格式→ 影视后期

一、简介

1.优势：中间编码格式，专为后期而生，除了帧内压缩，还有一最大优势就是经过多次迭代转码，质量损失极小。影视后期统一编码很重要，混乱的编码导致的莫名其妙问题会让你抓狂。

2.Mac系统：用ProRes（尤其是用FCP剪辑时更好）。

3.Win系统：早期DNx独霸天下；现在Cineform后起之秀逐渐流行。

这三个格式在Mac和Win下表现都很好，这样分完全是出于强迫症。

二、ProRes编码（Apple公司开发）

0.封装格式：Quicktime MOV；

1.Apple ProRes 4444 XQ；

带alpha通道；4:4:4采样；12bit位深（alpha最高达16bit）；1080P25Fps码率达400Mbps左右

2.Apple ProRes 4444；

带alpha通道；4:4:4采样；12bit位深（alpha最高达16bit）；1080P25Fps码率达300Mbps左右

3.Apple ProRes 422 HQ；

4:2:2采样；10bit位深；1080P25Fps码率达200Mbps左右

4.Apple ProRes 422；

4:2:2采样；10bit位深；1080P25Fps码率达120Mbps左右

5.Apple ProRes 422 LT （适合作为素材存储格式；画质不错而体积相对小）；

4:2:2采样；10bit位深；1080P25Fps码率达80Mbps左右

6.Apple ProRes 422 Proxy （代理格式，适用于代理剪辑）；

4:2:2采样；10bit位深；1080P25Fps码率达40Mbps左右

7.Apple ProRes RAW。

三、DNxHD/DNxHR（Avid公司开发）

DNxHD早期针对高清；DNxHR是之后针对2K、4K新升级的编码方案。

1.DNxHD

封装格式：很开源，有很多封装方案。MXF封装；MOV封装

DNxHD 36 145 220 220x 444

DNxHD官方数据标准系数表

2.DNxHR

DNxHR LB (Low Bandwidth低带宽画质)；

DNxHR SQ (Standard Quality标准画质)；

DNxHR HQ (High Quality高画质)；

DNxHR HQX (高画质扩展)；

DNxHR 444。

四、Go Pro Cineform（Go Pro公司开发）

采用mov或avi格式封装。

GoPro CineForm编码提供以下3种标准：

（1）YUV 10位 4:2:2

（2）RGBA 12位 4:4:4:4（带有alpha通道）

（3）CineForm RAW 12位

GoPro CineForm有五种质量选项：为低、中、高、胶片扫描1、胶片扫描2。在一些剪辑软件中，这五种质量选项以1、2、3、4、5表示。

胶片扫描模式被设计用来在胶片扫描时准确再现胶片颗粒特征。

在一般的后期制作流程中，“高”，和胶片扫描1”是非常合适的选择。

如果用户有非常高的后期制作流程要求，如大尺度地放缩图像，可以考虑使用胶片扫描2。否则“胶片扫描1”和“高”是最佳设置。

如果考虑到硬盘空间，“中”是一个折中的选择。

通常不建议选择“低”，低质量的文件经过多次编码输出后，质量有较大损失。

五、Grass Valley Canopus HQ/HQX（Edius公司开发）

HQX是HQ的升级版，增加了10bit、4K编辑等。

Adobe Premiere Pro CC

第三章：出片格式与编码（以PR中H.264编码为例）

一、MPEG4(MP4)/H.264

1.基本视频设置

（1）大小尺寸：720P；1080P；4K

（2）帧速率：25fps

（3）场序：逐行

（4）（像素）长宽比：方形像素（1.0）

（5）电视标准：PAL ; NTSC

NTSC电视标准，每秒29.97帧（简化为30帧），电视扫描线为525线，偶场在前，奇场在后，标准的数字化NTSC电视标准分辨率为720*486, 24比特的色彩位深，画面的宽高比为4：3。NTSC电视标准用于美、日等国家和地区。

PAL电视标准，每秒25帧，电视扫描线为625线，奇场在前，偶场在后，标准的数字化PAL电视标准分辨率为720*576, 24比特的色彩位深，画面的宽高比为4：3, PAL电视标准用于中国、欧洲等国家和地区。

（6）配置文件：基线；主要；高

高级视频编码（Advanced Video Coding）亦称AVC，设有3个类型：Baseline（最低级别，基线）支持I/P 帧，只支持逐行扫描和CAVLC，适用于移动设备用视频的编码。一般用于视频通话、手机视频等。 Main（主要级别，主要）提供I/P/B 帧，支持逐行扫描和隔行扫描，同样提供对于CAVLC 和CABAC（见附注）的支持，适用于标准编码。用于mp4、便携的视频播放器、PSP和ipod等。 High（高精度级别，高）在Main的基础上增加了内部预测、自定义量化、无损视频编码和更多的YUV 格式，适用于高清编码。用于广播及视频光盘、蓝光光盘和高清电视。

（7）级别：4.1

等级越高相应的分辨率越高，比特率越高。

（8）以最大深度渲染。

2.比特率设置

比特率编码

VBR可变比特率目标比特率；最大比特率

VBR 2次画质更好，但也要花费更多的时间渲染

CBR恒定比特率(一种固定采样率的压缩方式，效果不十分理想，现已逐步被VBR取代。)

3.高级设置

关键帧间隔：减少关键帧距离将会提高图像的整体品质。一个较小的关键帧距离对应于一个较大的输出文件。

4.其他设置

（1）使用最高渲染质量。

（2）时间插值：帧采样；帧混合；光流法。

（主要是针对做了变速的的视频，其间可能会出现问题导致视频卡顿或抖动，时间插值即是用来在一定程度上解决这个问题的）

“光流法”可以插入丢失的帧，以便进行时间重映射，并且从按惯例拍摄的素材中产生更好的外观和更流畅的慢动作。光流插值非常适合修改这类剪辑的速度：这些剪辑包含无动作模糊的对象，对象在大体为静态的背景前面移动，背景与动作中的对象形成高度对比。“帧采样”可根据需要重复或删除帧，以达到所需的速度。“帧混合”可重复帧，还能根据需要在帧之间进行混合，帮助提高动作的流畅度。简单的说，帧采样是按帧顺序进行加减帧计算，帧混合是前后帧平均计算，光流法是对中间帧的像素分析后生成新的帧。

5.补注，HEVC(H.265):

高效视频编码(High Efficiency Video Coding)，是针对4K市场而产生的编码方案，压缩率是H.264的一半左右，支持4KHD/8KHD/1080PHD/720PHD,支持8 位编码和 10 位编码，其中包含高动态范围和 Rec2020。

二、Quicktime（MOV）

苹果系统的原生格式编码，默认采用MPEG4压缩。

MOV与AVI，由于两种格式都采用的是有损压缩，所以文件在一定程度上会丢损一些质量。然而，AVI使用MEPG 2来进行压缩，而MOV采用的是MPEG 4。从技术角度说，如果将两种格式文件放在同一个视频基准下比较，我们会发现MOV电影质量更好。QT若想用ProRes压缩，需在MAC系统下。

三、FLV

FLV 是FLASH VIDEO的简称，FLV流媒体格式是随着Flash MX的推出发展而来的视频格式。由于它形成的文件极小、加载速度极快，使得网络观看视频文件成为可能，它的出现有效地解决了视频文件导入Flash后，使导出的SWF文件体积庞大，不能在网络上很好的使用等缺点。

四、F4V

是Adobe公司为了迎接高清时代而推出继FLV格式后的支持H.264的F4V流媒体格式。它和FLV主要的区别在于，FLV格式采用的是H263编码，而F4V则支持H.264编码的高清晰视频，码率最高可达50Mbps。

五、swf

动画设计软件Flash的专用格式，被广泛应用于网页设计、动画制作等领域，swf文件通常也被称为Flash文件。

六、AVI

英文全称为Audio Video Interleaved，即音频视频交错格式。是将语音和影像同步组合在一起的文件格式。它对视频文件采用了一种有损压缩方式，但压缩比较高，因此尽管画面质量不是太好，但其应用范围仍然非常广泛。AVI支持256色和RLE压缩。AVI信息主要应用在多媒体光盘上，用来保存电视、电影等各种影像信息。

七、AS-10/AS-11

MXF规范下胶片标准的文件格式，法国电影公司StudioCanal制定的标准。

1.AS-10:采用AS-10胶片标准压缩，使用索尼的XDCAMHD编码压缩。

2.AS-11:采用AS-11胶片标准压缩，使用索尼的IMX编码（mpeg-2）压缩标清SD文件，使用AVC-Intra编码压缩高清HD文件。

八、MXF OP1a

MXF是英文Material eXchange Format（素材交换格式）的缩语。MXF是SMPTE（美国电影与电视工程师学会）组织定义的一种专业音视频媒体文件格式。MXF主要应用于影视行业媒体制作、编辑、发行和存储等环节。SMPTE为其定义的标准包括：SMPTE - 377M、SMPTE - EG41、SMPTE - EG42等，并不断进行更新和完善。

九、Open EXR

一般用于Maya等三维软件导出到Nuke等合成软件中进行合成时使用的文件格式。可以很好的保留Nuke合成所需要的几乎所有的细节和通道信息。 C4D也可导AE。图片序列格式。

十、P2影片

松下出的影片格式标准。采用MXF格式封装，配用同是松下开发的广播级压缩方案DVCPRO和AVC-Intra。AVC-Intra可以看成是对DVCPRO的升级，符合H.264/MPEG-4 AVC压缩标准，并采用帧内压缩（I-Only），而非HDV所使用的帧间压缩（Long GOP）。

注：

HDV是由佳能、夏普、索尼、JVC四大厂商推出的一种使用在数码摄像机上的高清标准,采用MPEG-2压缩。

在此一并提一下索尼的压缩方案，

AVCHD是索尼(Sony)公司与松下电器(Panasonic)于2006年5月联合发表的高画质光碟压缩技术，AVCHD标准基於MPEG-4AVC/H.264视讯编码，支援480i、720p、1080i、1080p等格式，同时支援杜比数位5.1声道AC-3或线性PCM 7.1声道音频压缩。

XAVC格式是索尼2013年正式推出的视频编码格式。该格式有诸多优点，包括可以处理HD、2K、QFHD到4K所有分辨率，以及可以实现高帧率拍摄等。从画质和占用资源角度考虑，Sony XAVC 4K已被业界认为是4K节目制作、流通与交换的最佳格式。XAVC 4K能够用合理的码率记录QFHD(3840x2160)和DCI (4096x2160))视频。码率适中，符合广电节目对速度与质量的双重需求。索尼将一直应用在高端领域的XAVC应用到了消费级别领域，命名为XAVC-S, 以取代AVCHD，之前专业领域的XAVC使用的是MXF的封装，而XAVC-S用的是MP4的封装。

十一、Windows Media（WMV）

由Microsoft制定的PC标准视频格式。

十二、Wraptor DCP

电影放映机播放的格式。

十三、VOB文件(DVD文件)

VOB，也叫DVD规格“视频对象”。它是DVD视频介质的数字视频，音频和字幕的一种容器格式。

Adobe Photoshop CC

第四章：图片格式（以Photoshop输出格式为例）

一、RAW格式

RAW图像就是CMOS或者CCD图像感应器将捕捉到的光源信号转化为数字信号的原始数据。RAW文件是一种记录了数码相机传感器的原始信息，同时记录了由相机拍摄所产生的一些元数据(Metadata，如ISO的设置、快门速度、光圈值、白平衡等)的文件。RAW是未经处理、也未经压缩的格式，可以把RAW概念化为"原始图像编码数据"或更形象的称为"数字底片"。RAW格式的全称是RAW Image Format，在编程中称之为原始。

各大相机厂商的RAW文件

二、软件专用格式

1.PSD格式

Photoshop的专用格式。

2.AI格式

矢量图形绘制软件Illustrator的专用图形文件格式。

3.CDR格式

矢量图形绘制软件CorelDRAW的专用图形文件格式。

三、常用图片格式（单图VS序列文件）

1.JPEG

静态图像有损压缩格式，Joint Photographic Experts Group(联合图像专家小组)的缩写。

JPEG2000：作为JPEG的升级版，其压缩率比JPEG高约30%左右，同时支持有损和无损压缩。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输，即先传输图像的轮廓，然后逐步传输数据，不断提高图像质量，让图像由朦胧到清晰显示。此外，JPEG2000还支持所谓的"感兴趣区域" 特性，可以任意指定影像上感兴趣区域的压缩质量，还可以选择指定的部分先解压缩。JPEG2000和JPEG相比优势明显，从无损压缩到有损压缩可以兼容，而JPEG不行，JPEG的有损压缩和无损压缩是完全不同的两种方法。JPEG2000即可应用于传统的JPEG市场，如扫描仪、数码相机等，又可应用于新兴领域，如网路传输、无线通讯等等。

2.PNG

高级别无损压缩格式，带alpha通道。目的是试图替代GIF和TIFF文件格式，同时增加一些GIF文件格式所不具备的特性。PNG图像序列（PNG，图像文件存储格式，其目的是试图替代GIF和TIFF文件格式，同时增加一些GIF文件格式所不具备的特性。可移植网络图形格式(Portable Network Graphic Format，PNG)名称来源于非官方的'PNG's Not GIF'，是一种位图文件(bitmap file)存储格式，读成'ping'。PNG用来存储灰度图像时，灰度图像的深度可多到16位，存储彩色图像时，彩色图像的深度可多到48位，并且还可存储多到16位的α通道数据。PNG使用从LZ77派生的无损数据压缩算法）

3.BMP

未压缩普通的位图格式。BMP（全称Bitmap）是Windows操作系统中的标准图像文件格式，可以分成两类：设备相关位图（DDB）和设备无关位图（DIB），使用非常广。它采用位映射存储格式，除了图像深度可选以外，不采用其他任何压缩，因此，BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时，图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准，因此在Windows环境中运行的图形图像软件都支持BMP图像格式。

4.DPX

数字图像交换格式（Digital PictureExchange）。DPX是在柯达公司的 Cineon文件格式发展出的基于位图(bitmap)的文件格式。它是电影电视工程师协会（SMPTE）在Cineon文件格式的基础上加上一系列头文件(header information)后的格式。它是用来储存和表达运动图画或视频流的每一个完整帧而发展出的格式。多个DPX文件可以表示运动图画的片断和序列，用于在多种电子和计算机设备上交换和处理这些以完整帧为单位的运动视频。它是数字电影和DI工作中最重要的文件格式之一。由于DPX格式常用于高质量的合成、数字电影、和胶片电影等应用，所以应该尽量避免使用以软“代理”软件转换的任何方案。应该使用基于硬件的、原始处理 DPX和Cineon文件的方案。

5.GIF

即我们平时所说的动图。GIF(Graphics Interchange Format)的原义是"图像互换格式"，是CompuServe公司在 1987年开发的图像文件格式。GIF文件的数据，是一种基于LZW算法的连续色调的无损压缩格式。GIF只支持256色以内的图像；采用无损压缩存储，压缩过程中，图像的像素资料不会被丢失，然而丢失的却是图像的色彩;支持alpha通道；可以制作动画。

6.Targa

数字化图像，以及运用光线跟踪算法所产生的高质量图像的常用格式。

TGA是Truevision公司推出的格式，属于一种图形、影片数据通用格式，大部分文件为24位或32位真色彩，它是专门捕获电视影片所设计的一种格式，按行存储和进行行压缩，是把计算机产生的高质量影片向电视转换的首选格式。TGA图像格式最大的特点是可以做出不规则形状的图形、图像文件，一般图形、图像文件都为四方形，若需要有圆形、菱形甚至是缕空的图像文件时，TGA可就派上用场了! TGA格式支持压缩，使用不失真的压缩算法。是一种比较好的图片格式。

7.TIFF

标签图像文件格式，Tiff是一种比较灵活的图像格式，全称是tagged image file format，支持256色、24位真彩色、32位色、48位色等多种色彩位，同时支持RGB、CMYK以及YCBCR等多种色彩模式，支持多平台，文件体积大，信息量也比较多。

8. IFF

IFF是Amiga等超级图形处理平台上使用的一种图形文件格式。Amiga（阿米加）计算机平台专门为高分辨率，快速的图形响应，多媒体任务，特别是游戏方面设计。

9. SGI

SGI工作站图像。SGI(Silicon Graphics )美国硅图公司，成立于1982年，是一个生产高性能计算机系统的跨国公司，总部设在美国加州旧金山硅谷。

10. EXIF

可交换的图像文件格式(EXchangeable Image file Format) ，1994年富士公司提倡的数码相机图像文件格式，其实与JPEG格式相同，区别是除保存图像数据外，还能够存储摄影日期、使用光圈、快门、闪光灯数据等曝光资料和附带信息以及小尺寸图像。

11. ICO

Windows的图标文件格式

Adobe Audition CC

第五章：音频格式（以Audition输出格式为例）

一、MP3

MP3是利用 MPEG Audio Layer 3 的技术，将音乐以1:10 甚至 1:12 的压缩率，压缩成容量较小的文件，换句话说，能够在音质丢失很小的情况下把文件压缩到更小的程度，而且还非常好的保持了音质。最高比特率320K，高频部分一刀切是他的缺点，音质不高！

二、WMA

Windows Media Audio，是微软力推的一种音频格式。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的，其压缩率一般可以达到1:18，生成的文件大小只有相应MP3文件的一半。128kbps为wma最优压缩比，128kbps wma=192kbps mp3。

三、WAV

WAV格式是微软公司开发的一种声音文件格式，也叫波形声音文件，是最早的数字音频格式，被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道，采用44.1kHz的采样频率，16位量化位数，因此WAV的音质与CD相差无几，但WAV格式对存储空间需求太大不便于交流和传播。无损格式；体积十分大。

四、ASF

Advanced Streaming Format，是微软所制订的一种媒体播放格式，适合在网络上播放。

五、FLAC

FLAC即是Free Lossless Audio Codec的缩写，中文可解为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码，其特点是无损压缩。不同于其他有损压缩编码如MP3 及 AAC，它不会破任何原有的音频资讯，所以可以还原音乐光盘音质。简而言之，FLAC与MP3相仿，但是是无损压缩的，也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似，但是FLAC将给你更大的压缩比率，因为FLAC是专门针对音频的特点设计的压缩方式，并且你可以使用播放器播放FLAC压缩的文件，就象通常播放你的MP3文件一样。为无损格式，较ape而言，他体积大点，但是兼容性好，编码速度快，播放器支持更广。

六、APE

APE是目前流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同，APE是一种无损压缩音频技术，也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后，你还可以再将APE格式的文件还原，而还原后的音频文件与压缩前的一模一样，没有任何损失。APE的文件大小大概为CD的一半，但是随着宽带的普及，APE格式受到了许多音乐爱好者的喜爱，特别是对于希望通过网络传输音频CD的朋友来说，APE可以帮助他们节约大量的资源。为无损压缩格式，较flac而已，他体积较小。编码速度偏慢。

七、AAC

AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式，它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同，AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之，AAC可以在比MP3文件缩小30%的前提下提供更好的音质。目前最好的有损格式之一。有多种编码，faac，nero为常见，比特率最高448kbps。

八、AIFF

AIFF是音频交换文件格式（Audio Interchange File Format）的英文缩写，是一种文件格式存储的数字音频（波形）的数据，AIFF应用于个人电脑及其它电子音响设备以存储音乐数据。AIFF支持ACE2、ACE8、MAC3和MAC6压缩，支持16位44.1kHz立体声。

九、OGG

Ogg全称应该是OGG Vobis，是一种新的音频压缩格式，类似于MP3等现有的音乐格式。但有一点不同的是，它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点，就是支持多声道，随着它的流行，以后用随身听来听DTS编码的多声道作品将不会是梦想。

十、CD

*.cda格式，就是CD音轨。标准CD格式也就是44.1K的采样频率，速率88K/秒，16位量化位数，因为CD音轨可以说是近似无损的，因此它的声音基本上是忠于原声的，因此如果你如果是一个音响发烧友的话，CD是你的首选。CD光盘可以在CD唱机中播放，也能用电脑里的各种播放软件来重放。一个CD音频文件是一个＊.cda文件，这只是一个索引信息，并不是真正的包含声音信息，所以不论CD音乐的长短，在电脑上看到的“＊.cda文件”都是44字节长。不能直接的复制CD格式的＊.cda文件到硬盘上播放，需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV，这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话，可以说是基本上无损抓音频。

十一、MID

MID是midi的简称，是它的扩展名。MIDI是英语Music Instrument Digital Interface 的缩写，翻译过来就是“数字化乐器接口”，也就是说它的真正涵义是一个供不同设备进行信号传输的接口的名称。我们如今的MIDI音乐制作全都要靠这个接口，在这个接口之间传送的信息也就叫MIDI信息。

十二、总结：

1.同音质下压缩比为：aac>ogg>mp3(wma)>ape>flac>wav。

2.mp3和wma以192kbps为分界线，192kbps以上mp3好，以下wma好。

3.最高音质：wav=flac=ape>aac>ogg>mp3>wma。

格式编码详解
第一章：视频编码必备知识点（以Davinci及QT格式为例）一、封装格式VS编码格式在DaVinci Reso...
滑动宫格验证码都给碰上了？没事儿，看完此文分分钟拿下！
本节我们将介绍新浪微博宫格验证码的识别。微博宫格验证码是一种新型交互式验证码，每个宫格之间会有一条指示连线，指示了...
Linux命令参数
Tar命令: -c:归档 -x:解归档 -z:gzip格式 -j:bzip2格式
【Python】Python3网络爬虫实战-45、微博宫格验证码
本节我们来介绍一下新浪微博宫格验证码的识别，此验证码是一种新型交互式验证码，每个宫格之间会有一条指示连线，指示了我...
Python3网络爬虫开发实战] 8.4-微博宫格验证码的识别
本节我们来介绍一下新浪微博宫格验证码的识别，此验证码是一种新型交互式验证码，每个宫格之间会有一条指示连线，指示了我...
返回码详记
100 Continue 初始的请求已经接受，客户应当继续发送请求的其余部分。 101 Switching Pro...
创业者为什么必须控制好心态？
本文摘自《我把一切告诉你》作者蓝小雨，更多实操案例分享详群文件：292666931验证码320 创业从成立公司到解...
解码
彪悍的人生不需要解释，自我觉醒的人生不需要督促。虽然今天是星期天，可以给自己放一天假，但是脑子里突然间有了题材，...
URLEncoder编解🐎
如下方法报了一个 java.net.URISyntaxException异常为什么会报这个异常呢？我是url 出...
Netty4（四）：Codec 编码与解码
什么是 Codec 网络中都是以字节码的数据形式来传输数据的，编写一个网络应用程序需要实现某种 codec (编解...

格 式 编 码 详 解