目录
1.历史
2.免专利费用
3.技术原理
1.历史
AV1(Alliance for Open Media Video 1)是一个开源、免版权费的用于互联网视频传输的视频编码格式,是google制定的VP9标准的继任者,是H265强有力的竞争者。
AOM(Alliance for Open Media )成立于2015年,是由半导体生产商、流媒体服务商和浏览器等公司组成的联盟,主要是为了解决H265昂贵的专利费用和复杂的专利授权问题,目标是成为新一代领先的免版权费的编码标准。
AV1的第一版参考编解码器0.1.0发布于2016年4月7号,2018年3月28号发布了AV1码流参考手册和参考编解码器软件。
目前AV1的参考编码器没有使用任何的速率优化算法,比现在的H265编码器的速度要慢好几个数量级。
2.免专利费用
AV1为了实现免版权费的目标,在开发的过程中,所有的特性必须在仔细检查没有侵犯竞争公司的专利下才能加被采纳。而H265的标准化过程并没有知识产权的检查流程。
3.技术
AV1是基于传统的分块频谱变换的格式,基于google的VP10标准,并结合了Xiph's/Mozilla的Daala视频编码标准和思科的Thor视频编码标准中的技术。
标准联盟发布了c语言和汇编语言实现的参考编解码器软件(aomenc,aomdec)。
有另一个开源的编码器rav1e是以损失效率为代价的最简单和最快的编码器。
3.1 数据传输
为了将预测后剩余的误差变换到频域,AV1使用正方形和矩形DCTS,以及非对称DST。介绍了VP10中开发的T形式划分方案。
3.2 块划分
可以基于更大单位的块划分(小于128*128)进行预测,并且可以以更多的方式进行细分。
3.3 预测
AV1以更高的精度(每个采样使用10位或12位)执行内部处理,因为参考图像中更小的舍入误差将提升压缩质量。
预测可以使用更先进的方式(比求平均值)复合预测方式,包括在不同方向上的平滑和尖锐的过渡梯度(楔形分区预测)以及基于两个预测值之间的差异的隐式掩模。这允许在同一块中使用两个帧间预测或帧间预测和帧内预测的组合。
AV1中的warped_motion和global_motion工具旨在通过识别由摄像机运动引起的模式来减少运动矢量中的冗余信息。
对于帧内预测,每个像素有56个而不是8个方向用于方向预测和加权滤波器。
3.4量化
AV1有新的更优的量化矩阵。
3.5 滤波器
环路滤波器阶段集成了Thor的约束低通滤波器和Daala定向去燥滤波器的集成已经取得了丰硕的成果,组合约束方向增强滤波器超过单独或一起使用原始滤波器的成果。
3.6 熵编码
Daala的熵编码器是一种非二进制算术编码器,用于替代VP9的二进制熵编码器。非二进制算法编码的使用由助于避开专利,但也增加了比特级别的并行性到另外的串行进程,从而降低了硬件实现中的时钟速率要求。
参考阅读:
- An Introduction to AV1 - The Next-Gen Royalty-Free Codec From the Alliance for Open Media google文档, 百度网盘连接
- https://en.wikipedia.org/wiki/AV1
网友评论