来聊聊WebP的原理

作者: 三石青韦 | 来源:发表于2022-03-04 09:15 被阅读0次

来聊聊WebP的原理
WebP全面支持
WebP的工作原理
Webpack(二十六)：如何编写一个WebPack的插件原理及
2019-01-28 图片压缩格式
iOS pod 安装libwebp0.6.0 Error
Android播放webp和gif的一种方法(接上篇)
webp应用实践-gradle插件
WebP 技术原理及应用
Android重学系列 BroadcastReceiver原理

前言

前端常用的图片格式：JPG、PNG、GIF、WEBP、APNG等等。

主要图片格式背景以及信息

JPEG（Joint Photographic Experts Group）联合图像专家组

成立于1986年，该标准于1992年正式通过，在JPEG中主要包含4中模式：

无损压缩编码模式
基于DCT的顺序编码模式
基于DCT的累进编码模式
基于DCT的分层编码模式。

针对JPEG的大火，应用领域越来越广，为了增加压缩比，有出现了JPEG2000标准，此标准完全抛弃了DCT（离散余弦变换），而采用了离散小波变换。

离散余弦变换：是以区块编码为主的方式，将图片压缩成8x8的小块存储到文件中，所以图片在加载时，会一行一行的刷新。

离散小波变换：是以多解析编码方式，主要将影响频率成分抽取出来，将图片作为整体变换和编码，所以图片在加载时，会直接展示模糊的图片轮廓，然后逐渐变清晰。

GIF（Graphics Interchange Format）图形交换格式

1987年由Compu Serve公司发展起来，为了填补跨平台图像格式。GIF是一种位图，即每个像素填充一种颜色，最多支持256种颜色。GIF采用的是LZW（Lempel-Zev-Welch）压缩算法，比较适合色彩较少的场景，对于一些复杂颜色的场景GIF的表现力就比较有限。GIF通常会自带一个调色板，存放需要使用的颜色，所以压缩时，我们要减少图像使用的颜色。

GIF包含2个版本：GIF87a和GIF89a

GIF87a: 1987年推出，允许存储一个图像，严格不支持透明像素，，采用LZW压缩算法，保证图像质量的前提下，能压缩20%-25%
GIF89a：1989年推出，允许一个文件存储多个图像，可实现动画功能，允许某些像素透明（我们常见的gif图）

PNG（Portable Network Graphics）

1995年，因GIF的LZW数据压缩算法的软件专利开始收费，为避免影响，诞生了PNG，1999年unisys公司进一步中止了GIF的专利免费许可，让PNG才开始获得更多关注，所以业内浏览器很晚才开始支持PNG，IE在7.0才正式支持PNG格式的。（开发过IE6的同学一定很痛苦）

无损压缩：采用了LZ77算法的派生算法进行压缩，他利用特殊编码方式标记重复出现的数据，因此对图像颜色没有影响。
索引彩色模式： PNG-8格式与GIF图像类似，同样采用8位调色板将RGB彩色图像转换为索引彩色图像，图像中保存的不再是各个像素的彩色信息，而是从图像中挑选出来的具有代表性的颜色标号，没一个标号对应一种颜色，图像数据量也因此减少。
更优化的网络传输：PNG图像采用流式浏览，所以在图片下载前，可以提供给浏览者一个基本图像内容，然后慢慢清晰起来。
支持透明效果：PNG可以为原图像定义256个透明层次，使得彩色图像边缘能与任何背景平滑融合，从而消除锯齿边缘。

WebP (WebM文件里单个被压缩的帧)

WebP的文件格式来源于Google的VP8视频编解码（WebM），VP8编解码最大特性是帧内预测压缩，也就是视频的每一帧都被压缩，后续帧与帧之间也会被压缩。

WebP的名称由来：WebM文件里单个被压缩的帧。

自从2011年发布以来，webP作为一个独特文件类型做了很多升级与改变，例如支持透明度、无损模式、动画支持等。

2013年支持了动态WebP。

接下来我们来深入了解一下为什么有损WebP（lossy WebP）的压缩能力如此之强吧。

WebP的压缩的原理

第一步：宏块

与JPG相同的时，WebP也采用宏块进行压缩，典型的宏块由一个 16×16 的亮度像素(luma pixel)块和两个 8×8 的色度像素(chroma pixel)块组成。分块越小，预测越准，需要记录的信息也越多，一版来说，细节月丰富的地方，分块越细。相对不丰富的地方使用16x16分块。

image.png

第二步：预测

WebP最大的不同之处在于每个4x4的宏块中都有一个预测模型。（又名：过滤），PNG过滤用的比较多，它对每一行做同样的事，WebP过滤是针对每一个块。

VP8帧内预测常用的三种宏块：

4x4 亮度像素块
16x16 亮度像素块
8x8 色度像素块

编码器会将它们放在一个4x4的测试像素块填满，并确定哪一个生成了最接近原始块的值。这些用不同方法填满的块叫做”预测块”。

主要使用的预测方式有以下4种：

H_PRED（Horiz prediction-水平预测)——像素块中每一列使用左边一列（col L）的数据填充
V_PRED (vertical prediction-垂直预测)——像素块中每一行使用其上边一行（row A）的数据填充
DC_PRED (DC prediction - DC 预测)——像素块中每个单元使用 row A 和 col L 的所有像素的平均值填充。
True Motion (TrueMotion 预测)——一种超级先进的模式，我没找到原理，暂时还不懂。

image.png

对于4x4的亮度块，会有6种额外预测模式，类似于垂直预测与水平预测方式，他们可以从不同的方向去填充剩余色块。

第三步：DCT（离散余弦变换）

将预测部分的原图数据减去预测出来的数据，得到差值矩阵，最后对差值进行DCT。此步骤会生成一个频率系数矩阵，坐上的系数幅度最大，右下的最小，幅度值越小，频率越高。大部分图片信息都在左上区域，这一步的作用就是朱熬出图片的高频区域和低频区域。

第四步：量化

人眼对高频部分不敏感，这一步会将高频部分舍去。对上一步的频率系数表和量化表进行计算，将频率系数表和量化表按位相除，并四舍五入整数位，最终生成一个量化矩阵。

第五步：算法编码

WebP不同于JPEG，也可以说由于JPEG压缩的地方在于，WebP采用了算法编码压缩（Arithmetic encoding），JPEG采用的是霍夫曼编码（Huffman encoding），算法编码提供了优于霍夫曼编码5%-10%的压缩率。

总结

WebP的压缩优于其他图片，主要得益于起继承自VP8的帧内预测技术，相比于JPEG对图像原值进行编码来说，WebP编码的是预测值和原值的差值，这也是WebP体积更小的主要原因，最后，WebP使用了更优秀的算法编码。

这个WebP的压缩过程用，一张图可以囊括表述：

image.png

当然以上主要是针对WebP的有损压缩（lossy WebP）来进行的原理讲解，无损压缩的逻辑与其完全不同，不过我们提高性能，主要也是采用的有损WebP。

希望以上内容，对大家了解WebP的原理有一定的帮助，能让大家更好的去使用WebP。

网友评论

本文标题：来聊聊WebP的原理

本文链接：https://www.haomeiwen.com/subject/zhvprrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

来聊聊WebP的原理

前言

主要图片格式背景以及信息

JPEG（Joint Photographic Experts Group）联合图像专家组

GIF（Graphics Interchange Format）图形交换格式

PNG（Portable Network Graphics）

WebP (WebM文件里单个被压缩的帧)

WebP的压缩的原理

第一步：宏块

第二步：预测

第三步：DCT（离散余弦变换）

第四步：量化

第五步：算法编码

总结

这个WebP的压缩过程用，一张图可以囊括表述：

相关资料

相关文章