通过剪枝和量化压缩Transformer

通过剪枝和量化压缩Transformer

作者: 静一下1 | 来源:发表于2021-03-11 22:42 被阅读0次

通过剪枝和量化压缩Transformer
模型压缩技术：剪枝、量化和蒸馏
模型压缩
深度学习之模型压缩（剪枝、量化）
模型压缩(一)模型量化、剪枝，张量分解
Transformer量化笔记
模型压缩（一）：剪枝
模型压缩：剪枝算法
Pytorch实现一模型压缩算法
28.深度学习模型压缩方法-2

量化

使用了两类量化方法，一类是K-Means的量化方法，方法如下，简单而言就是在最小值和最大值之间设立K个（这个K的大小表明了量化的精度，一般而言K越大量化精度越高，对应到量化的bit位也越高）centroids，然后将参数中的每一个权值就近到其中一个centroid，在具体存储的时候可以只使用每一个centroid的index

第二类方法是binary的方法，简单一点的方法是直接按符号进行二值化，文中对此作了进一步改进，将其使用两个值的均值进行替换，取名为BS-Flexible方法

剪枝

文中使用的是iterative magnitude pruning方法，这个方法特别简单，将权值小于某一个阈值的参数全部用零替换

结果

量化方面4bit的量化效果依然足够好，压缩比能够达到5倍多，剪枝方面效果相对有限，文中解释说有一些超参需要tuning（比如阈值），二值化的方法如果使用到整个transformer则效果比较差，但是如果能够只在self-attention上进行使用，则效果就会非常好（对应到BS-Flexible 1-bit att-quantization方法）

在self-attention的权值可视化方面，可以看到原始的和8bit，以及4bit的矩阵非常相似，并且量化能够使得参数矩阵更加的锐化

总结：在对transformer进行4bit量化，以及self-attention进行二值化后，依然能够取得相对较好的效果，说明transformer内部确实存在一些参数冗余的情况，这也给模型压缩带来了空间。

https://my.oschina.net/u/4594481/blog/4970442

相关文章

通过剪枝和量化压缩Transformer
量化使用了两类量化方法，一类是K-Means的量化方法，方法如下，简单而言就是在最小值和最大值之间设立K个（这个...
模型压缩技术：剪枝、量化和蒸馏
模型压缩大体上可以分为 5 种：模型剪枝：即移除对结果作用较小的组件模型量化：比如将 float32 降到in...
模型压缩
模型压缩的方法，常见的有剪枝（pruning）,量化，蒸馏。 pruning 先分析权重或者神经元的重要性，然后去...
深度学习之模型压缩（剪枝、量化）
作者：余晓龙随着深度学习的发展，模型变得越来越复杂，随之而来的模型参数也越来越多，对于需要训练的模型硬件要求也越...
模型压缩(一)模型量化、剪枝，张量分解
https://jackgittes.github.io/2018/08/24/paper-reading-10/...
Transformer量化笔记
前言 AI芯片（这里只谈FPGA芯片用于神经网络加速）的优化主要有三个方面：算法优化，编译器优化以及硬件优化。算法...
模型压缩（一）：剪枝
李宏毅 network compression https://www.youtube.com/watch?v=d...
模型压缩：剪枝算法
过参数化主要是指在训练阶段，在数学上需要进行大量的微分求解，去捕抓数据中的微小变化信息，一旦完成迭代式的训练之后，...
Pytorch实现一模型压缩算法
网络剪枝个人觉得是一种实用性非常强的网络压缩方法，并且可以和其它模型压缩方法如网络蒸馏、参数位压缩等进行组合，在保...
28.深度学习模型压缩方法-2
28.1 典型剪枝方法对比剪枝方法修剪对象修剪方式效果Deep Compression权重随机修剪50倍压缩St...

网友评论

本文标题：通过剪枝和量化压缩Transformer

本文链接：https://www.haomeiwen.com/subject/reooqltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|通过剪枝和量化压缩Transformer|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！