30.深度学习模型压缩方法-4

作者: 大勇任卷舒 | 来源:发表于2022-12-22 16:25 被阅读0次

基于低秩分解的深度神经网络压缩与加速的核心思想是利用矩阵或张量分解技术估计并分解深度模型中的原始卷积核
- 卷积计算是整个卷积神经网络中计算复杂度最高的计算操作，通过分解４Ｄ卷积核张量，可以有效地减少模型内部的冗余性
- 此外对于２Ｄ的全连接层矩阵参数，同样可以利用低秩分解技术进行处理
- 但由于卷积层与全连接层的分解方式不同，本文分别从卷积层和全连接层２个不同角度回顾与分析低秩分解技术在深度神经网络中的应用
从理论上利用低秩分解的技术并分析了深度神经网络存在大量的冗余信
息，开创了基于低秩分解的深度网络模型压缩与加速的新思路
- 如图所示，展示了主流的张量分解后卷积计算

评价指标	特点
准确率	目前,大部分研究工作均会测量 Top-1 准确率,只有在 ImageNet 这类大型数据集上才会只用 Top-5 准确率.为方便比较
参数压缩率	统计网络中所有可训练的参数,根据机器浮点精度转换为字节(byte)量纲,通常保留两位有效数字以作近似估计.
运行效率	可以从网络所含浮点运算次数(FLOP)、网络所含乘法运算次数(MULTS)或随机实验测得的网络平均前向传播所需时间这 3 个角度来评价

网友评论

本文标题：30.深度学习模型压缩方法-4

本文链接：https://www.haomeiwen.com/subject/uqymqdtx.html

30.深度学习模型压缩方法-4