美文网首页
32.深度学习模型优化加速方法-1

32.深度学习模型优化加速方法-1

作者: 大勇任卷舒 | 来源:发表于2023-01-05 17:17 被阅读0次

32.1 模型优化加速方法

  • 模型优化加速能够提升网络的计算效率,具体包括:
    • Op-level的快速算法:FFT Conv2d (7x7, 9x9), Winograd Conv2d (3x3, 5x5) 等;
    • Layer-level的快速算法:Sparse-block net [1] 等;
    • 优化工具与库:TensorRT (Nvidia), Tensor Comprehension (Facebook) 和 Distiller (Intel) 等;

32.2 TensorRT加速原理

  • 在计算资源并不丰富的嵌入式设备上,TensorRT之所以能加速神经网络的的推断主要得益于两点:
    • 首先是TensorRT支持int8和fp16的计算,通过在减少计算量和保持精度之间达到一个理想的trade-off,达到加速推断的目的。
    • 更为重要的是TensorRT对于网络结构进行了重构和优化,主要体现在一下几个方面。
      • TensorRT通过解析网络模型将网络中无用的输出层消除以减小计算。
      • 对于网络结构的垂直整合,即将目前主流神经网络的Conv、BN、Relu三个层融合为了一个层,例如将图1所示的常见的Inception结构重构为图2所示的网络结构。
      • 对于网络结构的水平组合,水平组合是指将输入为相同张量和执行相同操作的层融合一起,例如图2向图3的转化。




  • 以上3步即是TensorRT对于所部署的深度学习网络的优化和重构,根据其优化和重构策略,第一和第二步适用于所有的网络架构,但是第三步则对于含有Inception结构的神经网络加速效果最为明显。
  • Tips: 想更好地利用TensorRT加速网络推断,可在基础网络中多采用Inception模型结构,充分发挥TensorRT的优势。

大数据视频推荐:
网易云课堂
CSDN
人工智能算法竞赛实战
AIops智能运维机器学习算法实战
ELK7 stack开发运维实战
PySpark机器学习从入门到精通
AIOps智能运维实战
腾讯课堂
大数据语音推荐:
ELK7 stack开发运维
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

相关文章

网友评论

      本文标题:32.深度学习模型优化加速方法-1

      本文链接:https://www.haomeiwen.com/subject/hsjjcdtx.html