美文网首页
初窥TensorRT

初窥TensorRT

作者: _xuyue | 来源:发表于2019-08-22 16:17 被阅读0次

简介
TensorRT 是Nvidia推出了一套加速库,针对神经网络计算做出一系列优化。

优化内容

  1. 合并一些层
    1,1 Conv、BN、ReLu合并成一个CBR层
    1.2 取消Concat层。直接将concat层上一层的输出连接到需要的地方。
    1.3 以Inception为例,多个分支中的第一层均为1*1卷积,合并成一个。

  2. 并行
    多个分支,如果没有依赖关系,可以进行并行计算。

  3. 低精度
    支持FP16和INT8。在训练阶段,由于反向传播梯度可能比较小,因此需要高精度。但是在Inference阶段,不太需要高精度。

  4. 模型固定,可以对计算图进行优化(这个不太理解)

  5. Kernel Auto-tuning
    根据超参和输入大小的不同,选用不同的卷积计算方法

  6. Dynamic Tensor Memory
    减少内存reuse

参考链接
https://yq.aliyun.com/articles/580307
https://cloud.tencent.com/developer/news/329901

相关文章

  • 初窥TensorRT

    简介TensorRT 是Nvidia推出了一套加速库,针对神经网络计算做出一系列优化。 优化内容: 合并一些层1,...

  • 初窥

    初窥世界的美好 白的风 白的肌肤 和盈盈一握的腰肢 在你的头发里 有一个蓝色大海的梦 蓝的帆船和蓝的浪花 自然是美...

  • 初窥

    这个积分管理项目已经到收尾的阶段了,感受良多。 对于错误处理这方面这周我的规划也更为清楚一些了。明天如果能够预期结...

  • TensorRT Developer Guide

    TensorRT Developer Guide Overview NVIDIA TensorRT™是一个C ++...

  • 初窥南京

    古鸡鸣寺门外,一条长满爬山虎的墙。 城墙下的绿植。 1912街区,没有什么能过阻挡,我对自由的向往。 午后墙壁上斑...

  • 初窥HTTP

    要知道HTTP肯定要先知道WWW,下面我用思维导图来介绍下: 1,弄懂了上图的关系,接下来着重介绍HTTP。 先介...

  • 初窥Scrapy

    Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据...

  • mongodb初窥

    启动MongoDB服务:在 MongoDB 安装目录的 bin 目录下执行mongod show dbs -- 显...

  • RxSwift初窥

    前言 很久一段时间没写博客了,一方面是自己各种事情折腾,二是新项目开始用Swift了,边学边做忙死了,现在终于快忙...

  • block初窥

    一.block的简单使用 1.block声明 block变量的声明格式为: 返回值类型 (^block名字)(参数...

网友评论

      本文标题:初窥TensorRT

      本文链接:https://www.haomeiwen.com/subject/evansctx.html