深度学习模型训练的加速

作者: 冯凯onmyway | 来源:发表于2017-11-22 13:19 被阅读0次

PyTorch模型量化- layer-wise Quantize
2019-08-24极市 x Intel 活动笔记
深度学习模型训练的加速
用GPU进行TensorFlow计算加速
机器学习系统之加速技术目录
深度学习模型调试和监控（7.2）
工程Trick | 合并BN层加速前向推理
深度学习综述
Tensorflow学习-No.1
深度学习框架之caffe(三) —通过NetSpec自定义网络

1 硬件加速

采用GPU。

GPU多机多卡。

2 框架加速

在同样的模型，同样的配置下，采用Tensorflow ，caffe，mxnet或者CNTK的速度也不一样。具体性能可以参考这篇文章http://mp.weixin.qq.com/s/Im2JWJYGBQbOfzikFrEMsA，相比来说caffe在多机多卡的GPU环境下，加速更明显。

3 模型选取

当下比较经典的深度学习网络包括AlexNet，GoogleNet(Inception)，ResNet等。模型的层数越多，对硬件的要求越高，受限于GPU的缓存，每次mini batch的数量随层次增多而变少，训练时间越久，效果越差。最近多伦多大学新提出的RevNet解决了这个问题，可以参考http://mp.weixin.qq.com/s/sLrHUr7Qgp2itx5PBFkNuA。

如果是自己搭建模型，在梯度下降的算法当年可以考虑Adam梯度下降。

4 超参数

选取合适的初始值。

学习率递减。