美文网首页
Deep Networks with Stochastic De

Deep Networks with Stochastic De

作者: Cat丹 | 来源:发表于2019-10-14 15:02 被阅读0次

关键词:随机深度

  • 通过随机del掉一些block,将残差层改为identity层实现
    H_{l} = ReLU(b_{l}f_{l}(H_{l-1})+id(H_{l-1}))
    p_{l}=Pr(b_{l} = 1)

  • 可提高训练速度

  • 可构造更深的网络,削减梯度消失现象

  • 测试时残差层需要乘以一个概率(当初保留该层的概率)
    H_{l}^{Test} = ReLU(p_{l} f_{l} (H_{l-1}^{Test}; W ) + H_{l-1}^{Test})

    network.png

实现细节

  • 输出某层权值梯度的方法
model = nn.Sequential(
    nn.Linear(10, 2)
)
...
loss.backward()
print(model[0].weight.grad)
  • 获取保留概率的实现
self.m = torch.distributions.bernoulli.Bernoulli(torch.Tensor([self.prob]))
if torch.equal(self.m.sample(),torch.ones(1)):
    # 保留

相关文章

网友评论

      本文标题:Deep Networks with Stochastic De

      本文链接:https://www.haomeiwen.com/subject/knegyctx.html