强化学习核心loss

作者: VanJordan | 来源:发表于2019-01-10 14:29 被阅读5次

强化学习核心loss
2016-4-22-米6介绍
sklearn-loss function
学习对比《深入浅出强化学习原理入门》PDF代码+郭宪+《强化学习
强化学习——强化学习的算法分类
【学习笔记】ML的核心-Loss Functions！
Pytorch 分类问题
LOSS tips
train loss与test loss结果分析
强化学习——重拾强化学习的核心概念

self.reward_loss = tf.contrib.seq2seq.sequence_loss(
      decoder_outputs_pretrain,
      self._target_batch,
      self._dec_padding_mask,
      average_across_timesteps=False,
      average_across_batch=False) * self.reward

如果是只知道batch里面句子的长度那么可以使用tf.sequence_mask()来获得上述的padding_mask。

tf.sequence_mask(
lengths,
maxlen=None,
dtype=tf.bool,
name=None
)

例子：

tf.sequence_mask([1, 3, 2], 5)  # [[True, False, False, False, False],
                                #  [True, True, True, False, False],
                                #  [True, True, False, False, False]]

tf.sequence_mask([[1, 3],[2,0]])  # [[[True, False, False],
                                  #   [True, True, True]],
                                  #  [[True, True, False],
                                  #   [False, False, False]]]

强化学习核心loss
如果是只知道batch里面句子的长度那么可以使用tf.sequence_mask()来获得上述的padding_m...
2016-4-22-米6介绍
昨天主要还是调试学姐股指期货代码...同时又加深了些对强化学习的理解。强化学习的loss function形式不...
sklearn-loss function
我认为各个模型核心就是loss function，loss function不同就是不同的模型，具有相同的loss...
学习对比《深入浅出强化学习原理入门》PDF代码+郭宪+《强化学习
在学习机器学习中的强化学习的过程中，感觉国内所写的《深入浅出强化学习原理入门》和《强化学习精要：核心算法与Tens...
强化学习——强化学习的算法分类
上一篇文章回顾了强化学习的核心概念，这里继续通过Open AI 的Spinning Up 项目总结强化学习(RL)...
【学习笔记】ML的核心-Loss Functions！
我写这篇很大的原因是因为感觉对各种Loss Functions掌握的不够。经我各种翻阅和调查99%的博客都只告诉你...
Pytorch 分类问题
train loss 不断下降，test loss不断下降，说明网络仍在学习; train loss 不断下降，t...
LOSS tips
train loss 不断下降，test loss不断下降，说明网络仍在学习;train loss 不断下降，te...
train loss与test loss结果分析
train loss 不断下降，test loss不断下降，说明网络仍在学习; train loss 不断下降，t...
强化学习——重拾强化学习的核心概念
虽然之前的文章零零散散地介绍了强化学习的核心概念，但是从来没有系统性地总结这些概念。Spinning Up 项目的...