增强学习四要素

作者: 海街diary | 来源:发表于2018-01-17 10:45 被阅读106次

增强学习有四个要素:policy, reward signal, value function and model of the environment.

1.Policy

policy定义了在给定时间点,对环境(situation)将做出如何的行为。( a policy defines the learning agent's way of the behaving at a given time).

2.Reward Signal

reward signal定义了在增强学习过程中的目标(goal)(a reward signal defines the goal in a reinforcement learning problem)。我们的学习目标就是要maximize the total reward。

3. Value Function

value function定义了长期来看的reward(a value function specifies what is good in the long run)。举个例子,agent可能选择一个暂时low的reward,但是在那个时间段内,总体的reward比较大。value function可以看作是对未来reward的estimate,是增强学习算法中核心的部分。

4. Model of the environment

model of the environment定义了环境因agent的action如何变化(the model of the environment is something that mimics the behavior of the environment, or more generally,that allows inferences to be made about how the environment will behavior)。 

相关文章

  • 增强学习四要素

    增强学习四个要素 policy policy指的是一个函数或者规则,输入为环境状态,输出为action(Rou...

  • 增强学习四要素

    增强学习有四个要素:policy, reward signal, value function and model...

  • 如何让儿童拥有好睡眠

    建立好睡眠品质的要素: 建立好睡眠卫生的重要性: - 有助于增强学习能力 (深睡眠的强度与学习直接相关) - 帮助...

  • 学电鼓的四要素,你掌握了几个?

    中医看病有四要素:望、闻、问、切,对症下药,学习电鼓也一样有四要素:听、看、感、选,掌握好这四要素,就是为音乐之路...

  • 如何全身心的倾听?

    前面三天我们学习了非暴力沟通的四要素,分别是观察、感受、需要和请求,今天我们学习如何用这四要素来全身心倾听。 倾听...

  • 改变心智模式后的神奇效果

    刘润的商业观察30讲里面讲系统要素的时候,提到过增强回路和调节回路。因增强果,果反过来增强因,就形成了增强回路;因...

  • 爱上学习的科学技巧

    ARCS模型,也叫学习欲望模型。Arcs模型将学习动力分解为注意力、理由,自信和满足感这四个要素。这四个要素都齐全...

  • 强化学习基础知识详解

    强化学习(Reinforcement Learning) 强化学习基本概念 强化学习四要素:状态(state)、动...

  • 增强学习(一)

    一. 增强学习简介 1.1 什么是增强学习? 机器学习的算法可以分为三类:监督学习,非监督学习和增强学习。 增强学...

  • 3.日更190116-战略

    拆解要素,组合要素 比如,拼多多。拆分为供应端、消费端、连接 增长:自增强回路。越**越** 如亚马逊,自增长飞轮...

网友评论

    本文标题:增强学习四要素

    本文链接:https://www.haomeiwen.com/subject/hvmyoxtx.html