美文网首页
强化学习初探分类

强化学习初探分类

作者: 永远学习中 | 来源:发表于2018-12-31 10:45 被阅读0次

    分类
    model-Free RL:不用理解环境
    从环境中得到反馈进行学习
    Policy Gradients
    Sarsa
    Q Learning
    Model-Based RL:理解环境
    需要为现实世界进行建模之后学习
    Policy Gradients
    Sarsa
    Q Learning


    基于概率(Policy-Based RL)
    Policy Gradients
    基于价值(value Based RL)
    Sarsa
    Q Learning
    Actor-Critic
    基于概率做出动作,给动作给分。


    回合更新(Monte-Carlo update)
    基础版本Policy Gradients
    Monte-Carlo Learning
    单步更新(Tenporal-Difference Update)
    Sarsa
    Q Learning
    升级版本Policy Gradients


    在线学习(On-Policy)
    Sarsa
    Sarsa(λ)
    离线学习(Off-Policy)
    Q Learning
    Deep Q Learning

    Q Learning

    构建Q表

    相关文章

      网友评论

          本文标题:强化学习初探分类

          本文链接:https://www.haomeiwen.com/subject/mvbhlqtx.html