美文网首页数据科学日记
2020-02-24 强化学习

2020-02-24 强化学习

作者: 金日成 | 来源:发表于2020-02-24 20:43 被阅读0次

    1.马尔可夫决策过程

    2.免模型的强化学习model free

    a.Monte carlo「First visit」,「Ever visit」

    b.TD-learning

    C.Q-learning 

    D.Sarsa

    E.DQN algorithm

    相关文章

      网友评论

        本文标题:2020-02-24 强化学习

        本文链接:https://www.haomeiwen.com/subject/mmwvqhtx.html