1.马尔可夫决策过程
2.免模型的强化学习model free
a.Monte carlo「First visit」,「Ever visit」
b.TD-learning
C.Q-learning
D.Sarsa
E.DQN algorithm
1.马尔可夫决策过程
2.免模型的强化学习model free
a.Monte carlo「First visit」,「Ever visit」
b.TD-learning
C.Q-learning
D.Sarsa
E.DQN algorithm
本文标题:2020-02-24 强化学习
本文链接:https://www.haomeiwen.com/subject/mmwvqhtx.html
网友评论