什么是强化学习
1、动态系统或环境中,利用“试错”的方式进行自我学习,通过奖赏指导行为。
2、动态选择过程中,预演所有选择的一切结果,根据结果的奖赏,选择最优的结果。利用分布式计算(学习)。
典型例子:围棋对战,4:1战胜人类
本文标题:强化学习
本文链接:https://www.haomeiwen.com/subject/ezeirqtx.html
网友评论