强化学习

作者: 赵明嗯 | 来源:发表于2020-06-27 23:27 被阅读0次

前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕,程序的棋力就固定下来了,即使判定走棋的规则有缺漏,即使对弈无数局,程序也无法再有所提高。

而强化学习算法则不同,它可以让程序在不断对弈中提升棋力,让程序具备学习提升的能力。

相关文章

网友评论

    本文标题:强化学习

    本文链接:https://www.haomeiwen.com/subject/xoubfktx.html