前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕,程序的棋力就固定下来了,即使判定走棋的规则有缺漏,即使对弈无数局,程序也无法再有所提高。
而强化学习算法则不同,它可以让程序在不断对弈中提升棋力,让程序具备学习提升的能力。
前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕,程序的棋力就固定下来了,即使判定走棋的规则有缺漏,即使对弈无数局,程序也无法再有所提高。
而强化学习算法则不同,它可以让程序在不断对弈中提升棋力,让程序具备学习提升的能力。
本文标题:强化学习
本文链接:https://www.haomeiwen.com/subject/xoubfktx.html
网友评论