AI2017_有关AlphaGo Zero的内幕

作者: 良宵听雨 | 来源:发表于2018-01-08 14:02 被阅读20次

AI2017_有关AlphaGo Zero的内幕
论文｜ AlphaGo Zero 的模型和算法
AlphaGo Zero 初探
alphago zero初探（一）
从AlphaGo Zero看人类经验知识的有效性和局限性
AlphaGo Zero 最强机器
程序出错，谁的责任？
虎说八道AlphaGo Zero
AlphaGo Zero学习一
AlphaGo Zero学习三

1/3

2016年横空出世的AlphaGo彻底粉碎了普遍存在的“围棋领域机器无法战败人类最强手”的执念，但是毕竟李世石还是赢了一局，不少人对于人类翻盘大逆转还是抱有希望，紧接着Master通过60连胜诸多顶尖围棋高手彻底浇灭了这种期待。

2017年AlphaGo Zero作为AlphaGo二代做了进一步的技术升级，把AlphaGo一代虐得体无完肤，这时候人类已经没有资格上场对局了。2017年底AlphaGo的棋类游戏通用版本Alpha Zero问世，不仅仅围棋，对于国际象棋、日本将棋等其他棋类游戏，Alpha Zero也以压倒性优势战胜包括AlphaGo Zero在内的目前最强的AI程序。

2/3

AlphaGo Zero从技术手段上和AlphaGo相比并未有本质上的改进，主体仍然是MCST蒙特卡洛搜索树加神经网络的结构以及深度增强学习训练方法，但是技术实现上简单优雅很多。主要的改动包含两处：一处是将AlphaGo的两个预测网络（策略网络和价值网络）合并成一个网络，但是同时产生两类所需的输出；第二处是网络结构从CNN结构升级为ResNet。

3/3

虽说如此，AlphaGo Zero给人带来的触动和启发丝毫不比AlphaGo少，主要原因是AlphaGo Zero完全放弃了从人类棋局来进行下棋经验的学习，直接从一张白纸开始通过自我对弈的方式进行学习，并仅仅通过三天的自我学习便获得了远超人类千年积累的围棋经验。

素材来源：人工智能头条。