美文网首页
人工智能应用案例学习1

人工智能应用案例学习1

作者: ericblue | 来源:发表于2018-03-07 10:05 被阅读0次

      为了更深入了解人工智能领域知识,开启相关案例学习,就从AlphaGo开始。

      AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿尔法围棋,是于2014年开始由英国伦敦Google DeepMind开发的人工智能围棋软件,并有对应的电影纪录片《AlphaGo世纪对决》。专业术语上来说,AlphaGo的做法是使用了蒙特卡洛树搜索与两个深度神经网络相结合的方法,其中一个是以估值网络来评估大量的选点,而以走棋网络来选择落子。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。

      在AlphaGo出现之前,机器程序在与人类围棋对战中处于明显劣势:在1997年IBM的电脑“深蓝”击败俄籍世界国际象棋冠军加里·卡斯帕罗夫之后,经过18年的发展,棋力最高的人工智能围棋程序才大约达到业余5段围棋棋手的水准,且在不让子的情况下,仍无法击败职业棋手。2012年,在4台PC上运行的Zen程序在让5子和让4子的情况下两次击败日籍九段棋手武宫正树。2013年,Crazy Stone在让4子的情况下击败日籍九段棋手石田芳夫,这样偶尔出现的战果就已经是难得的结果了。

      在AlphaGo出现之后,从下面4个实例可看出AlphaGo战胜李世石之后类似下棋机器程序在与人对弈中都占据绝对胜算。

      1)Facebook也在开发一套围棋程序,名为Darkforest。这套程序也是基于机器学习和树搜索。在2016年3月举办的第9届UEC杯世界电脑围棋大会中获得亚军。尽管该程序在其他围棋程序面前表现强劲,但截至2016年年初,它尚未击败任何职业棋手。

      2)DeepZenGo是日本程序员尾岛阳儿、加藤英树等开发的围棋程序,是在旧版本的Zen围棋软件基础上加入了深度学习技术后开发的新版本,由日本DWANGO公司、东京大学、日本棋院提供支持,其基本原理和AlphaGo类似。在第二届围棋电王战中分先以1:2不敌赵治勋九段。在2017年3月18-19日在日本举办的第10届UEC杯世界电脑围棋大会上获得亚军。在2017年3月21-23日的世界最强棋手决定战上以一胜二负的成绩名列第三名。在2017年3月26日的第5届电圣战上分先战胜了日本的一力辽七段。目前在KGS、弈城、腾讯野狐等网络围棋对弈平台上公测。

      3)绝艺(英文名Fine Art)是中国腾讯公司的AI Lab(腾讯人工智能实验室)开发的围棋人工智能。在2017年3月18-19日的第10届UEC杯世界电脑围棋大会上夺得冠军,并在2017年3月26日的第5届电圣战上分先战胜了日本的一力辽七段。目前在腾讯野狐围棋网络对弈平台上公测。

      4)CGI是由国立交通大学CGI(Computer Games and Intelligence)实验室所开发的围棋人工智能。在2017首届世界智能围棋公开赛8月16日于蒙古鄂尔多斯开战,击败绝艺与DeepZenGo,初赛全胜;17日总决赛中夺得亚军。

      为了搞清楚为何AlphaGo是如何取得如此成绩,需要深入探寻所使用技术方法,得到下面程序算法定义:AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助估值网络(value network)与走棋网络(policy network)这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。由于围棋无法仅通过寻找最佳棋步来解决,因为一盘游戏平均约有150步,每一步平均约有200种可选的下法,这意味着有太多需要解决的可能性。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着,后来达到了一定的熟练程度,开始和自己对弈大量棋局,使用强化学习进一步改善策略。

   

相关文章

  • 人工智能应用案例学习1

    为了更深入了解人工智能领域知识,开启相关案例学习,就从AlphaGo开始。 AlphaGo(“Go”为...

  • 人工智能教育的趋势

    机器学习是实现人工智能的重要方法,也是推动当下人工智能发展的核心驱动力。机器学习处理实际应用案例时,不是“十八般兵...

  • 人工智能应用案例学习2

    记录下与AlphaGo相关的关键概念术语,逐步一个个把定义搞清楚。 围棋是什么:围棋是一种策略性棋类,使用格状棋盘...

  • 人工智能应用案例学习6

    此文也是接续前文继续学习Go Further在githup提供的学习资料,需要不断完善理解建模思想。 围棋建模方案...

  • 人工智能应用案例学习7

    接上文继续学习建模算法优化改良。 2015年2月,Aja Huang在Deepmind的同事在顶级学术期刊natu...

  • 人工智能应用案例学习3

    本次学习AlphaGo模拟下棋的策略网络是怎么实现的。 策略网络是使用神经网络模型构建的强化学习能力算法。这个定义...

  • 人工智能应用案例学习4

    AlphaGo策略网络是基于强化学习的深度神经网络来构建的算法模型,这个过程是怎么抽象实现的呢? 感谢Go Fur...

  • 人工智能应用案例学习5

    围棋建模方案分析: 通过上篇文章定义可以知道,在看到s之后如何决定a是需要行动指导方法的,对于人类来说就是通过不断...

  • 人工智能应用案例学习-AlphaGo

    接上文继续拓展AlphaGo算法学习。 黄士杰(Aja Huang)使用MCTS融合策略和评价函数v(s)的策略是...

  • 漫谈 AI——人工智能技术&应用现状分析

    人工智能技术&应用现状分析 人工智能技术&应用现状分析 引言 人工智能现状 人工智能vs机器学习vs深度学习vs神...

网友评论

      本文标题:人工智能应用案例学习1

      本文链接:https://www.haomeiwen.com/subject/wmadfftx.html