软硬结合!AlphaGo Zero 70小时自学习奇迹的秘密

作者: 亮风台HiAR | 来源:发表于2017-10-23 14:01 被阅读165次

    谷歌AlphaGo Zero火了,不仅仅因为它被刊登在全世界最权威及最有名望的学术期刊《Nature》,更因为它首次实现了“无师自通”的人工智能算法。

    70小时从小白到高手,只有人工智能可以做到

    要知道打败世界第一的中国围棋大师柯洁的AlphaGo,在成功之前经过了成千上万的业余和职业围棋训练。而AlphaGo Zero完全绕过了这个过程,没有人工输入,全靠自学成才,并且以相当夸张的100:0完胜自己的兄弟AlphaGo。

    它通过使用一种新颖的强化学习形式来做到这一点,在这个过程中,AlphaGo Zero成为自己的老师:

    最开始,这个系统是一个对围棋一无所知的神经网络,通过与强大的搜索算法相结合,实现在游戏过程的自我调整和更新。

    然后,这个更新后的神经网络将与搜索算法重新组合,从而创建一个新的、更强大的AlphaGo Zero版本。

    如此反复上述过程,在每一次迭代中,系统的性能都有所提高,从而带来越来越精确的神经网络和更强大的AlphaGo的版本。

    这种技术比以前的AlphaGo更强大,因为它不再受限于人类知识的局限。

    在经过40天的自我培训后,AlphaGo Zero变得更加强大,在短短几天内积累了数千年的人类知识。AlphaGo Zero还发现了新的知识,开发了非传统的策略和创造性的新动作,这让我们相信人工智能将成为人类创造力的倍增因子,帮助我们克服人类面临的一些重要挑战。


    Elo ratings:评估竞技围棋等级, AlphaGo在变得越来越强大

    AlphaGo Zero 激活人工智能的长期目标

    人类的知识可能过于昂贵、太不可靠或根本无法使用。因此,人工智能研究的一个长期目标是绕开这一步骤,在没有人工输入的情况下,创造出能在最具挑战性的领域实现超人表现的算法。AlphaGo Zero 为人工智能的长期目标的实现,带来了极大的信心。

    人工智能的成长,需要软硬结合

    但其实,在 AlphaGo Zero 成长之路上,并不顺利,它依赖于高质量的神经网络来评估位置,只有硬件和算法的进步,软硬件达到一种动态协调的结合,才能打造最优秀的AlphaGo。


    上图来自DeepMind官网(deepmind.com)
    在软硬件结合不佳的时期,诞生了可怜的AlphaGo Fan和AlphaGo Lee……

    软件算法和硬件相互结合,一旦巧妙,将会迸发无限的能量,就像AlphaGo Zero这样。“软硬结合”的商业模式,已经被诸多移动互联网公司所认可并付诸实践,例如奇虎4亿美元投资酷派,阿里5.9亿美元入股魅族,小米12.6亿入股美的。从商业模式的角度看,互联网企业如同灵魂,这些灵魂必须存活于某种载体才能发挥功效。

    AR 作为人工智能技术的重要一环,也需要深度的软硬结合。为什么苹果的 ARkit 只能应用于搭载 iOS 11 操作系统的苹果手机?为什么谷歌的 ARCore 需要自己的“干儿子” Pixel 和某些特定的深度优化机型才能发挥作用? 正如我们在之前的文章深度 | 五个证据,证明苹果和谷歌在AR领域的相爱相杀中所提到:通过整合软硬件,苹果引领了智能手机时代;而谷歌对硬件毫无控制力,输掉了Project Tango。

    AlphaGo Zero、苹果、谷歌、阿里巴巴、小米等国内外巨头用实践和教训证明:人工智能技术,不仅仅是算法,更需要硬件载体。硬件载体就像舞台,让技术有了十足的用武之地。

    专注于AR核心技术的亮风台是一家践行“软硬结合”的人工智能公司。基于市场需求,亮风台早期即提出“云+端”战略,以“云+端”双引擎来拉动AR服务,端云一体、无缝连接,双引擎助推内容及场景的高效整合,目前已在教育、医疗、工业、营销等行业深耕落地,行业标杆客户包括BAT、美图、OPPO、汽车之家、中联重科、科勒等数百家知名企业,覆盖全球超过10亿的终端用户。

    如同AlphaGo的进化,亮风台希望在生产、聚合内容,丰富、优化用户体验的同时,有效实现数据沉淀,加速模型学习,释放数据价值,完成技术的自我循环和进化,使AR得以赋能更多行业,形成完整技术、商业闭环。

    相关文章

      网友评论

        本文标题:软硬结合!AlphaGo Zero 70小时自学习奇迹的秘密

        本文链接:https://www.haomeiwen.com/subject/nkcauxtx.html