
继2016年初AlphaGO以4比1战胜李世石后,2017年初,AlphaGO的升级版Master又在网上狂胜中日韩全部围棋高手60局!人们哀叹计算机智能已经快要碾压人类了,这时候专家出来安慰咱们吃瓜群众了。卡耐基梅隆大学计算机科学教授托马斯·桑德霍尔姆(TuomasSandholm)表示,“自人工智能研究之初,击败人类最优秀的选手就一直是验证人工智能是否取得进展的最有效手段之一。”“与其他游戏相比,扑克带来了更复杂的挑战,因为机器需要根据不完整的信息做出极其复杂的决定,而且整个赛事的进展会非常缓慢,且需要应用其它的一些技术。”围棋是一个完美信息博弈,而扑克是典型的不完美信息博弈游戏,也是我们曾经以为计算机智能面临的长期挑战。在一对一有限注德州扑克中,计算机程序曾经取得了一些成功。但是,一对一有限注的德州扑克,全部的决策点只有不到10的14次方个,而一对一无限注中包含10的160次方决策点,围棋约包含有10的170次方个决策点。

一项名为“大脑对抗人工智能:进步期”(Brains vs.ArtificialIntelligence:UppingtheAnte)的巡回赛于2017年1月11日在美国匹斯堡河流赌场(RiversCasino)正式拉开帷幕。四名职业德州扑克玩家将会在20天时间中与卡耐基梅隆大学的新程序“Libratus”在无限制德克萨斯扑克比赛中共同比赛12万手牌局。其实,2015年卡耐基梅隆大学已经组织过一次类似的竞赛,当时的程序 Claudico输得挺惨的。

正在人们期待新程序的表现的时候,来自加拿大和捷克的几位计算机科学研究者在 arXiv 上贴出论文,介绍了一种新算法 DeepStack,使用一种深度学习技术从单人游戏中自动学习的有关扑克任意状态的直觉形式。研究者在论文中称,在一项有数十名参赛者进行的44000手扑克的比赛中,DeepStack 成为第一个在一对一无限注德州扑克中击败职业扑克玩家的计算机程序。
在感受计算机智能的冲击以后,再补充介绍一下几个博弈论的概念:完美、完全、对称

完美信息博弈是依据一个参与者了解其他参与者的行动信息而定义的,完全信息则是双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。因此完美信息博弈是完全信息博弈的子集,完全信息博弈包含完美信息博弈。
不能获得其他参与者行动信息的博弈称为不完美信息博弈,而把每个参与人都了解其他参与人的类型的博弈称为完全信息博弈,否则为不完全信息博弈。
不完全信息博弈是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。
在不完全信息博弈中,一个参与者的不被其他参与者了解的类型信息被称为该参与者的私人信息,如果只有个别参与者拥有私人信息,这种不完全博弈被称为不对称信息博弈。
我根据自己的理解画了个图:

上面几段没看懂是完全正常的,反正你就记住:大多数纸牌游戏是不完全信息博弈。意思就是说:计算机下国际象棋围棋赢了没什么了不起,那玩意就是比谁算得快,是体力活,扑克和麻将神马的才是真正的脑力劳动!以前我们自信计算机智能在这方面不行,简单说也就是认为计算机智能不会骗人或者不能看出来别人是不是骗他。现在,德扑自己被攻陷了,看看麻将还能坚持多久!希望四川人民加油,借川普当选的西风,再弄出几种川麻新玩法,延缓一下计算机智能的脚步……

网友评论