一、两种分布
万物皆数。——毕达哥拉斯
万物皆矢量。——欧几里得
万物皆正态分布。——高斯
是不是总感觉哪里有点违和感?
——因为上述引文一半是笔者瞎编的。
如果说人类对于矢量的理解意味着掌握乃至超越时空的限制的诉求,那么人类对于正态分布的研究一定象征着控制甚至摆脱命运的摆布的祈愿。
正态分布(Normal distribution),又名高斯分布,可以说是科学界最为重要的础石之一。其名来源于「数学王子」高斯(Johann Karl Friedrich Gauß),也就是那个10岁就心算出1加到100的和的小正太。(不过不叫正太分布。)
对于正态分布,学理工的一定不会陌生。而随着统计学在社会科学、甚至人文学科的应用,(以及所谓「大数据」的热潮,)正态分布的应用更是突破了传统的物理世界,直逼人类的精神世界——从机器学习到神经科学的研究,从行为心理的分析到意识形态的哲思。
正态分布有太多优雅的性质与广泛的应用,在这里就不赘述。
其中最为重要的名为「中心极限定理(Central Limit Theorem)」,它指出:大量相互独立的随机变量加在一起,平均值就会呈现正态分布。
说句题外话:虽然现实中大家都这么用了,但打从生物学开始,大量与相互独立这两个最为根本的条件就几乎是不可能达成。
插科打诨之一:极限
高等数学,微积分、高等代数、高等几何、概率与统计等等,高在哪里?
两个字:极限。
——这一定是启蒙运动带给人类最伟大的发明。很可惜几乎只被科学界使用,因此也许用「发现」一词更加准确。
超几何分布(Hypergeometric distribution)也是在学习概率论是最基础的几个分布之一,但它的应用却远不如正态分布来得广泛。实际上它的应用几乎只与抽样有关,譬如产品抽检的合格率、德州扑克的赢面。
满足一定条件的情况下,它还可以用正态分布来近似——本质上就是上文所讲的「中心极限定理」的一个应用。
笔者之所以把超几何分布同人类的精神世界相联系,就是因为其应用,或者说打从一开始其定义,就更偏向于概率论的思想实验性,而非统计学的观察分析性。
当然,正态分布的伟大就在于贯彻两者。
插科打诨之二:概率与统计
在此容笔者略微民科地复述一下概率论比统计学更加抽象的缘由。
统计是说:一枚公平的硬币,抛1000次,发现461次正面朝上;正面出现的频率是0.461;如果抛10000次,或者更多次,这个频率会越来越接近0.5。
概率则说:一枚公平的硬币,每一次抛出,正面朝上的概率都是1/2。
换言之,概率论是先验的(a priori),统计学是后验的(a posteriori)。
顺道一提,联系两者的东西就是贝叶斯定理(Bayes' theorem)。
二、两类应用
无论现实世界究竟如何,人类对于物理世界的描述经常是正态分布的。
当我们估测一段距离的时候,譬如用精确到厘米的刻度尺测量桌子的长度,需要估读毫米的数值的时候。当我们瞄准目标射击、投掷、踢球的时候,譬如射击运动员参加奥运比赛,每一个都是希望枪枪可以正中靶心的……投篮命中率、赌球赔率、人均收入、期望寿命,凡此种种,都有所谓的期望(也就是平均值)的概念——而这个概念之所以有效,需要的两个条件正是:1.概率分布只有一个峰值;2.概率分布几乎对称。而正态分布正是符合条件的概率分布中最方便耐用的那一个。
而物理世界本身,因为微观粒子的随机性以及宏观观测的大量性,至少在经典物理中考虑随机性的时候,譬如估算与控制火箭飞向太空,整个过程充满的不确定性运用正态分布来对付就够了。
然而如果该火箭上载着一名宇航员,他可以通过输入一串4位密码来解锁一个紧急按钮(也许是用来发射一枚核弹来清除无法躲开的小行星)——而因为形势紧张他只记得密码前2位了,那他只能随机地输入后2位。他也许会输错好多次,不断重复,直到成功或者成仁为止。
整个过程中,后一次与前一次输密码相互不独立,一共也就100种可能性所以也不大量,因此没有正态分布介入的余地。
类似的,在玩德州扑克的过程中,手持黑桃J、Q、K与A,下一张牌正好是黑桃10的概率也与正态分布半毛钱关系都没有。
笔者以为,超几何分布反映了诸如策略选择之类的概念认知——它们是隶属于精神世界的,特点则是在少数的选项中非此即彼。
至于超几何分布于正态分布的最大区别,那就是它具有相当的偏度(Skewness),尤其是被抽样的基数不大的时候。
有这么一个经典的实验:受试者读一段推理小说的文字材料,列出他们眼中全部的嫌疑犯,并且标注上此人是凶手的概率。
实验者发现,几乎没有一个受试者的列出的嫌疑犯名单上,概率之和为100%——这显然是不符合逻辑的。
但这真的仅仅是因为受试者缺乏或者忽略了这最基础的统计学常识?
当受试者估计嫌疑犯的概率时,他本能地意识到这个数值本身的不确定性。也就是说,这个数值本身是一个随机数,它自有一个概率函数描述它的分布。
而当我们被要求只写下一个数值来代表这个函数的时候,我们本能地使用众数(Mode,对应了概率分布的峰值),而并非平均数。
——这种本能的经验在于,当我们从符合这个分布的样本中抽样的时候,获得的数更容易接近众数。
但众数不是平均数。对于概率分布对称的随机数来说,众数、平均数、中位数(Median)都是一个东西,但对超几何分布来说并不是。
「已知一组随机数的和等于1,那么它们的平均数的和也等于1。」这个命题无疑是正确的,但同样的命题对众数无效。
另外对于大部分受试者来说,「一个嫌疑犯是凶手的概率」并不是说「该嫌疑犯在这群人中是凶手的概率」,而是「我对该嫌疑犯就是凶手这件事有多少自信」。
很明显,这里又回到了贝叶斯主义。
插科打诨之三:数学家的原罪
现实中太多研究对象根本达不到使用「中心极限定理」的条件,但它终究还是遭到了滥用——因为它方便、好用,而且大多数情况下结果不会太糟糕。
仅仅用一个平均数与一个方差就可以描述许多复杂的随机过程,这不是件很美妙的事吗?
Simplicity is the ultimate sophistication. -- Leonardo da Vinci
然而真的不是因为懒吗?
「记忆是不可靠的东西,所以需要记得的东西越少越好。」——这种好听的话只不过是借口,笔者投身相关专业就是因为懒得背。(后来发现还是要背的……而且是用一种自己也未必明白语言。)
不过数学家是严谨的,他们不会滥用任何定理。很多时候,他们过度严谨,以至于许多数学理论都是先有猜想,后有突破。几个世纪以来都是物理学家作为先驱,千禧年以后计算机则也加入了弄潮的行列。
所以滥用定理的不是数学家,而是借助数学工具做应用学科的家伙。
然而笔者还是宛如要推卸责任似的把这份滥用的原罪归咎到数学家们身上。
因为他们对于应用学科是如此之漠然,以至于数学最根本的批判性与建设性没有被传递下去。数学,作为所有理工专业的必修,不仅没有受到广泛的爱戴,还遭受到公开的鄙夷,无论东方还是西方。
——这,一定是数学家们的问题罢。
当然笔者也不是不能理解:当一个人真正沉浸在自己所热爱的事物之中的时候,他就不需要通过与他人比较并贬低他人来获得自我满足。
三、不完美信息随机多人博弈
从单个对象到多个对象,从确定事件到随机事件,人类逐步开始数学化地研究自己的行为了。
插科打诨之四:纳什不拿诺贝尔经济学奖不行
1994年,纳什(John Forbes Nash Jr.)与另两位博弈论学家一同荣获诺贝尔经济学奖。
纳什是数学家。
纳什是数学家。
纳什是数学家。
所以为什么诺贝尔不设数学奖?
因为数学家总有其他办法的——这个是开玩笑,但诺贝尔奖有一个极其重要的授奖条件就是「活着」。
英年早逝的数学家太多不论,在世时自己的数学理论可以得到广泛运用那是少之又少的,纳什绝对算是个幸运儿。
纳什作为普林斯顿大学(Princeton University)的毕业生,代表了新一代数学人走向应用学科,尤其是经济相关领域的前进方向。
当然博弈论的应用远远不止经济学,但终于,时至今日,全世界的经济学已经习惯了数字,并且开始迷信数据。一项统计表明,今日普林斯顿经济系的毕业生比起二战左右的学生更具自信——因为他们使用数学工具,而不是凭借历史经验分析问题。
推进人类文明演化的不是技术,而是信仰。网络技术早在网络时代来临之前已经成熟,但当时的互联网只有一小部分人使用,没有商业化,因此缺乏遍布全球的基础设施与相关人才。
计算机技术走入寻常百姓家,不是因为它多么有用,而是因为它的用处得到了一般人的认可。纳什进一步推动了既世界大战以后经济学的数学化,而这股潮流又推动了金融机构以及一般产业的数字化。收集的数据越来越多,数据的分析也显得越来越有用。全世界被巨大的电线与光缆链接起来,地球真的变成了一台巨大的计算机,《银河系漫游指南》一语成谶。
反过来思考的话,如果经济学没有得到那几代人的数学化,金融市场那些跳动的数字就显得毫无意义,我们就仍然生活在一个需要通过私人渠道才能获取有效情报的年代——非数字化的情报要通过数字化的载体来传输是困难的,要记得音乐、影像等多媒体是近几年网络已经足够发达以后的事情,早期的电脑与网络只能处理数字与字符。而即使如此,证券交易所仍是最早采用网络的地方。
总而言之,纳什的贡献不仅仅是经济学意义上的,更是经济意义上的。
2016年3月,AlphaGo击败李世乭。
围棋是典型的完美信息确定性的双人零和博弈。
在这里笔者首先要强调的是完美信息(perfect information)与完全信息(complete information)区别。简单来说,完全信息下,博弈的参与者互相了解各自的目标;而完全信息只是关于博弈本身。
举个例子:假设有个恐怖分子像电影里一样控制了全球的网络系统,并且用发射核导弹打击韩国来威胁当时的韩国总统,李世乭因此不得不故意输掉了比赛——而AlphaGo只是个围棋AI而已,并不是幕后黑手;那么这场博弈就不是完全信息的。但只要这个游戏是围棋,不能通过变魔术来偷换棋子的位置,那这场游戏就一定是完美信息的。
确定性(deterministic)非常好理解,落子无悔,想要下在星位的棋子不会因为不可名状的原因而落在小目或者三三。相对于随机性(stochastic)来说,确定性有两个好处。
其一,对于棋手来说,这个游戏理论上是有确定解的。
当然实际上围棋的复杂度非常大,远超各类象棋。目前棋类AI在国际象棋中运用最为纯熟,有专门的「棋手+AI」组队,互相对战的职业比赛。AI给棋手提出建议,棋手可以自由选择是否遵从,或者另辟蹊径。虽然大多数时候AI给出的建议多半会得到青睐,但也不乏棋手灵光乍现,走出双方AI都未曾料想的招式,赢得胜利。
围棋的复杂度则与棋子的走法彻底无关,完全源于它19x19的巨大棋盘。就像我们学围棋的初期可以使用小棋盘一样,早期的围棋AI也是从挑战小棋盘开始的。
其二就是黑白分明,赢就是赢,输就是输。AlphaGo与李世乭一役是五番战,也就是三局两胜。如果这个博弈是抛硬币,五局三胜,那任谁都有可能战胜AI,任谁都有可能荣膺世界冠军。
最为关键是,因为博弈的收益(无论名还是利)都是与棋盘上的结果直接挂钩的,完美信息与完全信息几乎没有差别。即使李世乭真是抱着想要输的目的去参加比赛,结果上他输掉了比赛的事实不会改变。
最后,围棋是一个一对一的零和博弈。
用战争类游戏(或者现实战争本身)来说的话,这类博弈因为零和(zero-sum),不是你死就是我活,所以直接的战斗是不可避免的。但如果存在多方势力,完全可以采取结盟的办法,共同侵消敌人。
美苏从来都是各有各的目的,但为了击败纳粹,到底还是联合了起来,虽然只是一时一地。但纵在彼时彼地,他们也不可能进行真正地合作,都说老谋深算的政治家必得在战争开始之前就算计好战后的利益分配——若非两边都有这样的领导,战后岂能形成实力几乎对称的冷战格局?
然而随机博弈就会带来问题。
一般认为,随机性的问题在于运气成分。也就是说,假设围棋是一个带有随机成分的游戏,五局三胜AlphaGo获胜,人类大可吼上一句「时运不济」,随后要求再战三百回合。
可这个问题正好在这个死皮赖脸的要求下得到了解决——亦即通过多次比试,看平均成绩。
2015年,阿尔伯塔大学(University of Alberta)的迈克尔·鲍林(Michael Bowling)教授在《科学(Science)》上发表论文:他与同事「弱」解决了双人德州扑克——他们开发的程序仙王座(Cepheus)能在得知在双方底牌的情况下,保证不败。注意这里的「弱」强调的是知道双方底牌,也就是把德州扑克这个原本是不完美信息的游戏简化为了完美信息的游戏;而「保证不败」不是说每场都不会输,而是从多次比试来看,如果用仙王座赌钱,平均来说不会输。
当然现实中的问题是,到底需要比赛多少次才足以证明孰优孰劣。参加比赛的人类与AI都会变,所以严格地来说根本没有办法进行完全重复的实验。
接下来的问题就是不完美信息。
某种意义上说,不完美信息可以也是随机性。继续用扑克的例子来说,底牌是黑桃A虽然对于自己来说是确定的,但对于对手来说却是不确定的。
然而这种不确定性对策略的影响与上段所讲的对双方一致的随机性却十分不同。虽然对于对手来说,「这张未知的底牌到底是黑桃A」的概率,与「下一张新发来的牌是黑桃A」的概率是一样的;但是,「基于底牌是黑桃A做了加注的动作」的概率,与「基于底牌不是黑桃A而一样做了加注的动作」的概率却是截然不同的。底牌本身的不确定性复合上基于底牌可能的所有策略的不确定性,才是现在真正面对的不确定性。
回归理论的话,这样的不确定性无非只是增加了计算量——但毋庸置疑,AI破解随机博弈,因此变得难上加难。
最后就是多人博弈的问题了。
在不完美信息游戏的前提下,多人博弈首先增加了未知的底牌,也就是从数量上直接增加了不确定性。
同时上节已经提过,多人博弈在现实中是存在结盟的可能的,而博弈各方相互之间未必清楚类似约定的有无——亦即,多人博弈加重了信息的不完美,再次从结构上复合了多层不确定性。
最为关键的问题是,我们如何测试某个(或该类)AI与人类相比谁更优秀?假设有一个团队研发出了一款极其优秀的麻将AI,让两个AI与两个人类进行比试,有意义吗?人类会不会为了人类的尊严,相互窜通?AI之间是不是也可以作弊?
把这样一个AI设置在网络游戏平台上或许是合理的:进入游戏的玩家无法根据对手ID判断对方是否是AI;比赛的场次足够多。——但为求胜利,提前研究对手的牌路(棋路),本来就是职业选手应该做的。这样的匿名性是不是原本就对人类一方不公平呢?就譬如AlphaGo集合了许多经典的棋谱,里面理所当然地包括李世乭本人,但AlphaGo本身的棋谱却少得可怜,李世乭在游戏开始前就已经处于了不利的局面。
四、两个世界的冲突
在介绍不完美信息随机多人博弈的过程,笔者举了扑克与麻将这两个典型的例子。
笔者的疑问是:为什么这类博弈总是与赌博直接相关?
这个疑问看上去有点没来由。可只看定义的话:几乎所有体育运动都是随机博弈。
譬如射击,优秀的选手可以让每一枪都很接近靶心,但不可能保证每一枪都正中靶心,所以比赛不是决斗,一枪定胜负。再如径赛,成绩一定会受选手的身体状况、天气场地等等因素的影响,尤其短跑还有「压枪战术」,更是为比赛增添了许多看点。而团队项目诸如足球,更是受太多或自然或人为的随机因素影响。
并不是说体育项目就与赌博无关,诸如赌球的阴云永远挥散不去。但运动员本人只要不赌自己输,他终归是试图获得胜利的,也就是说原则上这项运动可以与赌博无关,只为荣誉而战。然而德州扑克与麻将就算比赛完全去赌博化,终究是必须使用筹码之类的道具来表示输赢的额度。
另外不完美信息也不是问题,这在团队项目中非常常见:棒球教练给出的一连串花里胡哨的动作,排球二传手在队友发球时在背后比划的手势,06年世界杯1/4决赛点球大战前莱曼获得的小纸条……
至于多人项目,体育竞技中似乎没有类似扑克或者麻将这样单独作战为主的项目。诸如F1、长跑、自行车之类的,均十分强调团队合作,阿姆斯特朗连拿7次环法冠军,可不光是靠嗑药的。而类似的配合在扑克或麻将中却很容易被看作是作弊行为。这种观念的区别在这里不作深究,因为很可能是因为赌博在前,才催生了团队配合的禁忌,而非相反。
插科打诨之五:麻将的竞技化
以中国与日本为基点,全世界范围内麻将的竞技化正在缓步推进。
国内有关团体正在推行类似「重复桥牌(Duplicate bridge)」的规则,既不同牌桌的每一局牌山的构成与东南西北四家的配牌是一样的。与桥牌一样,目的自然是为了降低随机性。
然而我不觉得通过增加不同牌桌相同座位选手的相关性的方式来降低随机性有什么太大的意义——或者说根本就是适得其反吧,随机生成的牌山变少了,实际上减少了样本容量,反而增大了方差。
当然,因为该比赛完全在电脑上进行,并在比赛同时由计算机记录选手的牌效率,所以还是有相当的意义。
为了降低随机性,日本的顶级比赛采用「競技ルール」也叫「A rule」,与一般日麻没太多不同,主要就是减少了宝牌的数量。
说起来考虑降低随机性的话,鹫巢麻将大概是个好方法:
- 二打二;
- 透明牌;
- 不玩钱;
- 玩命。
最后一条当然就不用了。
当笔者宣称体育运动是随机的时候,相信很多人虽然同意,却不想同意,至少不想完全同意。
——只要不断提高自己水平,终归能碾压弱小的对手。但这样的比赛不是观众,甚至不是顶尖的运动员所渴望的,我们打从心底里渴望一场足以名留青史的巅峰对决。
没错,这正是竞技的魅力所在:两个势均力敌的高手,剑戟招招夺命的威胁,刹那之间,毫厘之际……
而像扑克或者麻将之类纯粹靠运气的游戏,就算是新手也有可能战胜世界冠军。
只比一局的话,那是当然,但比上一整场的话?顶级比赛,尤其是冠军争夺战,可是要比上一整天,甚至两天?——这样的情况下新手都能取得冠军的话,真的不是其他选手有问题吗?
整体的泱泱洪流辅以细节的不确定性,这是我们的思维定式。
我们的祖先凭它躲过了野兽的袭击,渡过了湍流,在生殖崇拜的古老时代,多就是好,多就是神圣,多就是赞美诗。
但不知从何时起,「物以稀为贵」已经不仅仅是因为供需关系而达成的自然均衡,而更为直接地刻印在了我们的文化与基因里。
我们把这套法则赋予我们发明的一切游戏,战争、狩猎、体育、棋牌——最不容易得到的,最具价值。
试问:棋牌与其他例子最大的不同在哪里?
——那就是棋牌规则由我们制订,不受物理法则的约束。
正态分布的物理世界是我们习惯的,超几何分布的精神世界中我们却只是青涩的顽童。而对于不受约束的,管教的方法古已有之:
威逼利诱。
赌博,这种通过让参与者背负物质材料输赢的方式,正是让参与者负起责任的最好方法。
回答完了本章开头的问题,最后再讲讲两种分布,或者说两个世界的区别。
物理世界中,我们挣扎于平均值与方差的负相关。较大的回报往往意味着昂贵的成本以及高额的风险。
并不是说由我们所制订的游戏规则里就不存在这样的情况,把超几何分布的对象直接对应成精神世界也是笔者的极端。
但正态分布是基于事物本身,超几何分布则是基于组合,也就是事物之间的关系——这样的总结应该是足够中肯的。
物理世界的对象,以及我们的一般经验,来源于事物的重复与堆砌。而在生物诞生之日开始,或者更早地,从生物大分子出现之时开始,演化催生的复杂性就不只是数量意义上的,更是结构意义上的。而人类社会更是所谓「上层建筑」——就像生物作为物理存在必然遵循所有物理法则,但没有必要用量子力学与相对论去研究猫犬的毛色一样——我们的精神世界是构筑于物理世界的基础上,不代表两个世界的法则互相通用。
最后,笔者想要向整个启蒙时代致以最真挚的敬意与最沉痛的惋惜。
启蒙运动推崇理性——不应只是在科学研究之中,更应是在人性的自我发现与整个社会文明之中——但一切都只是空想,人类终究只会用最老套的办法来让自己负起责任。
网友评论