本周继续延续思维训练模块的阅读,主题是“数学思维”,精读书是美国威斯康星大学数学系教授乔丹·艾伦伯格写的《魔鬼数学》。
《魔鬼数学》书封提到数学,可能有不少人会眉头一皱,仿佛回到那个掉落铅笔的午后,捡起来就再也听不懂数学老师的推导了,着实让人焦虑、惆怅。在学校所学的数学知识看上去不过是一堆沉闷的规则、定律和公理,我们在中学学了三角函数,到了大学又学了微积分,但是,大部分成年人在他们的日常生活中,能有几次用到余切函数或是不定积分的时候?那我们为什么还要学这些由前人传下来看起来又不容置疑的数学呢?
在这本《魔鬼数学》中,作者摒弃了复杂的专业术语,用现实世界中的逸事、基础的方程式和简单的图表,来讲述数学的魅力,以及如何获得用数学原则解决生活中问题的技巧。乔丹•艾伦伯格认为,数学是人类最重要的基础科学之一,也是生活中最有用的思维工具。数学可以帮助我们更好地了解这个世界的结构和本质,应该被放在每个有思想的人的工具箱里,特别是在当下的大数据时代,我们更需要借助数学思维的力量,用于更好地解决问题,规避谬误和错误的方法。
书的一开始作者就提出一个观点,数学知识可以分为四个象限,我们只需要重点关注其中的一个象限就行。
数学四象限第一个象限是简单而浅显的数学知识。这些数学知识看起来更为复杂,但从理解的难度上来讲,其实也是非常简单的。
第二个象限是复杂但是浅显的数学知识。这些数学需要一些解题技巧,需要更细心,但是,这些仍然只是浅显的数学知识。我们在学校里花费了大量的时间学习解题技巧,其实对于领会数学的美并没有帮助,相反,可能还让我们对数学倒了胃口。
第三个象限是复杂而且深奥的数学知识。这是专业从事数学研究的人感兴趣的领域,要想进入这个领域,需要一定的数学天分,而且必须非常投入,付出艰辛的努力,一辈子孜孜以求。我们普通人可能只能在门口往里面瞄一眼,里面的神秘世界是什么样子的,我们并不清楚。这个领域的知识是供我们这些普通人膜拜的。
最值得学习的是第四个象限的数学知识,也就是简单而深奥的数学知识。简单,是因为这都是入门的知识;深奥,是因为这些知识是违反我们的直觉的,或是需要我们更缜密地推理的。比如,对随机性的理解、对因果关系的理解、对回归的理解,都属于这一类。这里作者举了一个“消失的弹孔”的故事 :如果需要给战机加装装甲,参考作战后返航的战机,应该加装在弹孔密集的机身,还是弹孔较少的引擎部位呢?二战期间美国军方的统计研究小组成员亚伯拉罕·瓦尔德认为,需要加装装甲的地方不应该是弹孔多的机身,而应该是弹孔少的引擎。为什么会是这样呢?先从一个理论假设来看。从理论上来说,飞机各个部位中弹的概率应该是一样的。那么,为什么返航的飞机机身上的弹孔比引擎上的弹孔更多呢?换言之,引擎上本来应该有的弹孔去哪里了?瓦尔德认为,这是因为引擎被击中的飞机都坠毁了。回来的飞机,机身上尽管留下了很多弹孔,却仍然能够经得住打击,所以才能安全返航。打个比方来说,如果我们到战地医院去统计受伤的士兵,你会发现,腿部中弹的士兵肯定比脑部中弹的士兵要多。脑部中弹的士兵很少能够活下来,腿部中弹的士兵才有更大的概率存活。这就是所谓的“幸存者偏差”,也就是说,我们只看到了幸存下来的,却没有看到那些已经失败和消亡的。
所以这本书主要讲的,就是介绍怎么运用了第四象限的数学方法分析和解决日常生活的问题,作者用寓教于乐的案例与方法,帮助我们重新认识了5个与数学有关的概念,分别是:线性、推理、回归、存在和期望值。
一.线性——预测未来的数学方法?
要想预测未来,最好的办法是从确定性开始。经济学家经常要做预测。有一个笑话说,经济学家最喜欢干的事情就是预测,但是最不在行的事情也是预测。如果要预测短期或者要预测长期相对容易,但最难的是预测中期。
预测短期和长期的时候会有更大的确定性,因为最简单的办法就是线性外推。线性外推的方法是说今天发生了什么,明天还会发生。在现实世界中,确实有很多现象是线性变化,或者是类似线性变化的。比如人的衰老,信息的增长,中国的工业化和城市化的不可逆发展。在线性的趋势中,我们还可以再分辨出硬趋势和软趋势。硬趋势是你可以测量或者感知出来的趋势;软趋势是你似乎可以看得到,似乎可以预测出来的推测。比如二战结束后大批美国军人回国,出现婴儿潮,所以人口数据是我们看得见、可预测的硬趋势;而人们本来认为战后企业订单会暂时减少,经济因此出现衰退,可是并没有发生预想的经济衰退,这就是一种更难预测的软趋势。
相对来说,预测短期和预测长期技术难度相对较小,而预测中期更为复杂。不说别的,在中期会有更多的波动,而这些波动的转折点是很难预测的。比如,即使你知道股票存在着泡沫,但泡沫什么时候崩溃是很难预测的。即使你知道股价被低估,但被低估到什么时候会出现反弹也是很难预测的。
所以,在预测中期趋势的时候,一定要慎之又慎。在预测中期趋势的时候,噪音更多,规律更复杂。我们会遇到波动,又会遇到周期。所以尽管线性趋势是最简单最直观的,但是我们还要提醒自己,不是所有的现象都是线性趋势。盲目地应用线性趋势,有时会得出非常荒诞的结论。
再举一个例子。最近在讨论特朗普减税的时候,媒体经常会提到拉弗曲线。拉弗曲线讲的是,随着税率的提高,税收一开始会增加,但是税率太高,会影响到人们的劳动积极性,税率会减少,税收反而会减少。拉弗曲线是对的吗?从数学的角度来看,拉弗曲线可能是对的。拉弗曲线指出,税率和税收的关系并非是线性的。从常识上解释税率和工作意愿的关系似乎也说的通。但是为什么大部分经济学家对拉弗曲线嗤之以鼻呢?
拉弗曲线因为拉弗曲线缺乏坚实的理论基础。首先,税率不一定是决定政府税收收入的最重要因素,提高税收收入更有用的办法可能是提高征税效率。再者,减税之后,人们的工作积极性也不一定就会提高,毕竟影响人们工作积极性的因素是很复杂的。有两个因素决定了我们工作的积极性,一个是基础因素,一个是动力因素。金钱收入只是基础因素,而动力因素则包括挑战性,获得认可感、责任感和个人成长等等。
大部分经济学家并不是说拉弗曲线的形状不对,而是说,我们在看待税改的时候不能简单用事。现在,美国高收入的税率远比20世纪绝大部分时间要低得多,也就是说,几乎没有经济学家认为美国现在正处在拉弗曲线的下行区域。
特朗普“剪”税(请忽略我拙劣的P图手法)如果简单地评估一下特朗普减税的效应的话,特朗普减税对美国经济的影响未必像有一些朋友想象的那么大。第一,特朗普减税并不是发生在美国经济处在相对低迷的时期。经济学告诉我们,只有在经济低迷的时候,减税对经济增长的刺激作用才更加明显;第二,特朗普的减税明显带有“劫贫济富”的色彩。这会加剧美国的贫富差距,使得本来已经撕裂的美国社会更加分化;第三,如果在减税的同时没有减少政府的支出,很可能会导致美国的债务压力越来越大。
但是美国通过减税来让跨国公司的海外利润回流,资本外流的压力、人民币重回贬值通道、被动减税的压力、资产价格泡沫可能面临的被动萎缩,留给我们中国“独善其身”的时间还有多久呢?这一次先不讲太多,等到后面关于“大国博弈”的读书模块,再来细说(容我先充充电再分享,捂脸hhh)
二、推理——巴尔的摩股票经纪人
某一天,你突然接到一位来自巴尔的摩的股票经纪人的邮件,推荐了一只承诺一周后会涨的股票,你没有理睬,之后的十周里,他每周都推荐一只新的股票,而你惊喜地发现他预测的股票居然全都涨了,那么第十一周,你会选择购买他的股票吗?这就是非常著名的“巴尔的摩股票经纪人”的故事。然而,你或许会觉得神奇,甚至是奇迹的事情,巴尔的摩股票经纪人连续十次猜对股票的涨跌,却是一场背后隐藏着概率的骗局。知道了方法,股市白痴也很容易就能实现,因为收件的对象不止一个。只需要在第一周发出10240份邮件,一半收件人的邮件预测这只股票涨,另一半做相反预测;下一周,后一种收件人就不会收到邮件了,余下的5120人分两批继续收到对半分的不同预测邮件,以此类推到了第十周,只剩下10个人会连续收到十周预测准确的邮件,你猜他们会怎么想呢?所以我们在做数学推理的时候要以这个故事为戒:面对大数据的分析必须小心翼翼,二次方程的根可能不止一个,同一个观察结果有可能产生多种理论,让我们误入歧途的不是事情的真伪,而是推理的时候漏掉了某种假设。
“推理”这一章还提到了“零假设”和“显著性检验”两个非常有意思的概念。
零假设是假设毫无效果,或假设丝毫不起作用,或是假设没有任何相关关系。我们在做研究的时候,要从零假设开始,然后通过做实验,或是搜集数据,看看能不能推翻零假设。怎么推翻零假设呢?这要用到显著性检验,显著性检验其实是一种模糊的归谬法。
归谬法的思路是,为了证明某个命题不正确,我们先假设该命题是真的,然后,我们看看能不能推导出来什么结论,如果这个结论明显是错误的,那么,该假设就是假的命题。也就是说,我们先假定假设H为真,根据H,某个事实F不成立,但是,F是成立的,因此,H不成立。然而在大多数研究中,我们不可能如此斩钉截铁地得出结论,所以显著性检验出现了。
我们先假定假设H为真,根据H得到某个结果为O的可能性应该非常小,但是,很不幸,我们看到事件O发生了,因此,H成立的可能性非常地小。比如,我们假定S先生是工作积极认真的,如果他工作是积极认真的,那么,在工作时间发现他打王者荣耀的概率就会很小,可是,我们却发现,此人确实曾有过该开重要的会议了,他还在打王者荣耀,那这说明什么?说明我们原来的假设,也就是说,他工作积极认真的假设很可能是错的。
所以显著性检验可以分成四步:
1、开始实验;2、假定零假设成立;3、观察实验结果中出现事件O的概率,我们把这个概率称为P值。P值反映的是零假设成立的可能性;4、如果P值很小,我们就认为实验结果满足零假设的可能性很小,你可以通过这种归谬法判断,你原来想检验的猜想具有统计学上的显著性。如果P值很大,我们就得承认零假设还没有被推翻。
当然,显著性检验也有潜在的陷阱需要注意:
1、P值多小才是显著的呢?在显著性与非显著性之间并没有一条泾渭分明的界限。
2、我们不能假设一种因素一定会有影响力。如果我们太想得出有影响力的结论,就可能会操纵实验。
3、不要误解“显著性”。很多科学术语都有误导,显著性这个词就是典型的例子,要分清作用“显著”和“有效”的区别(论文写作要点get√)。
三、回归——孩子的身高是否与父母有关?
研究表明,身材高的父母生出身材高的孩子的概率不是百分之百。实际上,父母和孩子的身高是受到回归效应影响的。在时间纵轴上受影响、具有随机性的事物,无不遵循这一规律。只要数据足够大,人类的身高或者智商,都有趋于平均值的回归性,这就是我们熟悉的“大数定律”。举个栗子,大型医院里每年同一性别婴儿的出生率会比小型医院的更接近50%,你觉得呢?
那些年的公式你还记得吗T.T四、存在——民意真的存在吗?
“少数服从多数”原则简单明了,看似公平,但也仅在涉及两种观点时才能取得最佳效果,只要观点多于两种,众口难调,大多数人的喜好就会有自相矛盾的地方。所以可以这样说,民意是根本不存在的东西,更准确地讲,只有在大多数人意见一致时民意才会存在。如果按照逻辑办事,就经常需要违背大多数人的意见,对于政治家来说,对不一致的民意进行合理运用才是职责所在,只需让大部分人满意就可以了。
五、期望值——什么样的彩票值得购买?
彩票的购买价值和获奖价值是不同的,购买价值是你购买一张彩票所用的金额,而获奖价值是引入概率论之后彩票的真正价值,我们可以用期望值来表达。一个彩票的期望值只有在低于购买价值的时候才是不值得购买的,如果高于购买价值,当你的购买量达到一定数量的时候,彩票是值得购买的。
数学思维其实是我们的一种本能,与语言其实是同宗同源的。我们的祖先曾经生活在树上,经常需要在树枝间跳来跳去,他们需要很好的三维空间意识。当他们到了开阔的草原上,需要判断距离的远近,这就要求有二维空间意识。随着他们的生存环境变得越来越复杂,我们的祖先开始具有判断因果关系的意识。但是,为什么自然而然出现的数学思维,最终并没有固化到我们的日常思维中呢?为什么我们大部分人还是觉得数学太难了呢?这里的关键是抽象。
抽象是数学的工具箱中最具有威力的工具。只要有机会,数学家就会尝试抽象。到最后,他们就会彻底忘掉真实世界,专注于抽象的定义和概念。所以作者才会说,孩子们开始放弃对数学的学习有两个时刻,一是接触到分数的时刻,一是学习代数的时候,是两次阶跃性的抽象过程。抽象可以分为四个层次,“眼见为实”、“想到为实”、“眼见为虚”、“想到为虚”。最后一种,“想到为虚”才是数学思维的层次。数学对象是全然抽象的,它们同现实世界没有简单或者是直接的联系。数学,是一种在抽象之上再抽象的层次,比如我们最早在加减法接触到交换律和结合律,延伸到乘法,再到几何,再到函数、集合、矩阵,如果学的数学系,还会考虑在什么时候下,群能满足交换律。数学的本质是一以贯之的,它就是一种关于模式的科学,有的模式相对简单,有的模式相对复杂,复杂的模式不过是模式的模式,甚至是模式的模式的模式,于是,我们就开始糊涂了。我们可以把数学设想为一个由乐高积木搭成的雄伟建筑。尽管看起来非常复杂,但如果仔细去看,你会发现它是由一个一个简单的模块拼装起来的。数学的本质思想就是简单的东西是复杂的,而复杂的东西其实是简单的。这就回到这本书的主题了,我们为什么要学习简单而深奥的数学知识。
看过“拉弗曲线”,就能理解税率与政府之间的关系;知道“线性中心主义”,才清楚“按比例换算”原来那么荒谬;“大数定律”就是那只不讲情面的、无法抗拒的手;“比盘子还大的饼状图”反映了“真实但是不准确”的数字错位……这些数学常识告诫我们,必须要注意数学出现的场合,离开了附着的情境,数学就会成为有心人的工具,政治选票、市场数据、盈利报告,这种那种,它们往往用繁琐的、累叠的数字来包裹,能够破解它们的就是数学思维培养出的洞察力,这就是作者想要告诉我们的。
以上。
网友评论