美文网首页
第三章 误判物理学和数学9.非典型证据

第三章 误判物理学和数学9.非典型证据

作者: 监利一佛 | 来源:发表于2018-09-13 00:31 被阅读0次

      第九节 典型性证据

1.环境、状况和条件的变化

    我们总是喜欢寻找在过去 20 年来行之有效的系统。如果能够根据过去 20 年间成功的方法赚钱,那所有的富人都是图书馆管理员了。

                                  ——沃伦·巴菲特

      罗素在《哲学问题》曾经说 :“每天都喂鸡的人最后亲手扭断了鸡脖子。” 虽然历史常常是未来的好向导——但也不尽其然。统计学是对历史的记录,而不是对未来的预测我们不能理所当然地认为未来是历史的重现过程和情况都在不断变化中。巴菲特说 :“技术条件以及与人类行为有关的各个方面都让未来与历史大不相同。”

      在利用过去的证据预测未来可能出现的结果时,我们需要考虑到条件发生了哪些变化。企业和经济状况的本质就是变化,比如说,竞争和需求在不断发生着变化。如果竞争日趋多元化或者需求下滑,我们也必须作出相应调整。问问自己 : 为什么过去发生那样的经历? 有什么样理由可以表明未来将与过去情况相似? 环境发生变化了吗? 条件相似吗? 过去的背景和情况在目前还存在吗?

    如果没有意识到过去跟目前情况的区别.就有可能犯错误。正如巴菲特说的 :“这种错误就像是一位棒球教练在判断 42 岁的中场手的未来潜力时,以他职业生涯中平均打击率作为判断依据一样。”

      管理绩效同样受环境的限制。个人在一种环境下能够成功并不能保证在另一种情况下同样能够成功。不妨问问自己 : 这家公司或者管理者在应对挫折时的能力如何?

      “如果重点宣传疾病,而不是药品,我们的销量肯定更好。”创思公司制药部门的管理人说。

      某疾病的患病率真的是在增加吗? 对于一件事的概率的变化,我们不要仓促得出结论,首先应该考虑其他因素。比如说,它的变化可能是由于疾病诊断准确性要高于以往的缘故。我们常常只关注已被命名的事物,比如说先前一种疾病只被泛称为“ 疾病  X” 或“不明原因”,现在被重新分类或得到一个名字。此外,还可能是因为搜集数据和报告数据的技术在进步,也可能是企业动机在作用。比如说,通过炮制一种新情况,重新定义一个疾病或者夸大一个小疾病等,让更多的健康人被纳入患者范围,从而扩大市场。

      如果条件发生变化,我们应该同时修正自己的假设,以反映当前的环境。在预测未来时,为了考虑到情况的变化性,我们不妨问问自己 : 什么东西发生了变化?  不利事件的发生方式是不是增加了? 这种变化是永恒的还是暂时的?

2.单一案例或非代表性样本

      5 名医生中有 4 人推荐这种药。  这句话并没有表明总共观察了多少医生,也许仅有 10 人, 所以该观察结果并不能推广至所有医生。样本数量过少则不具备预测价值。样本数量越少,统计结果涨落越大,发生机会事件的可能性也越大。我们需要有代表性的参照组,足够大的样本、相当长的观察时间

      小样本得出的风险会高于现实或者低于现实。为什么? 因为小样本将使得定位不明确。

    查理·芒格认为搜集到具有代表性的数据很重要—— 即使这些数据只是接近而已 :加利福尼亚州水系统的设计只参照了很短一段时间内的气象历史。如果设计者愿意多多参看过去不完美的记录,把时间回溯到100 年前,可能意识到目前水系统的设计并不能很好地应对旱情。

      这种情况并不新鲜——每个人都有自己擅长量化的信息,也有其他一些难于量化的信息。所以,有些人只根据能够量化的信息制定决策,而忽略那些在本质上并不能计算出来、但却更重要的信息——即使它们能够为促进正确的认知结果起着至关重要的作用可以说,在威斯科和伯克夏,我们避免这种做法。我们抱着同凯恩斯一样的态度,用沃伦一直喜欢引用的一句话来说,就是 :“粗略的正确总比精确的错误要好。”换句话说. 在重要的事件面前,我们不是仅仅根据能够量化的东西作出判断,而是自己先试着作出预测

3.运气成绩

    没有一个胜利者相信运气。

                                            ——尼采

      过去的表现并不能保证未来的结果。所以要考虑在相似情况下的证据或者普通大众身上发生的事情。

      有时候,历史记录并不是对未来事件良好的指示仪,因为运气常常发挥作用。假设房间里有 1,000 只猴子,每只猴子都在试着预测利率的方向(或上或下).10次预测后,有 一只猴子在预测利率变化方面的记录堪称完美。他被视为天才和历史上最伟大的经济学家,即使这只是运气使然。只要我们有足够庞大的预测师队伍,在这种运气参与的预测过程中,终会有一个人能够预测正确所有利率变化,成为媒体纷纷追逐的对象和众星捧月的英雄。他将四处演讲,传播自己的真知灼见。

      有时候我们只看到表现耀眼者。部分原因是因为胜利者总有炫耀的天性(1只猴子),而失败者(999 只猴子) 却很安静。其实大多数时候,人们对失败者是提不起兴趣的。如 果在庞大的人口基数中出现胜利者,我们不必为此感到惊讶, 就像在 10,000 个猴子中发现 10 个天才一样。

      在衡量表现时,我们必须同时考虑到成功的人数(1 只猴子)和失败的人数(999 个猴子),还有参照群体的总数 (1,000 只猴子)。在这种 与运气有关的事件中, 参与人数越 多(或者猴子越多),优异者的表现越有可能是运气和机会在帮忙。除非我们在高水平表现群体中总结出某一种共同的品质,它有可能是制胜的原因,而不是运气在作用。

      如果忽略运气因素,仅仅根据结果来得出结论,可能会犯同样的错误。以100 个猴子为例,如果每个猴子都掷一次骰子,挑选出掷出 6点的 16 只猴子(1/6×100),为了治 疗它们“掷出 6点”这个倾向,我们给它们使用了一种新药。服用新药后,让它们再次投掷骰子。这一次只有2只或3只猴子(1/6×16)掷出了6点,表明其他猴子都“痊越”了。 因而得出一个错误结论 : 这种药的效果立竿见影。

      一个行骗高手设置了一个陷阱。他打电话告诉约翰一个秘密消息 :“仔细观察这只股票,它肯定会涨。”在连续三次预测正确后.约翰给他寄去了钱。而这个骗子就此消失了

      约翰并不知道,这个骗子给 80 个人打了同样的电话。他告诉其中一半人说股票会涨,对另外一半人说股票会跌。当然,他肯定有一个预测是正确的, 40 个人被他打动了。 第二次电话后,20 个人被说动了。在第三次和第四次电话后,  10 个人认为他是天才,纷纷给他寄出了钱。

4.忽视失败

    证据必须来自于一段时间内成功和失败的概率。我们常常只考虑成功和有利的结果用流行病学上的术语来说就是生存偏差,即只研究某个疾病或研究结果的幸存者的特征不考虑在研究中死去的对象。如果这些死去的病人身上有更高的风险因素,这些研究则削弱了风险因素和结果之间紧密的联系。这种生存偏差也同样出现在所有在事后进行的研究中( 包括回测)。它们只把焦点锁定在幸存下来的个案或者病人身上,而死去的人并不包括在样本集中。此外,还有人只公布积极结果,忽略不利结果,故意选择和省略某些信息。

      如果我们只研究成功案例和幸存者,这样的表现记录可能好于现实中的平均表现。查理·芒格说, 我们给予失败案例的关注太少了 : 许多商学院毕业生和几乎所有的咨询师都自以为企业可以轻易地通过购买毫无关联的业务来改善结果。那根据这个流行观点只要我们采取这个方法, 并采纳正确的“企业规划”,聘用合适的“专家”, 每个铁路系统就不是在新型竞争、过时的严密法律和联合规则下保持彼此间的连接畅通,而是彼此分离,纷纷变成了第二个联邦快递公司和联合包裹服务公司,甚至成为具有爱默生电气相同风格的另一位杰出表现者。

      根据直接和间接的经验,我们对企业通过收购来解决问题这一做法并没有那么乐观我们认为这些成功的记录吸引了太多人的注意,使得乐观情绪过甚。如果大家都只单单从施特菲·格拉芙(Steffi Graf)和伊万·伦德尔(Ivan Lendl) 的表现来预测一流网球队的大好前景,或只从赢家来推测加州彩券局给自己带来的好运,这种观点也不足为奇。我们不妨逆向思考一下,会发现反面观点更合理。我们对企业收购失败给股东(或业主) 带来的不利后果给予的关注太少了,比如哥伦比亚广播公司收购杜蒙特公司,施乐公司收购科学数据系统公司,通用电气收购犹他国际公司(Utah International),以及埃克森石油收购瑞恩电气......还有雅芳的收购案等。

      在1999 年,大家都在说 : “互联网企业的表现真是一枝独秀。”

      我们常常只看到占尽风头的成功企业,忽略了背后的失败者。特别在牛市中,成功的人总被媒体铺天盖地报道。问问自 己: 考 量 5 年表现时 ( 假设有  1 0 0  家互联网公 司 ), 相关的参照群组是什么? 哪些表现出色(假设 5 家),哪些表现不尽如人意( 假设 80 家)。有哪几家企业已经关门大吉( 假设 15 家)。从这些问题的答案中,我们可以判断出结论的真伪。

      创思公司技术部门研发出一种新的防御体系,宣称成功率达到 80%。 约翰观察了 10 次测试,发现 8次全部失败, 仅 2 次成功。

      1992 年,麻省理工学院科学和国家安全教授西奥多·帕斯托测量了在海湾战争中爱国者反导弹系统的威慑力( 不包括它带来的心理和政治影响)。根据录像带资料, 他研究出爱国者导弹在执行拦截飞毛腿导弹的 26 次任务中,25 次失败,只有 1 次成功。他告诉众议院政 府工作委员会 : “录像证据赫然显示爱国者导弹在沙特阿拉伯的拦截率并没有达到 80%。”五角大楼最初的报告中声称总共发射了 47 枚爱国者导弹用来拦截飞毛腿导弹,成功率 达到 80%。后来,一份国会报告中总结说爱国者拦截导弹只成功地拦截了 4 枚飞毛腿导弹。

      假设把约翰的观察作为有效的随机测试样本,如果技术部门的声明是正确的,那他正好观察到 2 次“成功”和 8 次 “失败”的可能性有多高?

      这是一个二项重复实验的例子。它是指对每次只有两个可能性结果( 如成功或失败)的试验重复进行的过程。假定在独立试验中得出的概率为 0.007%。如果该部门的声明是正确的,那约翰就看到了一个小概率事件但更可能是该部门在弄虚作假。

5.变异性

      你可能将永远猜不到一个人下面将要干什么,但你可以准确地说出大部分人在忙什么。每个人都不同,但是百分率是保持不变的。统计学家这么说。

        ——作家柯南·道尔(摘自《四签名》)

      在评价可能的结果时,看看这些可能性结果的总体分布——平均值、变异性,以及极端结果和后果。我们所说的变异性指的是单个结果距离平均值的偏离度。偏差越大,则变异性越高。问问自己 : 过去的结果是什么? 这些结果距平均值偏离多少? 过去引起变异性的是哪些因素? 它们发生变化了吗?

      正态分布曲线显示出结果的分布状况有时候可以帮助我们找到最常见的结果和结果的变异情况

      一系列结果的分布面当然很广,但有些结果比其他结果更常见。各种独立和随机因素组成了一个钟型频率分布曲线。这表明最常见的结果落在了分布的中央,其他结果落在两端。结果偏离中央越远,它的频数越低

    正态分布结果的例子包括成年人(取决于基因、饮食或者环境的影响)的身高和体重.气温、车祸、死亡率或者电灯泡的寿命等。

      成年女性的平均高度多少?

      如果随机选择 1,000 个成年女性并测量她们的身高,最后的分布结果看起来像钟型曲线。她们的身高将集中在平均身高附近,曲线的延伸宽度表明与平均身高的偏差度状况。把一个女巨人放在一个大样本中,将不会改变样本的平均高度。

      同样的推理方法可应用于汽车保险公司参与相同项目的保险公司越多,平均值将可以作为很好的参照值,而一次费用不菲的汽车事故并不会对结果产生影响。平均数具有代表性,也具有预测价值

      但我们并不能把正态分布曲线用于那些数额巨大和风险概率较高的保险中。对于那些擅长为特殊事件承保的保险公司来说,关键要看结果的变异性,而不是平均值

      创思公司新的计算机软件 占领了 90% 的市场份额。

      许多时候,正态分布曲线并不能给我们展现真正的现实。一个有利或不利的极端事件可能对平均值产生剧烈影响。我们之前已经谈到过在频率和规模上并不平均分布的案例。相对于平均值来说,单一事件发生的次数越少、时间越短,或者影响越大,则意味着考虑变异性就越加重要,一些因素也越加难以预测。比如说,假设图书的平均销售额为 20 万美元,但如果样本中只包含了一本畅销书的极端个例(《哈 利·波 特》系列丛书),  平均值并不能帮助我们预测新书的平均销售额情况。其他的例子还包括电影卖座状况(电影《泰坦尼 克号》)、金融市场的价格变化(一种货币突然的巨幅贬值、  飓风带来的损失〔卡特里娜飓风〕), 或者技术创新的影响(创思公司的新软件)。 比如说,目前还没有代表性软件作为参照,所以过去的平均值不能证明什么。

      我们可以清楚地了解到过去发生了什么但却不知道未来最高强度飓风的破坏级别或发生的概率。在回首过去的时候,我们只能在历史文件中查看到破坏力最强的飓风情况

      我们不能使用过去的统计数字预测一些罕见和巨大影响的事件,我们不知道它们发生的时间、频次或者影响力,也不能准确地计算出它们的特征或发明出一种计算公式。我们惟一知道的就是它们必定会发生,而且会带来深刻的影响。有时候,可能一些证据会告诉我们这些概率是否发生变化。此外,许多事件并不是独立的,而是彼此相连。拿金融市场来说,市场是有记忆的,资产之间彼此互动,一个负面事件将可能引发连锁事件。 学者 纳西姆·尼古拉斯·塔勒布 曾经在《黑天鹅》一书中表示,使用正态分布曲线来分析一个能对现实产生深刻影响的重大事件发生的概率非常危险

    10 个人总共拥有 1,000 万美元的财富,每个人的平均财富为 100 万美元。

    如果其中一个人的财富为 1,000 万美元而其他 9 个人身无分文呢? 平均收入如何飞速上升? 不妨假设公交车上有  10 个中产人士,一个人下车后,上来了一个亿万富翁。

      约翰目前可以选择两个游戏中的一个。每个游戏都有3 种同等可能性结果。这个游戏也许是运气游戏、保险、投资其中的一种(参见表 8)。

第三章 误判物理学和数学9.非典型证据

      如果他不断地玩两个游戏,两个游戏的预期价值都是40.  所以选择哪个游戏并不重要。但假如约翰只能玩一次呢? 应该选择游戏 1,因为它的变动性较小,稳定性较高。

      有人邀请约翰投资一家私人企业的资本基金,该企业经理人的投资记录显示过去 5 年来,他们的平均回报率达了到 25%。

      如果不仔细查看该企业的真实表现,这个数据并不能代表什么。在仔细查看了企业回报如何产生的情况后,约翰发现该企业管理人总共完成了10笔交易。其中一个交易获得了惊人的成功,而其他 9笔生意均以失败告终。这笔成功的交易是归功于运气吗?

      必须记住一点,有些人在报告自己的业绩表现时,常常故意遗漏数据。

      玛丽在报纸上看到房价平均达到 100万美元。

      这个报道也许会误导玛丽。假设有 100 处房产,其中 90 处房价为 50 万美元,而另外 10 个“城堡”的售价为 550 万美元呢?我们必须注意其中的差异。

      一家企业的主管人员告诉我们,过去 3 年来, 他们公司的平均盈利为 5,000 万美元,但在仔细查看了一番记录后,我们发现其中出现很大的波动,企业的表现也一直在滑坡 : 1998 年为 1亿美元,1999年为5,000 万美元,而 2000 年为 0 美元。

      中间值分布在中间的一个数值,有一半结果位于它的上方,一半结果位于它的下方。如果 9个人中每个人各有 100万美元,还有 1 人有 10 亿美元,平均财富为 1.01 亿美元, 但是中间值仍为 100 万美元。

      1982年,杰伊·古尔德(Jay Gould)被诊断出患有一种罕见的致命性癌症,发现疾病后存活下来的时间中值为 8个月,但他顽强地与癌症斗争了 20 年。

      发现疾病后存活的时间中间值为8个月.这表明每个病人都将在 8个月内死亡吗? 古尔德心里很清楚,这个数据只表明有一半人还没到 8个月就死了,而另外一半人活的时间则相对较长。他同时发现 8个月后的结果分布区间更广。这很有意义,它意味着8 个月前的结果分布比 8个月后的结果分布区间要窄,表明在 8个月后存活下来的病人寿命长短不一。我们不能把平均数或者中间值的结果运用在每个个体身上,还必须看到所有结果之间的差异和变化。这也意味着衡量一个医疗效果应当以好于中间值还是差于中间值的标准来决定。

6.回归平均值效应

      “回归中值”是弗兰西斯·高尔顿先生(达尔文的表兄) 提出的观点。他宣称,在一系列运气事件中,偏离平均值的异常出色或糟糕的表现、高分或者低分、极端事件等发生后,紧接着会出现普通表现或者不太极端的事件。如果我们的表现非常惹眼,下次表现就会稍逊一筹,而如果表现不尽如人意,下一次就有可能做得更好。但回归平均值并不是一个自然法则,而仅仅是统计学上一种倾向,而且它的发生需要相当长一段时间

      因对新员工的表现不满,约翰让他们参加了技能培训课程。在课程结束后,他对新员工的技能再次进行了考核。

      他们现在的分数肯定要高于首次考核的时候。约翰得出了结论 :“技能培训课程的确让他们的技能出现了提高。”不一定如此。他们的高分可能是回归平均值的结果。因为这些员工第一次测验处于技能水平的低端,即使没有参加技能提高的课程,他们也会有技能提高的迹象。此外,他们之前的表现可能是许多原因造成的:压力、疲劳、生病、注意力分散等,或许他们真正的能力并没有发生变化。

    我们的表现经常围绕着平均值上下变化.极端的表现在下一次就显得不那么极端。为什么? 因为测量方法做不到百分百地精确,任何测量方法都包含随机误差。当测量结果过于极端,它们可能部分是由于运气引起的而在第二次测量时,运气的作用性可能下降

      如果放弃使用不成功的方法后,转而使用另外一种方法,即使新的做法实际上与前一种方法相似甚至更糟,我们也有可能在这一次表现中更出色。

      在第二章和第三章中,我们阐述了造成误判的原因,并提出了如何减少误判的方法在进入第四章前,我们总结一下过去的错误可以给我们哪些借鉴。

事后剖析

    生于西班牙后侨居美国的哲学家乔治·萨塔亚纳 (George Santayana) 曾经说 :“忘掉过去,必定会重蹈覆辙。” 如果不思考过去的事情,又怎么能理解当下的事情? 我们常常乐于忘记自己的错误,忽略了它们的重要性。我们应该坦率地承认自己的错误,并从中学习。我们也应该审视错误的原因, 采取行动防止重蹈覆辙。不妨问自己这些问题 :

1·行动的最初理由是什么? 我当时了解到什么,设想是什么? 当时可选择性方案又是什么?

2·同我最初的设想对比,实际情况是怎么样的? 什么是可行的,什么不可行?

3·考虑到手里掌握的信息,我当时能够预测出未来发生什么吗?

4·什么最有效? 为什么我应该换个做法? 我没有完成哪一点? 错过了什么? 从中必须得出什么教训? 必须停止哪些行为?

      人为什么不喜欢事后检讨呢?查理·芒格说 : 人总是很容易忘记自己的错误,因为时刻铭记着它会让自己的名誉受损。鉴于此,一家了不起的企业——强生公司——制定了一个系统,在大型收购活动完成的两年后就进行事后检讨。他们把最初的收购目标和理由再次翻出来,并找出当时否定和支持的那些人,把他们当时的观点与收购案的结果进行一一对比。

      沃伦·巴菲特说 :“ 成功的点子被大肆宣扬,而错误的决定不是在中途夭折,就是用各种理由来美化它。”他继续说 :  管理人似乎不乐意讨论投资方案或者收购的结果,而在一两年前,他们曾如此详实地向董事会力荐这些方案和收购活动。至于以后的实际情况与方案有什么出入,他们不想把数据具体列出来,这也是人之常情。

      但我认为一个偶尔光顾病理科的医生才是好医生。一个好的经理人或投资者应该是那些经常审视过去每个重要决定的人,并看看哪些成功了,哪些失败了——计算出自己的平均击球安打率。如果你的安打率太差,最好把决策权交给其他人。

      我们也可以使用事前预防法帮助我们预测问题和找到关键的薄弱环节。比如说,在做出重要决策前,想像一下失败的后果,并问问自己 : 什么因素会造成这种结果?

      培养出良好的思维方法的指南和工具是什么?  查理·芒格为本书第四章做了一个前言 : 伯克夏其实是个老式传统的地方,我们希望能够严守秩序,保持这种风格。我不是说陈旧的迂腐,而是永远从最基本的事实出发 : 基本的数学、普通常识、基本的恐惧,以及根据人类行为诊断出的人类本性,然后作出预测。如果你也能够严守纪律这样做,我认为你将受益匪浅。

相关文章

网友评论

      本文标题:第三章 误判物理学和数学9.非典型证据

      本文链接:https://www.haomeiwen.com/subject/vkeigftx.html