《经验的疆界》2016年总结的时候,说新的一年要写十篇读书笔记,真的写起来才发现好大个坑..读一本书的时间是1的话,做笔记至少要多花1-2,再思考总结写成文又要2-3...不过自己挖的坑跪着也要填完的。
那就来吧,第一篇,《经验的疆界》。
作者背景
首先来看看作者,詹姆斯·G·马奇,以下是抄豆瓣的:
詹姆斯·马奇James G.March,2003年,两位管理学者制作了一张200人的管理大师排行榜。然后他们问了上榜的大师们一个问题:谁是你心目中的大师?排在第一的是20世纪最伟大的管理思想家德鲁克,排在第三的是诺贝尔经济学奖获得者赫伯特·西蒙,而在德鲁克之后,西蒙之前的则是几乎没有公众知名度的詹姆斯·马奇。
马奇出生于1916年,1953年获得耶鲁大学博士学位。1964年担任加州大学社会科学院的首任院长,1970年成为斯坦福大学的管理学教授,同时也担任政治学、社会学、教育学教授,是名副其实的跨界大师。马奇被公认为是过去50年来,在组织决策研究领域中最有贡献的学者之一,他在组织、决策和领导力等领域都颇有建树。
说实话在这本书之前,管理学方面的书也就是在许多年前走马观花囫囵吞枣地看过几本书。打算以这本书为契机,再回头系统地读一下。这本书是在雪球上看到有人提起,翻了一下简介,觉得很有意思,于是找来PDF读了。读完有几点感想:
- 书不厚但是知识密度很大,正文92页,后面参考文献列了3、40页。(所以这种书要真精读起来阅读量会是书的几倍...我是读不了这么细致..笔记也就挂一漏万了)
- 这本书谈的主要是“是什么”而不是“怎么办”,或者说在作者看来有些问题是“无解的”。读完可以自省,对一些问题引以为戒,但是不适合想学方法论的童鞋。
- 中文版的翻译读起来...总感觉透出浓浓的金山词霸的味道,于是难读程度又上了一个台阶..也许是这类书确实难翻译,信达已经不易了。
说了这么多看来都是缺点,其实瑕不掩瑜,这的确是一本值得一读的好书,让我们看看这本书到底在说什么。
这本书讲了啥
组织要生存,就要不断提高与环境的匹配度。实现的方式有适应环境和改变环境两种。强者与领头者往往会试图改变环境,但长期来这样做有副作用——适应能力会衰退——特别当霸主地位消失时,很容易一蹶不振(想到了NOKIA)。
那么组织是如何实践另一条路,也就是适应环境的?
通过经验学习,是组织和个人适应环境过程中常常使用的方法,人们也渴望从经验中获得智慧。然而作者发现,在这个过程中存在许多的问题,更糟糕的是,有一些问题是与学习者无关的——这是一种经验本身的缺陷,所以当我们使用这个方法的时候,一定要意识到它的局限性。在某些情况下,经验是一个好老师,但是大多数时候,我们需要超越经验的学习能力(具体怎么做没有说)。
作者把学习分为两类:低智学习与高智学习。
- 低智学习:通过试误、模仿、天择三种机制来复制成功。
- 高智学习:通过讲故事、建立模型、发明理论来阐述事物的因果。
这两种方法都是对经验的利用,而人类有进行高智解释的倾向,然而作者对高智学习的效果是存疑的,许多看似高智学习的行为,只是人们一厢情愿的诠释,其中就包括了各种管理学理论(总感觉这是在端自己饭碗),它们的效果往往和低智学习也差不多,或者说解释性很好但预测性很差。
在“高智学习”中,作者主要谈了组织对于“故事”和“模型”的使用,对于这类学习的效果作者依然是不乐观的。作者认为对于组织来说,“故事”和“模型”具有三种价值:真理价值、正义价值和美学价值。与其说组织使用他们实现寻求真理的目标,不如说他们是在寻求“正义”——也就是一种“共识”。这一点和《人类简史》中提到的概念很类似——人类之所以牛逼就是因为靠着“神话”和“想象”形成了“国家”和“民族”的概念,从而突破了动物群体组织个体数的极限。从这一点上来说,能够“讲好故事”似乎是比“掌握真理”从根源上更适应人类社会的需要。
最后作者还谈了新事物的生成机制。简单来说,基于经验学习提升组织适应能力对新事物是有抑制作用的,然而组织又在追求着创新,在这种矛盾中,新事物是如何出现和成长的就是一个有意思的问题了。
写完发现这样介绍损失的细节太多,只能说原书已经十分精炼。但愿这个介绍说清了大概内容,并且让你有一点点想要读它_。后面是把书里提到的比较有意思的概念和阅读中的一些想法记录一下,算作这本书的扩展阅读内容吧,这些东西没有什么逻辑顺序和内在联系,写到哪里算哪里~
经验学习与机器学习
2016年,Alpha Go横扫人类围棋顶尖高手,曾经被视为“天堑”的海量计算最终败给了“深度学习”。AI似乎已经注定成为未来科技的主要方向之一,而说到AI就必然要讲“机器学习”。
最近正好也在看coursera上machine learning的课程,第一课开篇讲到机器学习的定义。
Tom Mitchell provides a more modern definition: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
这段定义有点绕,简单翻译,如果一段程序对于一组任务T的性能度量P通过经验E获得了提升,那么就可以说这段代码学习了经验E。
还是有点绕,让我们举个栗子:
E = 下很多盘围棋的经验
T = 下围棋比赛的任务
P = 程序赢得下一盘棋的可能性
当程序通过下很多盘棋得到的经验,帮助它提升了下一场棋的胜率,那它就是从这许多盘棋中进行了学习。
据说Alpha Go运用了“机器学习”中“深度学习”的方式,通过对千万盘棋的学习,掌握了——据柯洁的说法——与人类千百年来总结的棋理非常不同的棋道,而且就目前看来已经稳稳的技高一筹。
看到这段机器学习的定义的时候,我就想到了书里讲到的经验学习。其实这种通过训练集来学习掌握成功之道的方式,不正是经验学习的特征么。只是不知道这种情况下,是否也会存在经验学习中的各类问题?目前的想法是,围棋这种学习对象,还是属于较为封闭的系统,并且目标与规则都很明确,再配合海量的训练资源,本身就属于适合进行经验学习的场景。即通过大量重复训练和总结,能够掌握获胜的方法,于是掌握了学习方法并且“性能”上更出色的电脑打败人类也就不足为奇了。
进一步想的话,机器具备了“学习”的能力后,是不是所有适合进行“经验学习”的场景,人类终将都败给电脑?那现在说的绝大部分人的工作将被替代还真不是危言耸听。如果真有那么一天,人类最后的堡垒会在哪里?直觉?艺术?灵感?情绪?咳咳..一不留神好像又扯上了哲学问题,就此打住。
老虎机问题与T型迷宫强化学习
大数定律与小样本偏见
大数定律,简单来说就是对于一个概率一定的随机事件,只要重复的次数足够多,那事件发生的频率就会趋近于它的概率。在数学上还分为了强弱大数定律两个版本,不过那只是收敛程度的差别,对于理解这个原理并没有什么影响。
从这个定律里,我想能总结出这些结论:
-
当样本足够大,可能性再小的事情也会发生。
这一点和前些年热起来的“黑天鹅”概念也许可以相互联系起来看:一些看似绝不会发生的事情发生了,也许并不是因为什么神秘力量在作祟,而是因为这些事情虽然概率很小,却并不等于0,在足够多的重复次数下,它是必然会发生的,只不过我们无法预测它会在何时何地发生。
而且按照这本书里提到的说法,习惯根据经验学习的我们,对于极其稀有的事件,无论是正面还是负面事件,我们都会低估其发生的可能性。对于负面事件,这种低估导致我们无意识地拥抱风险,复制增加这类事件发生可能性的行动,从而提高了负面事件发生的可能性。
进一步引申的话,从“大数定律”中似乎又可以证实“墨菲定律”的结论是有道理的——当我们知道一个坏事有可能发生,它就必然会发生。于是我们能做的也许不是想方设法去避免它(从成本上或是预测难度上不可行),而是是对于一些看似不可能发生但是后果严重的事情也要做好应对的准备。投资上有一句话叫“重要的不是预测,而是对策。”说的就是这个意思。其实这个思路在各个领域都是适用的,比如对备份的数据一定要做恢复演练(Gitlab躺枪O)而不是寄希望于不会遇到需要恢复数据的情况。对于个人来说,也许是时候考虑去买一份靠谱的保险了。(如何买一份靠谱的保险也是个大坑,题外话就不说了.._) -
反过来,当样本太小的时候,总结的所谓“规律”都是不靠谱的
这也是所谓的“小样本偏见”,似乎在学术上还有个高大上的名字“启发式认知偏差”(heuristic bias),而“小样本偏见”是它的一种表现形式。
在体育运动中,曾经有过许多基于这种偏差总结的经验,特别是所谓的“世界杯定律”,比如“巴西队的礼物”:
这是世界杯历史上最著名的定律之一,其定律是:只要巴西国家足球队称雄,下一届的冠军就将是主办大赛的东道主,除非巴西队自己将礼物收回。
1962年,巴西夺冠,4年后英格兰本土称雄。1970年巴西三夺金杯,1974年轮到东道主西德捧杯。1994年巴西在美国夺冠,1998年法国在本土一鼓作气首次捧得大力神杯。1958年,巴西在瑞典夺取了冠军,4年后他们成功卫冕,收回了“礼物”。
直到2006年,这一魔咒被破解:在德国,巴西队和东道主德国国家足球队都没能夺冠。
其实“破解魔咒”的也不是什么魔法,而是这些定律本身只是基于一些有限数据样本的拟合,当数据样本逐步增加后,这类“规律”自然就失效了。
所以,还是尽早放弃自己通过一些简单指标计算发明一个“神奇公式”就能预测股票涨跌的幻想,更不用提所谓的“彩票中奖号码走势分析”。因为即使是经过了大量回测、优化的量化策略,也往往逃不过“解释一流,预测无力”的命运。根据本书的说法,这种基于复制成功经验的学习方式,并不能接近成功的本质,在一个稳定的环境下往往也只能得到局部最优解,更何况我们面对的是如此复杂多变的一个世界。
首次超越定理和竞争上限定理
这个在文中简单提到,但是没有具体解释,如果有了解的也可以给我普及一下知识。
首次超越定理说的大概是,例如掷一个无偏硬币,要多少次之后正反面的次数多少会发生变化,即正面的次数超过反面(或者相反)。直觉上需要的次数比平均而言的实际次数要少得多。
竞争上限定理说的是,假设有两个相同的竞争者,每次竞争的绩效取自一个平均值为0,标准差为1的正态分布。如果排名按照历次绩效的平均值,那对于t次绩效较高的那个人来说,t+1次绩效平均值更大的可能性也会增大。根据这个绩效来评判两个人,排名会在很长时间内保持不变。
我觉得这主要是讲初始条件对于学习结果的影响,通过复制成功来学习的结果很大程度上会被一开始的结果左右。这让我想到了心理学的首因效应,假设人们普遍使用复制以往经验的学习方法(按照本书的说法这确实是被普遍使用的),那么这两个定理似乎解释第一印象(特别是多方进行竞争时)的重要性。
练习效应、胜任力陷阱、马太效应
复制成功,众选项的潜在结果分布受到历次所做选择和历次变现结果的影响。每次选择的结果显然会影响被选选项,因为产生了实际的变现结果。但是即使是未被选择的选项,潜在的结果分布也可能会受到影响。
复制成功本身有可能造成消耗或是改进,其中一个比较好的例子就是“练习效应”。
练习效应:
优势有可能因为开发而丧失——比如网球比赛中,把球打向对手的弱侧,短期来看是一个获胜的好方法。然而每次这么做都让对手的弱侧得到了练习的机会,削弱了“打向弱侧”这个选项的成功概率。
但是更多情况下,练习效应都是正向的——我们选择的选项让我们得到练习的机会,从而提高在这个选项下的表现。也就是说,让所选选项的结果分布平均值变大、标准差变小。
但即使是正向的练习效应,也不见得对复制成功是好事——甚至正向的练习效应常常会让我们错过最佳选项,这个问题一般被称为“胜任力陷阱”。
胜任力陷阱:
假设有两个选项,其中一个潜力较高但学习曲线较为陡峭而另一个潜力较低但是容易上手。因为练习效应的缘故,选择潜力较低的选项,会快速提高这一效果的变现结果,从而让学习者更愿意选择——从而错过了高潜力的选项。
组织常常面临这样的场景:老做法(或者流程、形式),缺点较多,但是用顺手了;新方法有很多优点,但是不大会用。因为练习效应的累计,组织更可能选择前者,复制成功的做法会加重这种现象。
至于如何解决这个问题,也许正是区分了伟大与平庸公司的分界之一。“It always comes down to people.”这是一篇写Google的文章里提到的,真正地把最好的人才作为一个公司最重要的资产,也许是其中的关键。只有在这个组织中充满了不断寻求超越自我的人,才会帮助组织保持活力而非落入“胜任力陷阱”中从此无法挣脱。
当然,成功也会带来更多的成功,典型的就是所谓“马太效应”。
马太效应:
马太效应的名称来源于《新约·马太福音》:“凡有的,还要加给他,叫他多余;没有的,连他所有的,也要夺过来。”
有意思的是,几千年前老子也提出了类似的想法:“天之道,损有余而补不足。人之道则不然,损不足以奉有余。”
历史上一再发生的土地兼并和如今互联网经济下“赢家通吃”的现象都一再向我们展现着“马太效应”的魔力。很多时候,我们的不安也来源于此,无数家长们把孩子们早早推上“起跑线”,也是害怕在一场会被“马太效应”左右的竞争中失了先机。当然有些情况也是马太效应无法解释的,比如在一些领域存在所谓的“后发优势”。
风险偏好与福利彩票
在许多经济学或是心理学的书中,都谈到过“风险偏好”的问题。有一个共识是,人们在面对收益的时候是风险厌恶的,而在面对损失的时候是风险偏好的,即使他们的数学期望一致。
最常见的例子是,如果有一个选择题,100%获得10块钱还是10%机会获得100块钱,大多数人会选择直接拿10块钱。如果反过来,100%损失10块钱还是10%可能损失100块,大多数人又会选择搏一下那10%的概率。
书中对于这一点给了个经典的解释:“因为金钱的边际效用递减,所以确定选项的期望大于不确定选项的期望。”
我对这个解释理解是,对于一个快要饿死的人来说,第一个馒头和第十个馒头的效用是不一样的,第一个是用来救命的;如果认为金钱也是这样,那第一个10块比第十个10块的效用要大,因此100块的实际效用是低于10个第一10块钱的,所以10%几率的100块实际期望低于一个确定的10块钱。
而这本书说,及时不考虑所谓的边际效用或者心理人性,通过简单的复制成功的学习方式,也会产生这种结果——复制行动时往往根据初始几次的尝试结果决定偏好,于是开始选择拿100块结果一无所获和选择承受风险却没有损失就是大概率事件——从而形成了人们的风险偏好选择。
这个解释是很合理的,然而当我们把数字放大之后,似乎又会有一些变化。比如按照这个解释的话,为什么人们会乐此不疲地花2块钱去争取一个1700万分之一概率的得到500万奖金的机会就是一个难解之谜了。我能想到的区别可能有:
- 在这个模型下人们也在学习,只不过学习对象不是自己的中奖结果经验,而是被广为传播的“别人获奖的经验”,也就是说,在这时候大家并不是在“试误”而是在“模仿”。而由于信息传播过滤,人们通过媒体看到的都是具有“幸存者偏见”的结果,从而导致人们大大高估了中奖的概率。由此可见,媒体真的是一个很强大的力量,能够扭曲人们的认识,所谓众口铄金,三人成虎。口碑营销之所以成功,恐怕也多少是建立在人们乐于“模仿”的基础上。
- 也可能是当奖金数量高到一定程度之后,会模糊人们对这笔钱的效用估计——我们能清楚地判断出100和10块的差距只是让我能改善一顿伙食,然而500万,就不免让人想入非非,能够让我过上“理想中”的生活——这种模糊而又理想化的美好愿景,让我们高估了这笔钱的效用。
最后再加一道思考题:假如来玩类似“俄罗斯轮盘赌”的游戏,赢的话能有1个亿,输的话就去见上帝,这个游戏的获胜概率多大你会愿意去玩一下?百分之一?千分之一?..不?那万分之一怎么样呢?...
当我们谈论创新时…
创新已经成了老生常谈,似乎大家都在追求改变。然而对于组织来说,适应与复制成功和创新之间是冲突的。新东西往往是不成熟不完善甚至根本就是错的,哪怕真的是具有不错潜力的新事物在短期也可能会损害绩效表现,从而被抛弃。但是,根据我们对于组织的观察新的变化又确实发生着,这些新事物是怎么出现的?读完本书,总结了以下一些收获和想法:
-
当我们谈论创新时,很多时候其实说的还是经验学习中的“模仿”,把别人已经证明可行的方法用到自己身上,真正“前无古人”的尝试并不是特别多。当然在学习的过程中通常会加入一些改进,大概就是所谓的“微创新”。
-
组织在“开发”(挖掘现有技术、方法的潜力予以改进)和“探索”(尝试全新的方法)之间,通常会偏向于“开发”。许多看起来大胆的创新,其实是逼不得已的选择,因为“开发”到达极限仍然无法满足需要,只能另起炉灶。
-
适应学者对于组织中出现新事物有两种大的解释路线,一种是“适应结合”,类似生物进化论,老元素的结合产生新元素,然而一直没有像遗传法则这样好的理论来产阐述结合的机制和过程;另一种是“适应低效”,创新是自发产生的,虽然适应过程会消灭新的事务,但是由于适应过程的低效,导致一些新事物留存下来。
-
适应机制对创新存在抑制作用,但是适应同时也为新事物出现提供了有利条件:一是适应的成功带来“组织宽裕”,有更充分的资源吸收创新失败的负面效应,减少对创新活动的管控;二是适应的成功带来的“管理者自负”,让管理者高估自己的能力和创新的成功可能从而过度支持创新想法;(许多创业者连续创业除了确实有过人之处,也许也有前一次成功造成的自负因素)三是“对新想法过度乐观”,由于新想法不大为人了解,更容易陷入乐观偏见中,就如书中所说的“在一个竞相承诺的世界,获胜的项目是那些希望压倒现实的项目”。
-
组织工程师和社会工程师也一直在寻找可以影响新事物存活率或成功率的组织形式和政府流程。一种方法是,在大量新想法中尽早分辨出稀有的好想法。但是一直以来的实践证明这个方法效果不好,特别是对于重大创新来说,往往都是一些离经叛道的想法,很难事先判断。(是否也从侧面证明了,所谓成功的创业经验总结,其实并不像大家想的那么重要和有效,事后研究也未必能真的找到了成功的原因,更不用提事前判断了)。第二种是现在被普遍采取的方式,就是控制创新失败的成本,尽量不损害好想法的收益。各种“孵化器”、“事业部”都属于这一想法的实践——拿小赌注试一试水。但是这种策略也有局限性,也许确实更适合于互联网和软件服务这种边际成本较低且易于复制和扩大规模的项目。
说了这么多,总结下来就是,创新带有很大的不可预测性,在组织中与适应过程相互作用;过去成功的经验可能有利新事物出现,也可能容忍了愚蠢的新想法,两者形成了一个近似负反馈的环,前提是不因为创新失败而彻底扼杀创新的可能。
最后再记录一个粗浅的想法:凡事要多从第一性原理去考虑,想明白本质的目标,做对的事情比把事情做对更重要。接下来无论是开发还是探索,都是围绕着本质的目标去做。这对于一个人来说应该就取决于他的“三观”,对于一个组织和企业,大概就是所谓“愿景”。而一个成功的创新的组织或是系统架构或者人生(每个人生都应该是“新”的吧^^),往往都是“生长”而不是“设计”出来的,这个生长过程的蓝图就是向着那个目标前进的路线。
能做到这样的思考和努力,已经足够度过有意义的一生了,至于所谓“成败”,时也运也命也。毕竟是生命的过程而不是结果,才是你生活动力和快乐的源泉。
写在最后
没有想到这篇读书笔记写了这么多,这么久。从这次写作的过程,我充分体会到了这句话“如果你不把想法写下来,永远都不知道自己想的是什么”。有很多没想清楚,或者自以为想清楚的问题,在写的过程中越来越清晰,然后把一些原本孤立的东西联系了起来,那瞬间产生的大概就是“经脉打通醍醐灌顶”的舒畅感觉。我觉得这么长的东西,愿意读完的恐怕不多,更多地是写给自己来看,这是一个痛苦又快乐的过程,希望能坚持着这么读下去,思考下去,写下去,好好地生活下去吧。
网友评论