第五部分 理性主义与行为主义
这一部分的17-20章,相对意识流一些——17和19章主要介绍了自1970年起,行为经济学的老中青三代学者,在传统经济学家(或者叫他们怀疑论者)们的枪林弹雨下,顽强地生存下来并逐渐壮大队伍的故事。18章讲了一些有趣的“反常现象”,而20章则介绍了一个非常有趣的新概念——狭窄框架。
下面将先记录一些零碎但有趣的碎片,再之后将着重描述“狭窄框架问题”。
在曲折中前进:理性主义者 v.s. 行为主义者
碎片1:“获得”和“损失”可能是一回事
人们经常在“追逐风险”和“回避风险”的选择中发生剧烈的转折变化——哪怕仅仅是因为在一句话的“描述方式”上的不同,让我们来看一个例子:
一种严重的传染病已经使得600人被感染,现在医院必须在两种策略中选择一个实施:
策略A:挽救200人
策略B:有1/3的概率挽救所有人,有2/3的机会导致600人全部死亡
大多数实验对象都选择了A。
现在我们把两种策略换一种表述方式:
策略C:有400人将会死亡
策略D:有1/3的概率让所有人都存活,有2/3的机会导致所有人全部死亡
现在,大多数人又选择了有风险的策略D;即使当实验对象仅包括医生时,结果也一样。
然而你仔细看一下4个策略,你发现其实A和C描述的是一回事,B和D则更甚至在字句上都几乎一样——所以人们在偏向“安全”的A时,又同时偏好“有风险”的D。这让理性主义者很是抓狂。前景理论做出的解释是:人们在心理上对待“获得”和“损失”的差异十分巨大,这真的是有点像在沙漠里“只有半杯水,要跪”和“还有半杯水,有戏”的区别。
碎片2:行为主义者的一些有趣的研究发现
1. 股东有时宁可多交税,也希望获得“股票红利”(重税负)而不是通过售出股票获得“资本利得”(轻税负),这很可能是因为他们希望流入的资金是“收益”而不是“本金”。
2. 股市里经常有“反常现象”,比如周五涨周一跌,1月应该持仓(且持小盘股),假期的前几天应该买入股票等。我感觉这些称不上“研究结论”的“经验法则”甚至适用于中国A股,然而这些现象的背后原因却没有人能解释的很清晰。
3. 赌马时(浮动赔率制),理论上任何押注的预期回报率都是一样的——无论你押2:1的热门马还是10:1的冷门马。然而实际数据是,押注在热门马身上的回报更高。而在每个赛马日的最后一场,越是押注冷门马,回报会越低。
碎片3:四牌问题(Wason, 1996)
这个经典问题可能有一些slightly different的版本,我只介绍书中的这个版本——请看下面这个问题:
你面前的桌子上摆放着4张卡片,卡片的正面分别写着:
A B 2 3
你的任务是翻动“尽可能少”的卡片,以证明下面这句话是否正确(注意,你必须提前决定好要翻哪张卡片):
每张一面是元音字母的卡片,其另一面一定是偶数。
我先公布正确答案:要翻动A、3、B三张卡片。可能你在仔细思考后会说翻A和3就够了,我之后会解释为什么B也是必须的。不过依照惯例,我们来看看实验对象们是怎么选的,顺便就解释了答案,并给出insights:
实验对象们翻动卡片的频率从高到低依次是:A、2、3、B。
选A是没问题的:如果A后面不是偶数,那命题证伪;如果是偶数,则发现了一个命题成立的必要条件;不翻,则命题无法验证。
选2是无用的:如果2后面是元音字母,则发现了一个必要条件;如果不是元音字母,则跟命题不相关——总之,翻动2这张卡片既不能证明命题,也不能证伪命题,所以翻动它是无意义的。
选3是必要的——如果3后面是元音字母,则命题证伪;如果不是元音字母,则跟命题不相关;不翻,则命题无法验证。
选B也是必要的——跟选3的理由一模一样。然而很多人认为不用选:因为他们猜想,卡片肯定是一面字母,另一面数字——不过题目并没有这样说,这个前提完全是被主观添加的。
我们从四牌问题的答案中学到两点:
1. 人们喜欢寻找“证明假设成立,而非不成立”的证据——这种倾向被称为“确认性偏见”(confirmation bias)。选2的人比选3的人还多,即可以证明这一点,虽然你经过仔细分析就可以发现翻2很多余,但事实就是大部分人都选了2。
2. 当没有根据的假设使得某些否定性证据看起来不大可能称为证据时,确认性偏见会更加严重。翻B的人最少可以证明这一点——B不是元音字母又不是偶数,在“卡片肯定是一面字母一面数字”的假想条件下,的确有合适的理由不被考虑。
狭窄框架问题:“分别看待”还是“合并看待”?
泰勒在为一家公司的23名项目经理做培训,同时在教室最后面旁听的,还有该公司的CEO。这家公司的规模不小,损失一百万甚至几百万元,也不会让这家公司陷入破产危机。泰勒问了这样一个问题:
假设现在有一个投资机会,50%概率赚200万,50%概率亏100万。请问在座的经理们,你们会投资吗?
23名经理中只有3人举起了手——即使面对净期望收益为50万美元的项目,也不太有人愿意承担风险。你并不能指责这些身经百战的经理们是懦夫,因为很可能的一个原因是公司的奖励机制不会对承担这种风险提供奖励:如果你真的赚了200万,你可能得到3个月的额外薪水;但如果失败了,你则会被炒鱿鱼。
但这时,后排的CEO忍不住了,他跳起来大呼:这是个期望收益1150万(23×50万)的事情!我们应该接受所有23个项目,这是想都不用想的!
经理们把一项风险投资看做“独立的事情”,从而不愿意承担风险,这叫做“狭窄框架效应”;而如果把23个项目看成一个投资组合,很显然它又变得极富吸引力让人无法拒绝。
胆大的预测:内部观点与外部观点
卡尼曼认为,人在做管理决策时,会受到两个相互抗衡但不一定会抵消的偏见的影响:胆大的预测,和胆小的选择。
一个共同努力的团队内部,有一位经验丰富的专家。当团队成员都对工作进度保持乐观,认为只需半年就能结束工作的时候,如果你问这位专家,他也倾向于说“是的,我想我们的确行动迅速,半年是个不错的估计。”此时他的说法就是“内部观点”——因为他也身处这个团队之中,他正被其他成员的乐观估计所影响。
然而当他冷静下来,以一个“局外人”也就是专家的身份重新审视工作进度时,他意识到之前类似的项目从来没有在6年之内完成过,半年的估计真的是太鲁莽了——这就是“外部观点”。一般来说,如果外部观点是有数据支撑的话,它会比内部观点可靠得多。但问题在于内部观点会很自然的出现在脑海里——从而经常迫使我们在预测时尤为大胆。
胆小的选择:损失厌恶与愚蠢的委托人
人们在预测时乐观自信,却在做选择时谨小慎微——正如23名经理一样,对于一切归因于自身的结果,每位经理都会厌恶损失。
然而问题在于,所有的责任都在于“不愿承担风险的无能经理”身上吗?他们做出了糟糕决策只是因为他们“只关注自己的利益而非公司的利益”吗?并不一定。很多情况下,委托人设计的契约(contract)都迫使代理人不得不拼命规避风险——比如“你可以无功,但你不能有过”;甚至当代理人勇敢地做出了一个冒险的决定却不幸失败时,有的老板(委托人)还会翻脸不认人——他们带着“后见之明的偏见”,呵斥经理忽视了这样那样的风险,却忘了当初自己也曾认为这是个好点子。
这种有着“愚蠢的委托人”问题的公司,往往会存在更为严重的狭窄框架效应,进而扼杀了企业获得长期成功的两个必要因素——创新与实验。再退一步说,短期的成功也未必追逐的到——因为在面临23个项目时,这家公司的经理们会愈发保守——没人会想到把它们看成一体,也就没人会发现它是一个稳赚的事情。
股权溢价之谜——狭窄框架的作用
股权溢价,说通俗点就是“股票的收益比无风险资产(比如政府债券)的收益多出来的部分”——这似乎很好解释:如果要我承担股市波动的风险,那么我当然要索取更高的期望收益,才有可能去投资股票而不是债券。
但梅赫拉和普雷斯科特两位经济学家想量化这个问题——那么股票比债券到底溢价多少?根据经济学模型计算出的答案大约是0.35%,但历史上却出现过6%的极高水平。这说明当时的人们必须对风险的厌恶程度相当高,才能解释当时的回报率(注意逻辑:股票回报率高 - 人们对“接受风险”的要价高 - 人们非常厌恶风险)。那么问题引申为两个:
人们当时为什么会(极端地)厌恶风险?
有没有办法可以去影响/操控人们对风险的态度?
我们先看一个有趣的悖论,之后再回到股权溢价之谜上。
只愿赌100次的悖论
保罗·萨缪尔森要跟他的同事经济史学家E·凯里·布朗打个赌:抛硬币,如果正面朝上,布朗赢200美元;如果反面朝上,布朗输100美元。
布朗像之前例子中的23位经理一样,他说:我不玩,比起赢200美元,我更不喜欢输100美元。但是,如果不是只赌1次,而是赌100次,我就愿意玩。
萨缪尔森觉得布朗很搞笑——如果你觉得某件事做1次不划算,那么做100次仍然不划算。比如布朗已经打了99次赌,那么现在问他要不要打第100次赌,布朗会说不——因为我们知道布朗是一个不爱“打一次赌”的人;那么如果第98次之后问,布朗还是会说不——每一次赌博都是单一可选的,那么他每一次都该说不。
萨缪尔森认为布朗“愿意赌100次”是个错误:虽然大数定律告诉我们,如果你掷硬币1000次,那么正面朝上的次数会很接近于500——意味着布朗不大可能会输钱,然而布朗也同时忽视了“输很多钱”的可能性。毕竟赌1次,最多也就输100块,而赌100次,最悲惨的情况可是输10000块。因此萨缪尔森的结论是:如果选择“不赌1次”是正确的决定,那么“只赌100次”就是错误的——布朗一定是忽视了什么,或者错误理解了大数定律。
泰勒对悖论的解释:关注“短期”的“独立”事件,让人变得胆小
泰勒的观点和萨缪尔森不太一样(但不能说是完全背道而驰):如果“愿意赌100次”是正确的决定,那么“不愿赌1次”就是错误的——这种错误的名称叫“短视型损失厌恶”。这里的逻辑是:你愿意赌100次是因为“最后输钱(即损失)的概率极小”,那么你不愿意“赌1次”的原因便一定是看到了很大的(起码是不可接受的)输钱概率。我更喜欢再具体一点描述为:
“一个布朗跟一个萨缪尔森连续赌100次”时,你心里的预期场景是:“布朗高兴不已地赢着钱(这笔钱很有可能在50*100=5000元左右)走下赌桌”。
而如果“100个布朗跟100个萨缪尔森分别赌1次”的话,你心里的预期场景则是“50个布朗正在因为输了钱而痛哭”。
如果你把自己看作“一个布朗”,那么你几乎无法拒绝稳稳的5000美元的收益;但如果你把自己看作“100个布朗”,你又根本无法接受“一半的自己正在损失”,因为损失真的太痛苦了。这就是“狭窄框架效应”带来的对短期风险的极度厌恶。这种现象真的很普遍,它的普遍性不仅在于1个委托人无法劝说他的23个代理人团结一致接受所有项目,甚至也在于一个投资人无法劝说30个自己(假想在一个月中的每个交易日,都对应一个“当天的自己”)鼓起勇气去做一个高风险投资。
于是泰勒将“短视型风险厌恶”的结论推而广之:在投资领域,回报率的呈现形式十分重要。值得一提的是,无论是在实验室中进行的控制实验,还是真正发生在以色列的政策调整,我们发现通过改变公布投资回报率的方式(比如由短周期“上周投资回报率”,改为长周期“上月投资回报率”),投资者们的行为真正被影响了(如将更多的资金投入股票而不是债券,并且市场的换手率也在降低(持股耐心增加))。除此之外,“狭窄框架效应”还给我们提供了一个小tip:
越是经常查看自己的投资收益,越不愿意承担风险。因为你查看的次数越多,看到的损失也越多。不如每天就收盘时看下股票app好了——如果这支股票真的好,它会涨的;而如果你每半小时都掏出手机看曲线的起起伏伏,你的心情会变糟,你的时间被浪费,你的胆子还越来越小。
同理,如果你是个年轻人,承受风险的能力相对强一些(理论上老年人可能财产更多,但养老、医疗、遗产等问题使得他们不得不更倾向于规避风险),那么你就尽量不要做“胆小的选择”,不要每时每刻都关注着报纸上投资方面的各路小道消息——不要看任何财经新闻,只要看看体育版,做做字谜就好了——泰勒如是建议到。
行为经济学家的奇妙逻辑链
我在读《错误的行为》时,总是发现行为经济学家能够把一些逻辑上相关的东西,用因果关系联系起来——correlation和causality始终是一个难题,难到我至今也不知道书中的一些观点是不是有什么漏洞(当然,《错误的行为》并不是圣经;虽然书中的大部分例子都来自享誉经济学圈的学术文献,但从学术人的眼光来看,仍然能发现不少问题——我并不清楚行为经济学家们如何说服审稿人,但有时我承认他们辩论或“诡辩”的能力很强)。我在读第20章的时候,第二次感觉到了一条“很奇怪,但似乎正确”的逻辑链:
empirical evidence显示股票回报率过高 - 人们对“接受风险”的要价过高 - 人们非常厌恶风险 - 因为“短视型风险厌恶”而做一些“胆小的选择” - 短视是因为人们有太多机会去接触“短期”或“独立”的暗示 - 股票app对收益率的数据呈现方式给了人们这种暗示
结论:是股票app的首页显示的东西不对头,导致股票的回报率显著的高于债券。
即使从相关性上而言,在这么多变量correlate之后,首尾两个变量“股票app显示回报率的方式”和“股票回报率”还能有多少重合的variance,实在让人有点担心,尽管lab/field experiment都显示:我们对用户能看到的数据窗口进行控制时,用户的行为和金融市场的dashboard都会有变化。这似乎连因果性也确认了——但我还是始终好奇行为经济学家的脑洞怎么会开这么大。不如再讲下我第一次体会到的“似乎正确”的逻辑链(巧合的是,“似乎”这个词经常出现在传统经济学家对行为经济学的批判中,而泰勒又是最爱反击“似乎”这个词的),它出现在书中的第2章:
泰勒想知道一个生命究竟值多少钱 - 观察人们愿意为一个白血病患者捐助多少钱 - 调查人们愿意付多少钱来增加一条公路的安全性,并估算提高安全性后这条公路上车祸死亡率的降低情况 - 试图设计俄罗斯轮盘赌实验来询问人们愿意出多少钱移除一颗子弹 - 通过职业死亡率及职业薪资水平估算,人们要求多得到多少钱的薪资,才愿意接受一个死亡风险高于其他职业0.1%的工作
结论:经过泰勒一步步优化自己的研究方案,他估算出一条生命的价值大约是700万美元。
同样,我总觉得这套逻辑是“好像哪里有问题,但又说不太清”,或许这跟泰勒最爱的现象“偏好反转”也差不多吧。我只能评价道:如果“生命的价值”作为PhD thesis的题目,真的看上去很高端;而如果真的设计一个轮盘赌实验,这个研究又显得太愚蠢。
自我控制与狭窄框架:不仅只有出租车司机会短视
纽约出租车司机的工作方式大概是这样的:他们给出租车公司打工,每天可以租车12小时,比如从早5点到晚5点,或者晚5点到次日早5点;他们每天要交给公司一定数额的钱,再扣除油钱之后,赚的钱如果还有剩余就会进自己的腰包。
于是泰勒想到这样两个问题:
1. 出租车司机每天最多可以工作12小时(因为租车期限是12小时),但全程开满无疑很疲累,那么他们是如何决定几点收工呢?
2. 如果今天遇上了恶劣天气/节假日,致使当日的有效薪水更高(即每公里单价高/空驶率低),出租车司机们会选择工作更长的时间吗?
第一个问题的答案经常是这样的:司机们会设定一个目标数额(在扣除了份子钱和油钱之后),达到这个目标就收工回家。
而第二个问题的答案则更让人吃惊:有效薪水越高,出租车司机的工作时间反而越短。这完全违背了基本的经济学理论——供给曲线向上倾斜,薪水越高,劳动力的供应量越大。但现实情况是,如果今天下雪,你打不到车不仅是因为想打车的人多,而且因为司机们都提前下班了。
出租车司机们在这里陷入了狭窄框架的陷阱:他们只狭隘地关注当天的收入和工作时间,这导致他们常常在忙碌的日子少干活,在清闲的日子多干活——我们假设司机A就是这样一个严格执行“达到目标日薪就回家,达不到就一直开满12小时”的人。现在司机B采取了另一种策略,是坚持每天都工作同样长的时间(当然少于12小时,比如8小时),他的收入则比A多了5%。司机C又进化了该策略:他在忙碌的时候多干一会儿(可能接近12小时),在清闲的日子少干一会儿(比如4小时),收入又比B多了10%。
经验丰富的司机C有能力尽量克服狭窄框架的偏见,他们的行为更加理性。但经验较少的司机A则总在“今天运气真不错,一路上都有客人拉,太阳没落山就达标了”的忙碌的日子,选择早早收工休息。然而A每天回到家时都可以自豪地跟妻子说“今天的钱赚够了!”,而在清闲的日子早早收工的C回家时却要承受妻子的冷眼:“今天才赚这么点钱就回家来了?”毕竟,不是每个出租车司机的妻子都是经济学家——这可能也是司机们宁可采取A或B策略的原因之一。
狭窄框架与自我控制的漫谈
虽然“狭窄框架效应”的主旨是:人们习惯于短视,过于注重短期的、独立的目标,而忽视长期的、综合的目标,从而导致更强的风险厌恶倾向,但出租车司机的例子也说明,短视同样可以带来“不理性”的决策——即使这个决策跟风险无关。
当我们谈到“短期”与“长期”,就很自然联想到“自我控制”问题——正如健身/减肥计划,如果人们能想办法拒绝短视,就可能会更好地达到目标——而健身APP或许能提供这样一些“办法”?
如果说“健身APP的使用”是个IT Adoption的问题,那么“健身APP的持续使用”是不是更像一个自我控制问题?我的观点是“如果我喜欢Fitbit,可能是因为我喜欢它的某些设计元素;但如果我不喜欢Fitbit,很可能并不是因为我讨厌Fitbit这款应用——而是我讨厌跑步。”从我自己短暂的使用“咕咚运动”的经验来看,一旦我站在跑道前,我就一定会使用它;而我如果决定不出门,我就一定不会使用它。“为了长期的节食目标而选择把零食从眼前拿走”,体重管理一直是泰勒钟爱的例子——我漫谈几点思考的火花:
1. 出租车司机该关注“每月的收入总额”而不是“每天的收入定额”或者“每天的工作时长”,这让我想到——我们在健身APP上关注的指标会不会是错的。运动量这个指标本身就有点模糊(步数、里程、配速、活动时间,都相关却都不十分准确),如果热量的消耗和这些“运动量”指标的关系再不是简单的正比关系,那么“每天一万步”这种目标会不会不够理性?
2. 股票APP的“回报率显示方式”是按天还是按月,可以影响股民的行为。那么健身APP上可不可以有类似的设计?我并不知道健身者们的“高风险行为”指些什么,但如果能让他们在使用APP时把关注点更多地放到长期上,或许也是一件有益的事。
3. 如果我们制定了一个月的健身计划,那么这个“计划者”会跟30个“行动者”博弈——以委托-代理的关系。计划者可以用“让行动者为屈服于诱惑而内疚”的方法促使计划顺利实施,但“内疚”也降低了享受诱惑的效用。除了“内疚”(可以理解为运用“意志力”)之外,泰勒的自我控制理论中还提到过3种方式使得行动者可以按计划行事:
a)承诺策略。即限制选择,让行动者失去屈服于诱惑的机会。比如在计划运动的时间段里,如果你的GPS显示没有位移,你的手机会自动响起刺耳的蜂鸣声。
b)提高屈服于诱惑的成本。比如不去运动就强制发一条朋友圈让用户承受社交鄙视。
c)单方押注。比如不完成一个健身目标,就不能解锁一项新功能(我的想法里这个新功能可以更大胆些——虚拟勋章在我的心里并不是一个很强的诱惑;如果这个新功能是“随着目标的逐渐达成,能加的好友数目上限也随之提高、为用户推送异性好友、一些超出APP边界的功能比如精美锁屏壁纸的逐步解锁”,这个押注或许会让用户觉得值得一赌。
4. “计划者与行动者”模型属于duel-self model的一种,计划者偏于冷静、长期、坚持目标、认知化,而行动者偏于激进、短期、服从诱惑、情绪化;这和卡尼曼的双系统模型(central/peripheral)有共通之处。但一个更有趣的study问了这样一个问题:当deliberative system很忙的时候,affective system会不会因此占了上风使得行动者们可以为所欲为?(Shiv & Fedorikhin, 1999, Journal of Consumer Research)
实验者们(60名正在节食的女大学生)分为两组,一组记忆60幅世界名画以用于准备接下来的测试,而另一组则没有记忆任务;接下来他们被安排一个课间休息,可以从零食盘中选择零食吃。结果发现,有记忆任务的实验组平均每人吃了约50g零食,而控制组平均吃了30g左右。虽然“有消耗自然要有补充”,但如果单纯从节食的角度讲,实验组的女生们很可能是因为将精力(deliberative system)都花在了记忆任务上,使得计划者对行动者失去了控制。
从这个角度,如果说清空自己的大脑有利于计划者更好地委托行动者,那么我甚至觉得健身APP应该在健身计划时间开始前的5分钟“关键决策时刻”问用户几个问题——以把他们从正在投入思考的环境中拉出来。
小结:本章关键词
确认性偏见 狭窄框架问题 内部观点与外部观点 后见之明的偏见 愚蠢的委托人 短视型损失厌恶
网友评论