《数据化决策》读书笔记

作者: 马文Marvin | 来源:发表于2015-03-07 12:13 被阅读1484次

作者：Douglas W. Hubbard
翻译：邓洪涛
出版社：中国出版集团
版本：2013年9月第1版 2013年12月第3次印刷
来源：亚马逊购买
推荐人：张伟去哪儿产品

参加私享会活动，分享人张伟推荐的书，刚好与我最近比较关注的决策方向有关，于是迫不及待买下来直接读了，书有大量统计学和社会学的概念，侧重于：这个世界上没有不可量化的事物方面的观点阐述，量化分概念（Concept）、目标（Object）、方法（Method）三个方面（简称.com），提供了很多很有价值的方法论，比较有收获

开始使用三个小故事来打破大家的固有思维：1. 古希腊人坐在图书馆就能估算出地球的周长 2. 物理学家估算出芝加哥的钢琴调音师 3. 9岁女孩揭穿医学的谎言，说明量化是所有人都可以做到的，而并不是只有专业人士才可以

量化的概念：不是把事物100%精确化，而是90%的大概就可以（按照书里面的观点，可以这么简单理解），很多时候的量化，也只是需要知道大概会多，或者大概会少，多多少、少多少则不是关键

量化的目标：知道了量化的目标，就完成了量化的一般，知道目标的过程作者放了两个对话式演练，有点像Coaching中的一对一沟通场景，达到的结果是对一个看似不可量化的概念梳理出可以量化的目标

量化的方法：作者提供了大量对方法论的阐述，从心理学、社会学等不同的角度提出的很多方法论都非常有价值，形如：5人法则（抽取5个样本就可以达到93.75%的准确率-作者还把公式和方法列出来为什么是93.75%），蒙特卡洛模型（细分量化边界并随机组合产生结果与盈亏平衡点进行比较，从而得出高于盈亏平衡点的概率在支持决策-比如有某项投资的盈利概率大于14%），T统计法（Student’s T-statistic，通过小样本数量达到极高概率整体预估的方法），两次抽样法（通过两次抽样中的重合率来判断整体总量的一种方法），贝叶斯统计（利用搜集到的信息对原有判断进行修正提供了有效手段）Rasch模型（一种用通过测试的难度水平和受试者的得分来评估受试者在其他难度水平中的表现的方法：假设某问题的回答正确率是35%，而某个人回答的总体正确率是82%，那么某人回答某个问题时，正确概率大约是70%）

对于决策和数据量化，作者用心良苦的提到：他的定量分析方法教授常常引用亚伯拉罕马斯洛（Abraham Maslow）的话：“如果你唯一的工具是锤子，你就会把所有的问题都看成钉子”，决策者更愿意量化那些更有可能提供好消息的事物（受心理预期因素影响），不知道量化中所获信息的商业价值，意味着人们没能真正理解量化的困难

统计学里面有一个置信区间（Confidence Interval，CI）的概念，以特定的概率表示一个正确答案的范围被称为：“置信区间”，比如你认为90%的可能答案是3-7之间，那我们就可以说，你的90%的置信区间是3-7，我们经常说“感觉”，其实就是一个置信区间，所谓靠谱，就是一个人说话做事高于90%的置信区间

很认同作者的一个观点：对于不确定的事物的概率估计是一项需要学习的技巧，精确在90%以上置信区间的判断，是一种非常重要的决策能力，也是一种可以量化的决策方法论，作者甚至提供了一套方法来计算和“校准”一个人的置信区间（目标是达到90%的置信区间），有的人很自信往往置信区间只有60%-70%，有的人很不自信，置信区间会高于90%（说了很多废话，丢了很多的市场机会）

第一次接触到蒙特卡洛模型，作者提供了不少的工具（Excel、软件等等），以后在需要做类似场景的决策时可以尝试一下，蒙特卡洛模型可以简单的变化（参数的非正态分布、某些变量具有一定的相关性等等），书中也简单提到了两种稍微复杂的蒙特卡洛模型，和时间片段相关的马尔可夫模型（把情境分成很多的时间片段模拟，前面的时间片段会对随后的时间片段有影响。这种做到对于制造系统、股票价格、天气预报、计算机网络等项目中使用）和基于代理的模型（很多的小蒙特卡洛模型组合起来的模型，比如整体交通模拟中的每一辆车都是一个蒙特卡洛模型）异构标杆法（以被测事物不同但有关的事物作为基础，以此更新先验信息的方法）

信息之所以重要，是因为信息可以减少决策的不确定性，因此信息是有市场价值的，如同斯程现在正在做的名录的商业价值一样，未来很多的大数据项目、大数据公司的第一个价值，就是帮助可以减少决策的不确定性，这个市场价值多少的衡量，本身就是一个“数据化决策”方面的需求

在《黑天鹅》和《zero to one》这样的书中反复强调颠覆性事件是不属于可统计和量化范围的（黑天鹅现象产生大量的颠覆性事件让原有的决策评估不值一提，Peter对Facebook的投资回报是其所有其他投资回报的总和还多很多），在另一方面，大数据的时代，书中提到的很多社会学方法和统计学方法在做精确决策的时候，貌似就比较有局限了，但是我认为《数据化决策》所阐述内容的价值所在，是决策者在做日常决策的时候，往往是属于一个有限的时间窗口，有限的资源的情况下，所以书中阐述的方法论依然是非常有价值的

作者在阐述准确度和精确度的差别时（准确度：反应量化的系统误差大小，如果准确度高，就不会出现时而高估时而低估某个值的情况，精确度：反映量化的随机误差大小，如果精度高，即使量化结果远远偏离真实值，也具有高度的一致性），提到了一个系统误差（偏差）的概念，如果你不得不选择的话，你是喜欢在一台读书精确却存在系统误差的秤上称重，还是喜欢在一台经过校准但结果很不一致的秤上称重呢？作者发现在商业领域，人们经常选择精度很高却存在系统误差的秤，这个我是真心有切身体会很多的决策者在做决策的时候，真的是用精度很高的方法，但是却用偏差很大的手段，调偏差需要广泛的涉猎学习，调精度需要深度专精学习

作者把偏差分为三个维度：1. 期望偏差，是一个心理学方面的因素，双盲测试就是一种避免期望偏差的方法 2. 选择偏差，是一个统计学方面的因素，选择合适的抽样需要借助一些方法来避免 3. 观测偏差，使用秘密观测是最好的解决这一偏差的方法

投资边界曲线：是一条量化投资风险的承受能力的曲线：

效用曲线：当面临两难选择的时候的一种决策优劣评估方法：

心理学方面的几个典型的，影响人决策的点：
锚定（Anchoring）：有一个测试前让受试者无意写下社会保险号的最后四位，结果对受试者产生了很显著的影响
光环/喇叭效应（Halo/Horns Effect）：让很多人给贴了不同照片的论文评分，长相好看的人的分数显著高于长相不那么好看的，虽然所有论文的内容都是一样的
从众效应（Bandwagon Bias）：被特意安排在最前面的两个受试人员故意的错误行为，会显著影响最终的测试结果
新兴偏好（Emerging Preferences）：你喜欢上车A了，如果销售说：A虽然比，但是安全性不像B那么有保障，你会说：我准备明年就换车，先开着练练手；如果销售说：A虽然安全，但是价格会比B贵一些，你会说：我就是想要一辆安全点的车。销售在胡说八道，你则陷入了圈套

书里面吐槽“专家”完全是有名无实，一个一个都很自信的做着比正常人都要不准确的决策，作者认为专家唯一货真价实的就是他的自信心，反思销售领域的培训，很多都是为了打鸡血提高自信，用概率去得到机会，用人的竞争去争得市场，斯程要做的就是借鉴互联网的手段去改变和提升人的价值

有人用电子追踪系统的方式对一个会议的效率进行量化，感觉也是挺有意思的，参会人数、发言的人数、发言的频率、交互发言的次数、会议的时间等等参数的情况下，使用某种方式来确定会议的质量

理论上说，互联网是可以把股票市场取代掉的，阿里这样有公信力的机构如果做股票交易市场，以全世界的国家GDP来量化国家和区域为股票，今天你买进500股浙江省，卖出3000股冰岛，非常互联网

摘录：

所有科学都建立在近似观念之上，如果一个人告诉你，他精确地知道某事，那么可以肯定，你正在和一个不精确的人说话

网友评论

不问世事:没有完全消化完书，辅助一下理解

本文标题：《数据化决策》读书笔记

本文链接：https://www.haomeiwen.com/subject/vhkvxttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

《数据化决策》读书笔记

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

马文的书房

前沿技术的应用