《思维模型》
加布里埃尔·温伯格 劳伦·麦肯
18个笔记
>> 从很大程度上说,生活中最重要的问题不过是概率问题。
>> 信不信由你
>> 所谓的“轶事证据”,就是以非正式手段收集的源于私下传闻的证据。
>> 与此类似的概念是“移动的目标”(moving target)。它是指,在得出实验结果后修改实验目标,以便支持自己想要的结论。
>> 隐藏的认知偏差
>> 调查结果受“反应偏差”影响通常会表现为几种形式,包括:
· 问题的措辞,例如诱导性问题或误导性问题
· 问题的顺序,前面的问题会影响后面的问题
· 受访者记忆力差或记忆不准确
· 难以用数字(例如从1到10的评分)表达感受
· 受访者只提及对自己有利的事
>> 警惕小数“定律”
>> 赌徒谬误(gambler's fallacy)。这个谬误得名于轮盘赌玩家,他们认为只要多转几把,轮盘转出红或黑的概率就会对自己有利。
>> 钟形曲线
>> 这类数据集的直方图呈现类似的钟形曲线:中间是一堆接近均值的数值,而随着离均值越来越远,数值越来越少。当一组数据呈现这种形状时,通常表明它源于正态分布(normal distribution)。
>> 具体情况具体分析
>> 条件概率(conditional probability)。它指的是,在另一件事也发生的情况下,某件事发生的概率。条件概率使我们能通过运用附加信息,更好地估计概率。
>> 是对还是错?
>> 由于产生每一类错误都会带来后果,所以在设计系统时必须将这些后果纳入考量。也就是说,你必须意识到有些错误是不可避免的,所以要在不同类型的错误之间进行权衡取舍。
>> 能否重现?
>> 进行多次检验以寻找拥有统计显著性的结果,这种做法有许多叫法,包括数据捕捞(data dredging)、“数据钓鱼”(fishing)和“P值篡改”(p-hacking,也就是试图通过篡改数据使P值变得足够小)。
>> 在应对不确定性这个问题上,研究和数据要比直觉和预感管用。
>> 本章要点
· 避免陷入“赌徒谬误”或“基础比率谬误”。
· 数据中的轶事证据和相关性会促使你提出假设,但相关性不代表因果性—你仍然需要靠设计精密的实验得出有力的结论。
· 寻找行之有效的实验设计,例如彰显统计显著性的随机对照实验或A/B测试。
· 由于存在中心极限定理,正态分布在实验分析中特别有用。请回想一下,在正态分布中,约68%的值距离均值不到一个标准差,约95%的值距离均值不到两个标准差。
· 任何孤立的实验都可能得出假阳性或假阴性结果,也可能由于众多因素出现认知偏差,其中最常见的是“选择性偏差”“反应偏差”和“幸存者偏差”。
· “重复”能增加对结果的信心。因此,在研究某个领域时,首先要寻找系统综述和(或)荟萃分析。
· 始终牢记,在应对不确定性时,你在报告中看到或自己算出的数值本身就不确定,你应该用误差条找出并上报那些数值!
网友评论