通过理论能解释结论吗?
中国民间有一个“七十三,八十四,阎王不请自己去”的说法,说在这两个年龄上的人更容易去世。那么怎么样才能用科学的方法验证这个说法呢?
一篇网上流传的文章说“科学家们经过反复的研究”,发现“人的生命有一个周期性的规律,大致是7-8年为一个周期”,而73岁和84岁正是这个周期的低潮。我不知道这个周期学说是那个科学家的理论。问题是,这篇文章把“能找到一个理论解释”,当成一个学说是否科学的标准——如果能用理论解释,他就是科学验证了的吗?
不管你用来解释的理论对不对,这都是一个错误的判断标准。能用理论解释的结论未必正确,不能用理论解释的结论未必错误。古代文人的思维习惯,是遇到无法判断对错的局面就查经典,想获得理论的指导。而科学家的方法则要朴素得多:你直接用事实验证一下不就行了吗?我们根本不需要任何学派的任何医学知识,甚至不需要什么逻辑推理,只要随便找个死亡年龄分布数据就会发现73岁和84岁并不比其临近年龄更容易让人死亡。这个工作是如此简单,据说连北京电视台都做过。
相关性思维
最简单的规律叫做“相关性”。人是如此复杂的东西,我们根本没办法精密计算各种物质致癌的概率,比如说吸烟对肺癌的作用。科学家常用的是没有什么技术含量,不需要任何高科技仪器,更谈不上什么门派的办法:他们直接调查吸烟人群和不吸烟人群的癌症发病率。
这种研究要把被调查的人分组,比如分成两组:得了这种病的患者一组(叫病例组,case),没有这种病的人一组(对照组,control)。然后考察这两组人在生活习惯、饮食、吃药方面有什么不同。如果你发现患有肺癌的人中烟民比例显著高于没有肺癌的人,你就得到了肺癌与吸烟的一个正的“相关性”。这个方法很简单,得到的证据却是强硬的。睡眠时间与判断力的关系,智商与学习成绩的关系——我们看到的大量科学新闻本质上都是相关性研究。
相关性研究只是科研的初级阶段。但就是这样它也已经超越了我们的思维本能。某些人只要觉得一种食材不好吃,就会认为这种食材的所有做法都不好,“一朝被蛇咬十年怕井绳”,是人的最自然思维,而使用大规模统计发现实在的相关性这个最简单的科学方法,是我们摆脱童稚状态的第一步。
绝大多数人没有相关性思维。比如在一篇讨伐网瘾的文章中,作者援引“戒网专家”陶宏开的数据说:
中国80%的青少年犯罪与网瘾有关,中国20%的网瘾少年有违法犯罪行为。
在另一篇文章中则有人进一步指出:
济南在押的1500名少年犯中,80%是“网瘾”造成的,北京更是有90%的青少年犯罪案与“网瘾”有关。
我们能否根据这些数字得出结论说网瘾人群比没有网瘾的人群更容易犯罪呢?
不能!我们可以构建这么一个国家,这个国家80%以上的青少年有网瘾,而这个国家的所有青少年,不管有没有网瘾,都有20%的犯罪率。这个虚拟国家完美符合以上数据,但是他的犯罪与网瘾完全无关。
这个错误就是没有建立对照组。我们缺少的关键数据是没有网瘾的青少年的犯罪率,以及没有犯罪的青少年的网瘾率。这是一个非常常见的错误。这就好比说列举再多“发达的民主国家”,也不能说明民主与发达的相关性,你还必须统计那些不发达的民主国家、不民主的发达国家、和既不发达也不民主的国家。
怎样发现因果
发现相关性,已经是一个足够发表的科学成就,但相关性结论并不能指导实际生活。假设我用无可置疑的统计事实告诉你“吸烟的人更容易得肺癌”,而你不想得肺癌,那么你是否能推论出应该因此戒烟呢?
还是不能!因为你无法从“吸烟的人更容易得肺癌”和“肺癌患者大部分都爱吸烟”这两个统计得出“吸烟导致肺癌”这个结果。也可能肺癌导致吸烟,比如癌变的肺会使人对烟产生需求。也可能存在某种基因,这种基因会使得一个人天生就喜欢吸烟。也可能吸烟的往往是喜欢深夜工作的人,是深夜工作导致肺癌。也可能吸烟的人往往是经济状况比较差的人,其居住环境和营养不行,是贫困导致肺癌。
有相关性未必有因果关系,这是一个非常重要的思维。 想要证明吸烟导致肺癌,唯一的办法是做实验。找完全相同的两组健康的人,让其中一组吸烟,另一组不吸,其他各方面生活都完全一致。20年后如果吸烟组中的肺癌患者数高于不吸烟组,那么鉴于这两个组的唯一变量就是吸烟,我们就可以断定是吸烟导致了肺癌。
可是现实世界中根本不存在“完全相同”的两组人,这种理想实验无法进行。好在科学家有一个退而求其次的巧妙办法:找一群人,然后完全随机地把他们分为两组去做实验。在样本数足够大的情况下,随机性可以保证任何不同因素都可以大致均匀地分配到两个组里。这就是在关于人的研究中最重要,也是最可靠的办法。然而世界上不存在绝对完美的随机试验,比如为了让试验结果具备推广价值,样本应该尽量多样化,男女老幼,各种收入情况,各个种族都有才好,但这其实很难做到。很多实验心理学家选择的样本全是在校大学生,他们的结果能推广到所有人吗?有人对此讥讽说他们研究的心理学应该叫“大学生心理学”。
更大的困难在于,大多数情况下你不能拿人做实验,比如不能逼人吸烟。这时候就只能被动的“集邮”,而通过纯粹的被动调查来做研究的方法叫做流行病学。最容易的流行病学研究是所谓的回顾性调查:先找到病人,然后询问并比较他们的生活方式。这种调查的难度在于病人对自己以往生活的回忆常常不准确,甚至是有偏见的,他们可能会自己推断出一种病因,然后刻意地强调这种病因。一个更可靠的办法是前瞻性调查。比如说科学家想知道核辐射之后哪些地区的哪些人收到了辐射是非常明确的,根本不用对他们进行问卷调查,自然也就没有偏见。有了干净的原始数据,科学家只要长期跟踪这些被打了核辐射标签的人群,再跟正常人对比,就可以知道辐射对人体的影响。可是这里的困难就在于“长期”,核辐射的影响也许几十年才能看出来,那时候也许病人还没死科学家已经先死了。
不管调查到什么程度,都只是对真是世界的管中窥豹。科学研究的是有限的真理。当一篇论文说什么东西可能或者不可能导致什么疾病的时候,它说的其实是在这次研究所调查的这帮人里面有这么一个结论。这个结论能推广到所有人群?记者一定比科学家更乐观。
科学的目标
得到因果性远远不是科学家的目标,科学不是一本写满什么东西会导致什么现象的手册。好的科学除了能证明因果关系之外,还必须有一个机制,得到能解释为什么会有这种现象。比如二氧化碳增多导致全球变暖,其机制是二氧二碳是一种温室气体,它能够吸收从的面反射回空中的红外线,再把这个能量辐射出去促使大气温度升高。
相关性思维和因果性思维知识思维方式的转变,科学研究的真正关键在于发现机制。机制提出来之后,这个机制中的每一步必须是可以验证的,一个课题只有做到了这个程度才算超越了“集邮”阶段。也只有到了这个程度,才真正谈得上把各种不同机制综合在一起建立模型去预测未来。
有时候这个过程会反过来,也就是用现有的机制理论推导一些现象,再去寻找证据证实。但探索未知最基本的科学方法是证据,然后谋求因果关系,然后是提出机制。仅仅是对其中一步作出很小的贡献,就可以发论文。大部分这样的论文事后会被证明没有太大意义,甚至是错误的。但科学就是这么一个不断试错的过程。
每一篇论文都是我们从个人感觉到客观事实,从客观事实到相关性再到因果关系,从因果关系到能推广使用的机制,这个过程中的一小步。这个过程的每一步都不是完美的,但只有这么做,我们才能摆脱童稚状态。
注:本篇文章整理自《万万没想到》,如有兴趣可以亲自去看看原书,相信你会有更大的收获!
网友评论