关键验证 Critical Test

作者: 高黑 | 来源:发表于2018-07-29 08:24 被阅读114次

为什么需要理论

假设一个人无法对太阳第二天还会不会升起做出判断,那么他就得为第二天的活动做出至少两套准备方案,而另外一个人总结出了规律可以做出判断,就只需做出一套方案,后者明显比前者效率更高。这种效率体现在人类从诞生以来的方方面面,包括采摘、狩猎、种植、以及后来的现代文明。

简言之,掌握规律的人或者群体,其存活几率更大,文明更发达,所以我们需要理论,这是进化论决定的。

理论怎么得来的

理论最容易获得的方式是归纳。比如,人们看到扔一个石子一定会落回地面,就总结出一个规律。看到扔一块木头也落回地面,但是速度比石子略慢,也总结出一个规律。扔一片羽毛,就落得更慢了,风大时还会被吹走,迟迟不落地,于是又总结出一个规律。

规律太多了,使用起来还是不够方便,于是人们就思考,能不能有个更根本的理论来解释这一切物体下落的规律呢?

这时候,演绎法就出马了。亚里士多德就构建了一个理论,它包含一些基本的公理性假设,以及由此而来的推理:

1)地球上的万物都由四种元素构成,土、气、水、火,其中土元素最重;2)地球是宇宙的中心且静止不动;3)四元素都有向宇宙中心运动的动力,且土元素动力最大;4)物体落向宇宙中心时,怀着愉悦的心情,会越来越强烈的想靠近。

这个理论有很多现实世界里看不见、摸不着的东西,我们其实无从判断它是不是正确,尤其那个年代的人们,只能是作为公理来相信 ,比如四种元素、万物、宇宙中心、动力、愉悦的心情等。

这个理论本身是可以自洽的,简单的说就是各种元素都落向中心,越重的东西落得越快。演绎法推演出来的理论和归纳法不同的地方在于,这个理论本身不能给我们带来什么,这纯粹是一个抽象的概念和规律,如果应用,就必须把这个理论套到实践中,增加新的外部条件,然后看其解释也预测和现实是不是相符。

比如,石头的土元素比羽毛多,所以,虽然两者都会落向宇宙中心,但是石头明显下降的更快。我们把石头和羽毛套进这个理论中,得到了一个结论,然后这个结论和我们的观测是相符的。一般来说,我们这个时候会说,该理论是正确的。

到这里,一切都没什么问题。

但是,后来人们发现, 牛顿力学也可以解释这些现象,但解释的方法不同,物体下落是因为万有引力,物体下降得越来越快是因为重力作用,羽毛比石头落的慢是空气阻力。

仅到此为止,我们是无法判断出亚里士多德和牛顿的理论,哪一个更正确的。历史上,这种情况也很常见,不同的理论会有一段时间共存,彼此都不能完全取代对方,比如地心说和日心说,以太论和非以太论,燃素说和无燃素说。现代经济学和心理学更是流派林立。

那么问题来了,两个理论都可以解释同样的现象,都可以做出同样的预测,那么究竟哪一个更正确呢?

理论为什么需要验证

这里要先澄清一个概念,何为一个理论正确?对于归纳法总结出的规律,这个定义相对简单,只要符合现实就是正确的。但是对于演绎法总结出的规律,就有分歧了。

一种观点认为,理论是否正确,仅仅取决于其自身是否逻辑自洽,和现实无关,现实只能用来选择理论,不能判定理论正确与否。比如,牛顿力学和相对论都是正确的,欧式几何和非欧几何都是正确的,适用范围不同而已,具体应用不是判定谁对谁错,而且看谁更适合解决问题。

另外一种观点认为,理论逻辑自洽仅仅是一种假说,判断其是否正确,还是要用实践检验,看其预测的结果和实际是不是相符,相符才叫正确,或者暂时正确。

大部分科学领域遵从第二个标准,也就是理论必须被验证后才能说其正确与否。

我们观察诺贝尔奖的评判标准,也可以看出当今科学界对理论验证的看法。希格斯早在1964年就发表论文提出了玻色子的概念,但直到2013年才被观测到,而同年希格斯马上获了诺贝尔物理学奖。霍金的物理学水平不在希格斯之下,知名度还更高,但是由于他研究的是宇宙起源、黑洞等,尚未甚至无法被观测到,所以霍金没有获诺贝尔奖。而诺贝尔经济学奖有个不成文的规定,不会授予一个历史短于30年的理论的作者,这也是因为在真实世界验证一个经济学理论是十分困难的,尤其还要多次验证的话。

回到亚里士多德。那么人们是怎么用牛顿力学取代了亚里士多德的物理学的呢?牛顿力学可以精准的预测出来物体下落的速度,这个亚里士多德做不到。牛顿力学可以预测出在真空环境里,羽毛和石块下降速度一样,但是按照亚里士多德的预测,真空中仍然是石头下降快,牛顿力学的预测结果更符合观测。

广义逻辑融洽

王东岳提出了一个广义逻辑融洽的概念,来定义什么叫正确的理论。

他认为我们所有的认知来源于两个逻辑通道,一个是感性,一个是理性,除此之外再无第三个。我们对外部世界的感知和认知均是通过这两个通道完成的。

理性的特点是认知深刻,复杂,可以通过抽象概念,逻辑推理等得出复杂的结论,但缺点是不稳定,比如我们的宇宙观,在三千年里经历了很多次变革,从天圆地方、到地动说,地心说,日心说,物理学也从牛顿力学发展到了相对论和量子力学。哲学、心理学、经济学等更是每几十年就出现一股新的理论。

感性的特点恰恰相反,它的认知相对简单、直接,但是非常稳定。比如,几万去甚至几十万年,我们对绿色和光线的感知都不会变。

所以,一个理论是否正确,就看其能否在理性逻辑通道和感性逻辑通道上都不矛盾,既能自圆其说,又能符合观测,这叫广义逻辑融洽。

也就是说,这是一个双保险,这样的理论更加正确。这提现的是人类认知的最高水平。

关键验证

科学界有一个词叫关键验证,Critical Test,说的是,如果有两个理论都可以解释同样的现象,无法区别谁对谁错,那么可以设计一个场景,在这种条件下,两个理论的预测结果是不同的,从而可以用实际观测来检验。

比萨斜塔扔下轻重不同的两个铁球,正是这种实验。

真空中,看羽毛和石块是否同时落下,月球上重力作用会不会减少,都是。

上世纪三、四十年代,关于宇宙的起源有膨胀说和恒态说两种,彼此都不能说服对方。后来几位持宇宙膨胀论观点的学者,通过数学演算做出预测,宇宙中应该存在一种微波辐射,而这个预测是其它任何理论都无法得出的,20年后,人类发现了宇宙微波背景辐射 ,从此宇宙膨胀论占据了主流。

爱因斯坦的相对论预测出光线靠近大质量物体时会弯曲,这个预测是牛顿力学做不出来的,1919年爱丁顿爵士利用日全食,在两个地方分别观测到了光线的弯曲,从而证实了相对论。

验证的困难

有人说,现代科学始自实验。实验就是验证。

在亚里士多德时代,也就是在17世纪之前的近2000年时间里,人们是反对做实验的。这源自亚里士多德的一个哲学观点,自然的不同于人为的。大家认为实验是人为营造的一个场景,和自然本来的面目是有本质区别的,就算你在实验室验证了,也无法表明其在真实世界是正确的。这个观念直到培根、伽利略、笛卡尔时代才被扭转,人们发现并证实万物规律是统一的,在物理、化学等很多领域实验室结果和真实世界结果是一样的。

伽利略为了验证重力加速度,在一个斜面上涂了蜡,制造出一种接近零摩擦力的场景,然后多次实验。在自然科学领域,这就是可控实验,保持其它变量不变,只改变一个,以此来观察这个变量和结果的因果关系,也就是验证理论的有效性。

但有些领域就没法做可控实验了,比如天体物理学,你没法摁住太阳不同,去观察月亮的变化。但我们仍然可以做出预测,用事实进行验证。这需要更加精巧的设计,有时还需要等待时机。

比如前面提到的宇宙微波背景辐射,相对论预测出光线靠近大质量物体时会弯曲,引力波、希格斯玻色子等,都不是在实验室做的实验,是用现实世界来检验。

社会科学领域也没法做可控实验。比如经济学里有需求定理,要求其它条件不变,仅仅改变价格,现实世界里,我们没法去控制其它条件不变而仅仅改变价格;要检验经济危机理论,你也不能人为的制造一个危机。再者,现实世界是不可重复的,每一秒和上一秒都不同,所以也没法做到真正的重复。

同样的道理,这些领域也需要用现实来检验,也需要精巧的设计和等待时机。

曼昆的《经济学原理》中讲过一个案例,中东战争时中断了原油供给,全世界石油价格飞涨,这就提供了一个千载难逢(尽管并不令人喜悦)的机会,去研究自然资源对世界经济的影响。弗里德曼的《实证经济学方法论》详细的阐述了如何做出预测,并在真实世界里进行验证。

应用本身就是检验

关于理论为什么需要用预测来检验,还可以从另外一个角度来看 -- 理论是拿来干什么的?简单的说,理论研究的目的分为两大类,满足好奇心和应用。研究理论的人,其动机是千差万别的,有的人是纯粹的好奇心,或者智力溢出,比如历史上很多数学天才,纯粹为了研究而研究,其理论长期都没什么用。但是还有些人,甚至是更多的人,研究理论是为了应用,为了改造世界,或者就算其本人没有这个意愿,但别人有。

应用的本质就是预测。

你把一个理论拿来应用,就是用它来指导未来。那么,你如何确保这个理论比你现在正在用的理论,或者比你纯粹的瞎蒙更好呢?如果你不能确定,那不就是另外一个新的瞎蒙吗?你首先肯定是看其解释力,和你现在比。但无论如何,只要你用了,你本身就是在做出预测了,然后你会拿结果和预期相比较,随着应用次数的增多,其正确性自然就出来了。

总之。理论是否需要检验,取决于对“正确的理论”的定义。科学界一般认为,只有经过检验的理论才是正确的,或者暂时正确,因为存在被证伪的可能性。只有经过检验的理论,才值得拿来使用。

一个典型的例子就是现代医药。药的理论,叫药理。药理证明某种药可以治疗某种疾病,在现实世界里是一个非常虚无缥缈的假说,药最后能不能被销售,被患者使用,要经过三期临床试验和双盲实验法,短则三五年,长则数十年,最后一切验证说了算 。

相关文章

网友评论

  • April石:👏👏👏
  • 67423dc346cc:你说的太多了,经不起验证的理论,压根就是瞎嚷嚷

本文标题:关键验证 Critical Test

本文链接:https://www.haomeiwen.com/subject/ukczmftx.html