性别歧视是一个大家都很关心的问题,并且一点就炸,然后各路神通都来讨论,然后对于源数据是否真实早就抛到一边,直接变成观点的论战。
这里有一个案例就是在上世纪70年代,有人指控加州伯克利分校研究生院歧视女性。原因是男性申请人的录取率为44%,而女性申请人的录取率只有35%。这么巨大的差距表明了了,在加州伯克利分校里,男性的录取率远远高于女性,这明显是对于女性的其实。
这个数据真实可靠,整体上来说男性的录取率真的就是高于女性,并没有任何计算错误,或是有意引导的成分。想一想,你看到这个数据第一感觉是什么?
法院收到这个结果也是立马着手调查,在考察了该学院85个系之后,居然是几乎没有明显的女性被歧视的证据,相反,人们反而觉得对于一些系而言,女性的录取率反而高于男性。
原因是,在考察每个系的时候,发现只有两个系,男性的录取率(28%和45%)明显高于女性(24%和30%),而对于女性而言,仅有一个系男性(62%)明显小于女性(82%),其余系则差异不是很大。
看起来非常怪异的是,当数据被分解后,聚合的数据中的模式遭到了逆转。而混杂的因素是一些系的录取率远远高于其他系。
统计的结果如果想要真实可靠,那么就需要有一个随机的可以参照的参照组,但实际情况下我们是很难有这些参照组实验的,既不人道,也不现实。比如说,历史上一个很有名的案例,在19实际,曾经伦敦被霍乱侵袭,,仅1832年就有6500人死亡。
这足以另整个伦敦的人们为之感到恐慌,并不知道自己明天是否生病,自己的亲人是否即将离去。当时的主流医学机构认为,霍乱与其他的疾病一样,都是由于呼吸了一种致病的有毒气体——瘴气,所导致的。
当时的伦敦整个就是一个臭气熏天的大粪坑,街道上马粪、人粪还有腐烂的垃圾还有被各种生活垃圾污染的泰晤士河。曾经在历史课本上看到,当时的伦敦人走在街道上,随时需要担心自己的头顶上是不是会有人的粪便被倾泻而下,所以才有伦敦人爱戴帽子这样一个习惯。人们出行,不得不掩盖口鼻,能不出门就尽量不出门,“臭”可谓是那是伦敦的代名词。
这样的生活环境和人们的生活习惯,从另一个侧面“佐证”了这种“瘴气理论”。但这个理论却无法被证明也无法被证伪。如果说科学家能够把伦敦人放在一个受控的条件下进行试验,随机的将人分成两组:一组不控制空气,就让他们生活在乌烟瘴气的伦敦,一组控制空气,让他们生活在空气情节的环境中生活和工作。然后对比后就能知道这种医学机构的猜测是否正确,但实际上是不可能做到的,如果是空气的问题,那么对于被分到不控制组来说非常不道德。当然想要控制空气这个变量也太现实。
对于社会问题,最好的解决办法就是 利用自然条件来分析,统计,判断。恰好在这个例子中可以通过自然条件来区分。
当时在伦敦有个年轻的 医生约翰.斯诺,他提出,霍乱不是通过空气传播,而是通过水源传播的。当然这样一个在医学上的奇异猜想是不会得到主流的认可,更不可能获得被瘴气理论洗脑过的大众的支持。
在伦敦市政认为是空气问题,所以开始禁止伦敦市民使用粪坑,并将它们的住宅与整个伦敦新建的污水管道相连,这样就减少了城市中粪便的排泄,但这些排泄物最终去了哪里呢?人们的粪便被未经处理的排到了伦敦市民的直接或间接水源泰晤士河中。
1850年,在英国著名医学杂志《柳叶刀》曾有一篇文章详细报道了伦敦人水源问题,曾指出,从泰晤士河中将人们的粪便送到蓄水池中,再通过伦敦的供水系统送到伦敦市民家中,“部分居民不得不以某种形式消费自己的排泄物,并未这种特权支付账单。”
在1854年,另一次伦敦霍乱再度流行起来,由于一家水厂受到了媒体的影响,决定将水源搬迁至未受污染的上游,而其余两家水厂依旧在受污染的水源中取水,这样就形成了天然的变量控制。这位年轻的医生斯诺马上着手调查研究,发现,由未受污染水源供水的居民的霍乱死亡率远远低于受污染水源供水的居民。
现代科学家最终证明了斯洛的理论,霍乱是通过摄取被粪便污染的饮食传播的。虽然斯诺并没有来得及看到自己的理论被证实,但因为他的贡献,使得无数人远离了霍乱的威胁。
控制变量有的时候很难。混杂因素常常会出现在使用观测的数据研究中,人们无法通过现实的方法使这些因素维持恒定。但我们可以去分析自然条件,比如斯诺发现了不同水务公司服务的不同区域,从而减少了混杂因素。
经常听说,数据不会说谎,其实数据很能说谎,这取决于你怎么去用数据。如果你是通过数据,然后来推倒你想要的结论,那多半这个结论都是错的。并且对于这个看似正确的结论刚好支持你的观点,那么你就会倾向于认可他的结论。
其实更加明智的做法是进行仔细研究,排除混杂因素,并且将整体结论分开看看,是不是有什么猫腻。就像伯克利大学的例子,人们的自然倾向是歧视女性,但深入分析之后,看似严重的问题其实根本就不存在。
如何正确的使用数据呢?数据是我们现有理论,然后再去随机对照分析,看看数据是否支持理论,千万别反过来。如果你抛三次硬币,发现三次都朝上,那么通过这个数据,你就认为,抛硬币是上面的概率大于下面,这显然是不对的。
网友评论