听李院士讲座,其中说到今天的大数据时代是相关关系,不再是因果关系。
正如那个经典案例,在上世纪90年代,美国沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中。
很显然这就是一个相关关系。
可问题来了,难道在大数据时代我们不需要脑子了?难道要放弃因果关系?
计算机能够提供给我们的结论(到目前为止以及在可见的未来),都是相关性。计算机从未提供过明确的因果关系给人类。一直有相当多的应用,也是只考虑相关性,不考虑因果关系的:确定因果关系,是需要更大的精力、更多的投入的。
所以只看相关性而不看因果性也不是什么新的结论。而这个相关性是不是可以作为决策的基础呢?
有一个这样的故事:通过大量的数据分析,慈善组织得出结论:一个国家、地区的电视机的普及率与发达富裕程度很有关系(冰箱、洗衣机、空调、高跟鞋、牛仔裤,etc.,也会和发达程度有这样的相关性),于是他们就向贫困国家赠送了很多电视,认为此举可以促进改过的经济发展。你可以鬼扯电视的普及与经济文化的密切相关,但是实际上最终发现更可能是经济发展导致了电视的普及,而不是反过来。所以,我们真的不需要因果分析吗?
说得玩笑一点:这个世界真的不需要脑子了吗?
而这个相关性是不是可以作为决策的基础呢?这个一样离不开人的判断。
进而是否因果关系,也是人类在数据基础上,进行的人为判断。
可以不可以这么说:如果放弃对因果关系的分析,是人类的堕落。(周教授语)
唐家湾金凤路6号
2021年12月19日
网友评论