脑图
38 史学家:怎样鉴别信息的真假-《得到大学》笔记思考
本课学习了鉴别信息真假的方法,我们换个角度,再来看看误导人的信息都有什么特征.
误导人的信息的第一个特征:那就是耸人听闻
对付这类信息,有三个办法
a 放到更大的时空里判断
b看信息的一致性
c看看是否刻意过滤了大背景的低频信息提高了信息失真率。
误导人的信息的第二个特征:没有出处
或者只有一个无法验证的出处,几乎所有的和阴谋论相关的信息都有这个特点。
2002年,Google在做新闻搜索时,要把某一个新闻所有的信息都归为一类,然后要溯源它们各自的信息来源。通常一个被上百家媒体报道的消息,经过这样的溯源之后,来源通常不会超过5个,这最初的5个甚至更少的来源,如果没有官方的报道,或者专业的媒体采访,可信度通常都比较差。
很多信息,其实是某个人断章取义,甚至肆意篡改之后,发布到所有媒体上的,也就是说,它只有一个不太可靠的来源,这种信息不信它也罢。
对于没有条件溯源的同学们,怎样评价这些信息呢?一个最简单的办法就是看同行评议。比如之一有关于NASA不曾登月的信息在流传,你去看看世界各国航天专家们怎么说就可以了。关于用水制氢气驱动汽车的消息,看看这方面的专家怎么说就好。
误导人的信息的第三个特征:缺乏上下文。
你如果看到一条报道,说俄罗斯是全世界最大的产油国,你信不信呢?这个说法不完全算错,但是忽略了一个事实,就是时间维度。在历史上它的确曾经是最大的产油国,但是现在不是。
实际上很多时候,我们的信息要不断更新,因为很多是在变化的。很多人为了证实俄罗斯的强大,常常喜欢拿这个历史数据说事。事实上,今天它不仅产量低于沙特,更低于美国。
而在人们印象中的石油进口大国美国,其实才是世界上最大的产油国,而且它很快会由进口国变为出口国,这一点要感谢页岩气革命,有兴趣的读者可以到得到的每天听本书去听听《页岩革命》这本书。
当然,并非所有的信息都是有人要误导我们的,只是当今的信息过载,我们不能不有所防范。
我们还讲了这样五个重要的原则,你一定要记住:
最好、最重要的资源要用于那些出现最频繁的事情,这样分配资源最有效,其背后的原理是香农第一定律和霍夫曼编码。
不要将相关性当成因果关系。弱相关性对我们做事情没什么帮助,而对于强相关性,要搞清楚谁可能是因,谁可能是果,切忌因果倒置。
我们很多时候,要直接获得某种信息是很困难的,因此可以通过获得等价信息,得到同样的效果。
我们日常遇到的大部分事情,都是渐变的,因此通过增量改进,要比推倒重来效率高,这就如同对增量压缩,可以比静态压缩高很多一样。
由于我们遇到的信息很多,一个比较高效率表示信息的方法是矢量化,也就是将很多维度的信息映射到我们关心的几个维度。我们用到的例子是:文字的演变就是矢量化的结果。
整理自吴军的信息论50讲
网友评论