大家好!爱读书、爱生活,做一名智慧与美貌并存的女子,我是Echo,欢迎来到我的私家书单。
今天我要给大家推荐的书是《人人都在说谎》。这本书的作者赛思·斯蒂芬斯-达维多维茨,是《纽约时报》专栏作家,沃顿商学院客座讲师,前谷歌数据科学家。他研究发现,世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。
比如,有多少人买了书真正看完了?你朋友的酒量有他说的那么大吗?父母是否暗自喜欢儿子多于女儿?电影里暴力镜头增多会导致犯罪率升高吗?种族歧视在如今的美国还严重吗?特朗普胜利有征兆吗,是什么促成他赢得了大选?
对于这些以及类似的很多问题,传统的统计调研方法得出的结论有很多是错误的,误导了我们的认知。但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭……在线生成了大量的数据,为我们提供了真实而庞大的数据宝库。
作者在这本书中用他独特的数据分析方法告诉了我们很多颠覆认知的结论,很多问题的答案正暗藏于看似没有关联的因素中,很多直觉和经验给出的答案与事实相差千里。
作者在书中提到了大数据主要有四个功能,第一是提供新型数据,它可以为人的研究提供新的信息,提供过去从未有人搜集到的信息。
第二是某些在线资源可以让人们承认他们在其他地方不会承认的事。
第三是它使我们能够对数据集的一小部分进行有意义的放大,从而获得有关人性的新见解。
第四是它让随机试验变得更加便捷,不论何时何地,只要你在线,它就能找到真正的因果效应。在大数据时代,整个世界就是一个实验室。
每一个功能,作者在书中都有非常详细的案例分析,今天我们主要来看一下,如何通过大数据分析特朗普当选美国总统。
2016年美国共和党初选时,民意调查专家断定特朗普毫无胜算,毕竟特朗普曾经冒犯过不少少数群体。民意调查结果显示,几乎没有任何一个美国人赞成这样的行径。
当时,大多数民意调查专家认为特朗普会在普选环节败北。很多拟投票的选民说,考虑到特朗普的言行,他们最终放弃投票。
但当时确实有一些迹象表明特朗普有可能赢得党内初选以及普选——这些迹象源于网络。
比如,作者通过谷歌搜索的数据研究发现,2016年特朗普和希拉里·克林顿竞选期间,有些人搜索了“特朗普 克林顿 投票”,有些人则通过搜索“克林顿 特朗普 辩论”查找两人辩论的花絮。事实上,在对“特朗普”的搜索中,有12%包含“克林顿”一词;而在对“克林顿”的搜索中,包含“特朗普”一词的比例超过¼。
通过研究表明,在一条包含两位候选人的搜索中,选民更有可能将其支持的候选人姓氏放在前面。
在之前的三次总统选举中,候选人在搜索中姓氏排在前面的概率越大,其得票率也就越高。更有趣的是,候选人姓氏的搜索顺序还可以预见某一特定州将会支持谁。
再比如,非洲裔美国人告诉民意调查员,他们中的大多数人很可能会反对特朗普,但是谷歌搜索中非洲裔美国人聚居区的信息量一路走低。可大选那天,因非洲裔选民投票率低而受损的人却是希拉里·克林顿。
当时甚至还有迹象表明摇摆选民可能会选择支持特朗普。作者研究发现,在美国中西部的几个关键州,“特朗普 克林顿”搜索量要多余于“克林顿 特朗普”,而这几个关键州本来是希拉里·克林顿十拿九稳的。事实上,特朗普之所以赢得选举,就是因为赢得了那几个关键州的支持。
人们常常说谎,对自己说谎,也对别人说谎。2008年,许多美国人告诉民意调查员,他们早已不在意种族了。8年后,他们却把特朗普选为总统,而这位先生曾经在其推特上转发过一条错误言论——黑人要为美国白人的大多数谋杀行为负责;他还曾经在一次集会上为其支持者辩护,这些支持者此前殴打了一名参与“黑人的命也是命”的抗议者;他也曾在否认接受过三K党某前领导人的支持时支支吾吾。同是暗流涌动的种族主义,刺伤了当日的奥巴马,却成就了今天的特朗普。
书中还有非常多有趣的数据分析和研究,作者希望可以通过数据让我们了解人类真实的行为和想法。
最后,作者还给了我们一个不错的建议,对生活有困惑的年轻人,如果你有一点统计技能、丰富的创造力和好奇心,那就从事数据分析行业吧。
So you can try.
我是Echo,这是我给你推荐的第48本书,我们下次见喽。
网友评论