作者简介: 维克托·迈尔-舍恩伯格,数据科学家
出版日期: 2012 年 12 月
全书分为三部分:大数据时代的思维变革,大数据时代的商业变革、大数据时代的管理变革
大数据时代的思维变革
在大数据之前,由于采集、记录、存储和分析数据的工具不够好,人们只能收集少量数据进行分析,而随着互联网技术的发展和各种传感器的应用,人类已经能够收集处理越来越多的数据。在小数据时代通过对随机样本的研究,研究人员用做少的数据获得最多的信息,而随机采样就要求样本要具有足够的代表性,采样的目的就是用最小的数据获得最多的信息。而现如今人类已经能够近似拥有 样本 = 总体 这样的数据,通过使用所有的数据,可以发现在小样本分析中被淹没掉的情况。大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。
由“小数据”到“大数据”,一些错误数据会混入到数据库中,导致结果不够精确。但大数据的这种不精确性并不是大数据所固有的,而是现实收集数据过程中的各种问题,这是一个急需解决的问题,并且有可能将长期持续下去。接受数据的不精确和不完美,反而能够进行更好的预测,也能更好的理解这个世界。
在大数据时代,我们更多的是关注事物之间的相关关系,而不是因果关系,也即关注的是是什么而不是为什么。建立在相关关系分析法基础上的预测是大数据的核心。通过快速找出可能相关的事物,可以在此基础之上进行进一步的因果关系分析,如果存在因果关系的话,再进一步找出原因。这样就可以可以快速根据相关关系为我们提供新的视角。
大数据时代的商业变革
大数据发展的核心动力来源于人类测量、记录、分析世界的渴望。现今信息技术变革随处可见,但之前信息技术变革的重点在“T”(技术),而不是在“I”(信息)上,现在应该将更多的精力和资源用在“I”上了。数据不同于其他无法再利用的事物,数据是可以重复利用的,以前未能发现的关系,或许通过其他方式再利用就能产生新的价值。不同来源的数据可以通过重组,将数据集扩大,从而发现以前没有发现的关系。
大数据价值链的三足鼎立数据、技术和思维。所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。
大数据时代的管理变革
在大数据时代,我们的隐私收到了更深的威胁,但这是避免不了的,因为各个公司,政府结构都在收集这些数据。解决办法之一是个人隐私保护方面,从个人许可到使用者承担责任。
书中摘抄:
数学家邓肯.沃茨:一旦你知道了结果,一切都很容易
数据废气:它是用户在线交互的副产品,包括浏览了哪些页面、停留了多久、鼠标光标停留的位置、输入了什么信息等
乔布斯:消费者没义务去了解自己想要什么
凡是过去,皆为序曲
网友评论