《大数据时代》
随着计算科学的发展,从科学到医疗,从银行到互联网,各个不同的领悟,都在讲述一个类似的故事
那就是爆发式的成指数增长的数据。
谷歌每天要处理2的50次方字节的数据,Facebook每天处理超过1000万张照片,Twitter的信息量每年翻一番,YouTube每月接待8亿的访客。
看到这些数字,你会认为,这些海量的数据到底有什么价值?
俗话说,量变必将产生质变,数据也是如此,以我有限的知识看来,主要有两点…
1 预测
例如当当的个性推荐,腾讯的好友推荐,uc的网页推荐,其实我们都生活在这些互联网网站的套路中。
2 智能
建立在海量数据之上的机器学习,例如谷歌的阿尔法狗,IBM的深难,沃森。华为的magic内置系统,就拿华为的这款手机举例子吧,他不断搜集你的位置,体温,浏览的网页,玩手机的时间等数据……然后提供各种建议,不断进行内部的优化。我的词藻实在匮乏,难以描述其中的美妙。
为紧随时代的潮流,我们也应转变三个思想
1 我们统计的数据不再是样本,而是整体。没错,是整体,传统的统计学方法——抽样…将不再适用。
2 我们更加热衷于相关关系,而不再追求因果关系,对于一件事情,我们只需要知道结果,至于为什么会有这个结果,我们不关心。
3 数据变多,我们不再追求精确度,我们允许数据的个别错误。
本书的第四章介绍了万物的数据化,如果感觉不过瘾,我推荐《数据之巅》这本书对于数据化,讲更详细。
第五章讲的是数据的价值,比如数据的重复利用,可扩展性,重组……总之,数据的潜在价值大于间接价值(怎么感觉有点像生态系统呢)
六章是思维,说实话思维这种东西,太宽泛,抽象,主要就是那些互联网巨头们应用数据的想法…
任何事物都是双面性的,大数据也不例外。比如:
1 隐私,
现在你每天浏览的网站,聊天记录,去过的地方,社交圈子,买过的东西……全都在那些互联网巨头的监控之下,我们就像是赤身裸体一般。
做出选择,必将承受代价,这是不变的真理,就像你看一本书,就得牺牲大量娱乐的时间,但我们不想这么糊涂的生活下去,糊涂到连这个世界发生什么都不知道。何况我是学统计的,就更应该做一个数据急先锋了!
网友评论