在写论文的时候,选择了写与大数据统计分析有关的方向,但是在讨论的时候,发现其实自己并不知道什么,大数据的统计分析和上课学的统计学有什么不同。在网上翻看了一些介绍大数据的文章,什么大数据的4个V,什么的,更模糊了,于是回过头来,看这本经典的书,对于技术出身的我,也戏称这本书为一本故事书。
Paste_Image.png根据一些读书法则,首先提纲挈领。
大数据分析与现在的统计分析的区别
- 大数据分析统计的是事物的相关关系,现在一般都是寻找因果关系。
- 大数据是全量分析,统计分析是一种样本分析
大数据的核心是预测
根据相关关系进行预测
思想的变革
大数据分析的原理有的比较早,不过是因为计算和统计比较困难,所以才在这个基础上发展出了样本统计,以及现在统计学中所学习的各种分布。随着计算机技术的发展,计算和存储的成本越来越低,分析全量数据的可能性更高了。
大数据不等于数据量非常大,大数据的意思是全量数据。
大数据分析的是事物的相关关系,是一种“是什么”的分析,而不是为什么的分析,为什么?这个留给专家学者去解释吧。
所以谷歌的程序员可以根据人们的搜索记录来预报流感的范围。对机票的统计和分析可以预测机票的价格。
当看到可以预测机票的价格时,我留心了,我想是否可以根据某些数据的相关关系和预计股票的上涨和下跌的趋势,正确率只要大概50%就可以盈利,后来发现已经有不少这样推测的论文了,粗看论文的样子,貌似不很成功,因为如果成功了,他们的论文就不会发表了,有钱自己赚呀,发表出来大家都用统一的算法,会增加算法的变数。
于是,我结合自己的工作,试着想分析一下旅游项目中的酒店价格。
商业的变革
大数据发展的核心动力来源于人类的测量、记录和分析世界的渴望。信息技术-IT,目前重点已经可以从T转向I
其实一切都可以进行数据化(不是数据化)。数据就像一座矿山,你可以从里面提炼黄金,我可从里面开采钻石。通过不同的角度可以得到不同的结果,所以相当于一座取之不竭的矿山。
在将来,大数据可以从几种角度来产生商机。
- 掌握大数据的公司,据小道消息,雷布斯也知道大数据的作用,但是目前没有好的利用方式,粮食公司每年都会花大价钱来把这些数据存起来,以后知道如何使用了再用。
- 掌握大数据技术的公司,类似于现在做管理咨询的吧。
- 有大数据思维的公司和个人。
管理的变革
对于大数据应用其实现在还没有合适的立法。人们都生活在监控下,各种购物习惯都在电商哪里,他们知道你的偏好,选择,可以说比你自己更了解你自己。
这样想一下,其实他们想诱导你做什么,你就会去做什么。就像二级市场上的散户,被机构做出来的k线所诱导。
如何去保护个人的隐私也是一项将来必不可少的话题。
网友评论