不知道大家会不会觉得大数据这个词越来越普遍,各种平台,企业营销上几乎都会谈及大数据。因此到底什么是大数据,大数据如何应用以及有何弊端我觉得特别值得我们了解了解。因此最近我看了两本大数据相关的书,一本是《大数据时代》一本是《大数据营销》。就此我想谈谈我的感受。
数据安全方面:
如今对于数据保护的政策方面还不完善。很多软件、平台对于数据的使用方面主要只是在第一次使用前作为告知,当你许可后什么时候他们在后台使用便不知晓。因此,在日常生活中对于自己的一些隐私数据要有一定的保护意识,特别是自己长用的手机号码,以及一些证件号。不要随随便便就告诉他人或者是放到网络中。如果有条件,也可以准备多个手机号码,一个设为自己平常用的号码,一个用来专门和各种平台绑定以及收听中介等的电话。
大数据学习方面:
数据工具:SQL,python, ETL
商业智能工具:Tableau, Cognos
数据挖掘工具:sas, spss, matlab
大数据工具:R, spark, Hadoop
我觉得至少粗略掌握几种数据工具,如sql,python 和tableau就是不错的选择
大数据思维:
注重相关关系
通过数据之间的相关关系来研究导致这个相关关系的原因,并直接把这个相关关系应用起来。就像是沃尔玛发现消费者购买婴儿尿裤的同时还会购买啤酒。因此他们便把尿裤和啤酒放在一起售卖,结果销量很好。
注重效率,而不是精确度
这就好比是一个产品,两家公司都在做,那么哪一家公司能够率先做出来,占领市场,哪家公司就先把握住了先机。至于精确度上,可以后面慢慢去改善。
在数据的获取上,没有必要保证所有数据来源的精确度,需要把重点放在获取数据的效率,并迅速用所获取的数据预测出或者是分析出一些问题和现象。
要全体不要抽样
随着数据的普及,以及获取的容易度在不断降低。大多数公司已经不满足与抽样数据,毕竟抽样数据涵盖了太多的bias(偏见)。因此,如今的数据获取更多是一次性使用所有数据,在排除有问题的数据后进行分析。
数据创意比数据处理能力更值钱
数据创意主要是指如何从现有数据中创造一些新的方法来挖掘信息。单单会数据处理,就只是一个普通的操作工,虽然也可以用常用的方法模板,分析出不少内容,但这个的门槛还是较低的。
网友评论