12.17早读 | 若只为糊口而工作,必然不会拼全力
My only real motivation is not to be hassled. But that'll only make someone work just hard enough not to get fired.
大数据定义5V(属性定义)
第一,数据体量( Volume) 巨大.指收集和分析的数据量非常大,从 TB 级别,跃升到 PB 级别,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了 PB 级的数据量.
第二,处理速度( Velocity) 快,需要对数据进行近实时的分析.以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒.这一点和传统的数据挖掘技术有着本质的不同.
第三,数据类别( Variety) 大,大数据来自多种数据源,数据种类和格式日渐丰富,包含结构化、半结构化和非结构化等多种数据形式,如网络日志、视频、图片、地理位置信息等.
第四,数据真实性( Veracity) .大数据中的内容是与真实世界中的发生息息相关的,研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程.
第五,价值密度低,商业价值( Value) 高.通过分析数据可以得出如何抓住机遇及收获价值.
网友评论