大数据背景
全球数据量高速增长
大数据定义之一
数据没有办法在可容忍的时间内,使用常规软件完成存储、管理和处理任务
大数据是多V的,海量(Volume)、多样(Variety)、快速(Velocity)、价值(Value)...
海量:非结构化数据的超大规模和增长
多样:非结构的超大规模和增长,网络日志、视频、图片、地理位置、气象信息。。。
快速:处理速度快;1秒定律,立竿见影;实时分析
价值:价值密度低;无关信息多;冗余信息多;预测未来趋势和模式
传统数据与大数据区别
数据量:TB级与PB级
速度:稳定增长,量小;持续实时数据,年增长量60%以上
多样性:结构化数据;结构化数据、半结构化数据、非结构化数据
价值:统计和报表;数据挖掘和预测性分析
大数据来源
总的来说,是全方位的,全面业务、横向空间、纵向时间
互联网、物联网、天文、气象、地理、交通、健康。。。
网友评论