从原始社会开始人类就学会了在草绳上打结用来记录信息,再到1888年国科学家奥伯林·史密斯首先提出了磁性录音的设想和理论,再到1956年IBM交付的第一台磁盘驱动器RAMAC 305。这一系列的信息记录的方式不断的随着时间的变化而参生变化,变化的趋势从原始社会的最古老的方式的现代的磁盘。随着技术的不断发展人类所记录的人类日常生活信息的数量也越来越大,据故居人类所参数的数据总量在2020年将会超过40ZB(相当于4万亿GB)。数据就是人类的生产生活的一系列行为的记录,数据记录着人类从原始社会到现代社会的种种信息,由于从磁盘的发明才让人类能更好的存储信息,那么现在的数据在广义上可以理解为被记录存储下来的人类行为所产生的一系列信息。
人类的信息技术发展到目前为止分为3个阶段,第一阶段为IT时代,第二阶段是互联网时代,第三个阶段是现在正在跨越的大数据时代。在IT时代人类通过因特尔网解决人类生产效率低下的问题,在互联网时代人类通过网络连接人与人缩短了人与人之间的连接成本,在大数据时代人类通过存量数据和未来即将产生的未知认知自我。马云说过“在未来数据比人自己还熟悉自己”。
数据分析是通过存量数据通过统计学、机器学习、人工智能等方式发现在历史数据中种种规律。举个简单的例子,为了更加直观的了解交通事故原因,来减少以及预防交通事故的发生我们可以通过分析当地或者全国的交通事故数据、以及交通事故发生生驾驶员数据、交通事故发送生时当地天气数据、事故所在的的道路设计信息等等综合数据,通过发现这些数据中浅在的关联信息来解读交通事故发生的系列原因以达到降低交通事故发生的概率。
数据分析的目的是发现数据中的价值,让冷冰冰存储在亿万磁盘上的数据活跃起来,让数据产生社会价值。
阅读原文
网友评论