7.2.2 非结构化数据
非结构化数据大多数都是一些零散的、没有一定规律的数据。例如用户在电商网站上浏览商品的浏览记录数据,或者一些系统的操作日志等,这些不是按照一定的规则进行结构化存储的数据都叫作非结构化数据。例如图片、视频、音频等数据都属于非结构化数据。与结构化数据相比,非结构化数据的采集和分析更复杂,非结构化数据的数据量也要大很多。
例如,结构化的商品数据一般都是按照商品的种类和型号分类的,这些数据的数量基本等同于商品的数量,但是用户对商品的浏览数据却是非常庞大的,可以设想一下,一位用户在商品网站上浏览商品,浏览的顺序是非常多样化的,而且在不同的商品中浏览查看的内容也非常不固定,由此就会产生大量的浏览数据,这些数据都是以非结构化的方式进行存储的。
非结构化存储与结构化存储的区别在于对数据结构的设计。结构化存储类似于图书馆对书目的标准化分类管理,非结构化存储就好比一个杂货仓库,里面的货物随机摆放没有规则。但是如果能利用好这些“杂货”,也可以从里面挖掘出“金子”。当我们分析用户浏览商品的记录数据时,可以分析出用户行为。
例如某个用户的浏览记录通常都是覆盖在经济管理类图书和鞋类商品上的,通过对这些浏览数据的分析,我们可以判断出这个用户的使用行为,基于这个行为结论,我们可以向这个用户推送经济管理类的书籍和鞋类商品,以此提高用户对产品内容的关注度和成交率。这就是非结构化数据能带来的实际好处,能基于大量的数据进行决策分析。
网友评论