都说要想做到数据分析,就必须有足够好的数据质量,但是我却发现有时候数据质量实际上阻挡了数据分析的进度。
首先从宏观看,数据分析、计划预测始终都有,但是数据质量却是最近才提出的概念,甚至对于数据质量的检查也只是一些简单的标准,那么在没有高质量的大数据前,人们是如何进行数据分析和预测的呢?其实就是一看不完备的数据质量和局部的数据。
虽然可以通过质量较低的数据进行分析,但是貌似也是需要人的参与多一些。
还有一种情况,就是数据有多个维度,但是在不同领域分析的时候,需要不同维度的数据质量。例如,统计备件,可以由设备维度、供应商维度,如果我需要统计设别与备件的关系,那么在设备维度上只要足够准确就可以进行,至于供应商维度、库存维度,就算再烂不影响分析。
基于以上分析,如果在做数据质量的时候,不考虑最终分析的维度,无论什么维度都要做到数据质量达标,那么,前期在数据质量上投入的精力和时间,就会导致后期数据分析始终无法启动。
网友评论