数据的质量直接影响着数据的价值,并且还影响着数据分析的结果以及我们依此做出的决策的质量。
俗话说“垃圾进,垃圾去”,质量不高的数据会影响企业的经营管理决策,如果数据是错误的,那么还不如没有数据,因为没有数据时,我们会基于经验和常识做出不见得是错误的决策,而错误的数据会引导我们做出错误的决策。
尤其是在新零售大数据下,数据的来源,数据的结构对比以往更加丰富,但如果不能保证数据质量,所谓的大数据是没有任何帮助的。因此,数据质量是治理企业经营管理数据的关键所在,也是一项最基本但是最重要的工作。
点击此处添加图片说明文字
数据的质量可以通过八个指标进行衡量,每一个指标都从一个侧面反映了数据的品相。这八个指标分别是准确性、真实性、精确性、及时性、即时性、完整性、全面性、关联性。
1
数据的准确性
数据的准确性(Accuracy)是指数据的采集值或者观测值与真实值之间的接近程度,也叫误差值,误差值越大,数据的准确度越低。数据的准确性由数据的采集方法决定的。
2
数据真实性
数据的真实性,也叫数据的正确性(Rightness)。数据的真实性取决于数据采集过程的可控程度。数据采集过程可控程度高,可追溯情况好,数据的真实性就容易得到保证,而可控程度低或者无法追溯,则数据的真实性就难以得到保证。
3
数据精确性
数据的精确性(Precision)是指对同一对象在重复测量时所得到的不同观测数据之间的接近程度。精确性,也叫精准性,它与数据采集的精度有关系。精度越高,要求数据采集的粒度越细,误差的容忍程度也越低。
4
数据及时性
数据的及时性(In-time)是指能否在需要的时候获到数据。例如企业在月初会对上个月的经营和管理数据进行统计和汇总,此时的数据及时性是指这些数据能否及时处理完成,各经营管理单位的数据是否及时核算。数据的及时性是数据分析和挖掘及时性的保障。如果企业的数据核算流程复杂,核算速度缓慢,上个月的数据在本月月中才能统计汇总完成,那么等需要调整经营策略的时候,已经到月底了,一个月已经快过完了。特别是当企业做大了之后,业务覆盖多个市场、多个国家,如果数据不能及时汇总,则会影响到高层决策的及时性。
笔者以前所在的企业,在数据的及时性,尤其是财务的数据,每月要到月中才能出来,月度经营会议也因此要延迟到月中才能召开,甚至影响到上月工资的发放,这对于经营决策的及时性会产生不利的负面影响。
5
数据即时性
数据的即时性包括数据采集的时间节点和数据传输的时间节点,在数据源头采集数据后立即存储并立即加工呈现,就是即时数据,而经过一段时间之后再传输到信息系统中,则数据的即时性就稍差。随着物联网,移动硬件终端的发展,今后的大趋势是所有数据都会在线化,即时化。
零售终端每一笔销售可以0秒响应反馈到总部数据平台。商品从设计-生产-物流运输-到店-陈列的每个环节的数据都是即时的,可视的,这对于管理效率必将是大大的促进。
6
数据完整性
数据的完整性是指数据采集的程度,即应采集的数据和实际采集到的数据之间的比例。例如在采集员工信息数据时,要求员工填写姓名、出生日期、性别、民族、籍贯、身高、血型、婚姻状况、最高学历、最高学历专业、最高学历毕业院校、最高学历毕业时间共12项信息,而某个员工仅仅填写了部分信息,例如只填写了其中的6项,则该员工所填写数据的完整性只有一半。
数据的完整性不够在很多企业都存在,尤其是在采集的一些会员数据信息字段,经常出现很多缺失值,在做数据分析前要做很多转换,增加数据处理的时间。需要在源头进行控制。
7
数据的全面性
数据的全面性和完整性不同,完整性衡量的是应采集的数据和实绩采集到的数据之间的比例。而数据全面性指的是数据采集点的遗漏情况。例如,我们要采集员工行为数据,而实际中只采集了员工上班打卡和下班打卡的数据,上班时间员工的行为数据并未采集,或者没有找到合适的方法来采集,那么这个数据集就是不全面的。
8
数据的关联性
数据的关联性是指各个数据集之间的关联关系。例如员工的工资数据和绩效考核数据是通过员工关联在一起来的,而且绩效数据直接关系到工资数据。采购订单数据与生产订单数据之间通过物料的追溯机制进行关联,而生产订单又是由员工完成的,即通过员工作业数据与员工信息数据关联起来的。
点击此处添加图片说明文字
网友评论