转载/省联社科技信息中心,如有侵权,可后台联系删除!
在说数据质量之前,我们先来看一个小故事。
降落伞的真实故事
在第二次世界大战中期,
在当时,美国空军降落伞的安全度不够完美,
经过厂商努力的改善,良品率已经达到了99.9%,
应该说这个良品率
即使当今社会许多企业也很难达到,
但美国空军却要求降落伞公司的良品率必须达到
100%
于是,降落伞制造商的负责人便与之商讨此事,
看能否降低这个标准?
厂商认为当前这个程度已接近完美了,
没有必要再改了,
美国空军一口回绝“品质没有折扣”。
后来,军方改变了检验降落伞品质的方法;
是从厂商交付的降落伞中,
随机挑出一个,
让厂商负责人装备上身后亲自从飞行中的机身跳下。
这个方法实施后,不良率立刻变成零。
数据质量是什么
数据质量是指数据满足准确性、完整性、时效性、一致性、唯一性、关联性、适当性、有效性及可获取性的程度。具体含义如下:
(一)准确性:数据是否能够准确、真实反映实际信息,以及数据格式是否符合数据标准的要求;
(二)完整性:业务操作所需要的数据是否完备;
(三)时效性:数据是否能够及时被获取,以及是否能够反应当前业务情况;
(四)一致性:反映同一业务实体的数据及其属性是否具有一致的定义和含义;
(五)唯一性:数据在数据集中不存在重复值;
(六)关联性:数据是否具有明确的关联关系,数据关联关系是否被准确定义,数据是否符合数据间的关联关系;
(每个人的机票和飞机座位,都有明确的关联关系。)
(七)适当性:数据是否在可控、安全的范围内发布和使用;
(八)有效性:数据符合已定义的格式规范和业务规则;
(九)可获取性:数据易于理解,且数据格式满足用户需要。
责编 | 付斌
编辑 | 冯捷
来源 | 省联社科技信息中心
网友评论