数据到底怎么治,这确实是一个宽泛的话题,首先是要明确治理的内容。针对不同的治理内容采取不同的数据治理策略。关于小数据和大数据的治理侧重点上文已经说明数据治理领域总结的数据治理十大关键实践:
1、成立组织,育人才
数据治理的根本目标的是提升数据质量,控制数据安全和合规使用。数据治理涉及范围广,参与人员多,需要一定的组织和制度的保障才可能获得成功。首先,依据行业经验来看,不论是基于后台的小数据治理,还是基于中台的大数据治理,“一把手”工程是数据治理组织建设的最佳实践。尤其是中台数据治理更是上升至企业战略层面,自下而上的治理几乎不太可能成功。其次,数据治理组织的建立并是组建一个非临时团队,而是要能够支撑企业数据化业务的一个完整体系,包括:组织体系、管理体系、执行体系、技术体系等。第三,数据治理组织的人员选拔和人才培养,不同企业应有不同的策略。一般来说,建立数据治理组织从企业内部进行选拔相应的技术专家、业务专家更为合适,要比从外部招聘更能够快速上手。不过,对于传统企业,其内部更偏管理,数据治理团队建设更多需要借助外部力量。
2、需求调研,摸家底
与数据项目一样,详细需求调研是开展数据治理工作的第一阶段的重要工作。本阶段主要是理解企业的战略,并按照从上而下的策略进行开展企业数据管理的现状调研,摸清楚企业数据资产的分布、数据的质量、数据的管理现状、数据应用需求等情况。该阶段的工作目标是确定数据治理项目的目标和范围,评估数据治理成熟度,确定改进内容和方向并与客户达成共识。
3、梳理数据,建标准
按照业务主题进行数据资产的梳理,并制定数据资产的标准。首先,定义数据资产元模型标准,包括:数据资产的数据含义、业务规则、质量规则、数据来源、存储路径、管理部门、管理人等,即数据资产的元数据标准,定义好数据模型是数据治理成功落地的重要前提;其次,重点对企业的核心数据资产——主数据进行标准化,包括:主数据标准化定义、参照字典的标准化、数据清洗、数据服务共享等;第三,对业务指标的属性的标准化,指标的属性分为“业务属性”和“技术属性”两类,业务属性包含业务人员通常认识的指标分类、名称、计算公式、展现方式和查询权限等;技术属性包含技术运维人员所关心的系统来源、取数字段、取数频率、加工规则等,其核心也是元数据管理。
4、优化流程,定制度
对于企业而言,数据来源于很多方面,内部数据如财务、人力、供应链、生产、销售等;外部数据如政治、经济、社会、科技、行业、市场、竞争对手等。虽然数据来源广、数据量大是优点,但如果不加以整理和关联,杂乱无章的数据不仅不利于分析应用,还将带来不必要的人财物的消耗。所以,非常有必要对数据产生、采集、处理、加工、使用等过程进行规范。通过统一数据标准,制定合理的数据管理流程和制度,规范数据生产供应的过程。
5、搭建平台,接数据
数据治理平台的搭建要根据不同的客户需求搭建不同模块,数据治理平台主要涵盖功能模块有:元数据管理、主数据管理、数据质量管理、数据标准管理、数据安全管理、数据模型工具、ETL工具等。数据接入是将各种来源、各种类型的数据,通过数据集成工具将这些零散的数据整合在一起,纳入统一的大数据平平台或数据仓库中,这一过程需要符合数据治理平台定义各种数据标准、质量规则、安全指标。所以,我们说数据治理项目不是为了治理数据而建设的,而是配合大数据平台、数据仓库、数据分析挖掘等项目,通过提升数据质量、控制数据安全,让数据发挥出最大的效益。
6、建立指标,提质量
提升数据质量是企业数据治理的重要目标,也是企业进行数据分析挖掘、业务管理和决策的重要基础,只有建立完整的数据质量体系,才能有效提升企业数据整体质量,从而更好的为业务服务。从技术面上讲,定义完整全面的数据质量的评估维度,包括完整性、时效性等,并按照已定义的维度,在系统建设的各个阶段都应该根据标准进行数据质量检测和规范,及时进行治理,避免事后的清洗工作。
7、优化模型,控安全
数据安全治理,始于数据资产梳理。通过对数据资产的梳理,可以确定敏感数据在系统内部的分布、确定敏感数据是如何被访问的、确定当前的账号和授权的状况。根据企业的数据价值和特征,梳理出企业的核心数据资产,对其分级分类,通过数据治理工具进行建模,定义敏感数据位置、描述和处理方式,保证数据的合规合法使用。
8、开放服务,促应用
数据的治理是为促进数据更好的应用,一切不以应用为目的数据治理都是耍流氓。通过数据资产目录、微服务等技术将数据进行开发共享,促进数据在企业中的应用,使得数据作为企业的宝贵资产应用于业务、管理和战略决策中,发挥数据资产价值。
9、赋能业务,抓创新
数据赋能是在管理和业务应用中发挥数据更大的价值,以数据驱动业务的落地。数据赋能核心是,①汇聚数据:完善企业内部信息数据化,采集外部数据;②治理数据:整合数据,清洗、转换、分析、服务;③应用数据:以数据为驱动将洞察结果应用到实际业务中去,推动企业业务和管理的创新。
10、持续优化,再出发
企业的数据治理是一个螺旋上升模型,需要不断的迭代和优化。数据治理不能一蹴而就,需要建立起长效的持续运营机制,要将数据治理变成企业的一种机制、一种文化、一种习惯,而数据治理每一次迭代优化都预示着企业数据战略目标的再出发!
数据治理的本质是盘点数据资产、提升数据质量,实施数据全生命周期的管理。工欲善其事,必先利其器。一套好的数据治理工具,能让企业的数据治理工作事半功倍。
根据不同的项目特点,会用到不同的技术或工具,一般来说,数据治理产品或工具主要包含元数据管理、数据质量管理、数据标准管理这3个组件,还会有主数据管理、数据安全管理、数据生命周期管理等。
目前业界流行的数据治理软件,一般也称为数据资产管理产品、数据治理产品,多是单个产品。而亿信华辰经过十余年技术沉淀和项目锤炼,全面推出一站式数据治理管理平台-睿治,帮助企业搭建数据治理全栈解决方案,由元数据、数据标准、数据质量、数据集成、主数据、数据资产、数据交换、数据生命周期、数据安全9大产品组成,可谓是功能最齐全的数据治理工具。
睿治数据治理平台
事实上,在一个大型的数据治理项目中,不是一项技术或工具就能搞定的,需要根据企业的需求采用不同产品和工具的组合。睿治数据治理平台9大产品模块,每个产品模块都可以灵活组合使用,也可以分开单独来使用,完美的满足了不同数据治理的场景。
睿治数据治理平台架构图
网友评论