数据中台的概念如今在国内风靡一时,而人们渐渐开始有这样的疑问:中国的数据中台市场如此火热,而国外的数据中台却没有什么声音。事实并不是这样,硅谷的公司其实已经早于中国建设了所谓的”数据中台“。只不过,在国外,并没有数据中台这个称谓,而是统一按照数据平台的名称命名,但是这个数据平台已经具备我们所说的数据中台的全部功能。
首先要理解一些抽象的数字名字概念:
1、数据库:传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
2、数据仓库:数据仓库系统的主要应用是OLAP,支持复杂的数据分析,侧重决策支持,并且提供直观易懂的查询结果,可做到业务的历史快照,总结性数据以及高纬度分析。
3、数据集市:可以理解为是一种"小型数据仓库",只包含单个主题,且关注范围也非全局,数据从企业范围的数据库、数据仓库中抽取出来,迎合专业用户群体的特殊需求,其面向部门级业务或某一个特定的主题,良好地解决了灵活性和性能之间的矛盾。
4、数据湖:存储企业各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输,主要解决的是“看见数据”的问题,作为全局数据汇总及处理的一个核心功能,数据湖在数据中台建设中必不可少,除了为数据仓库提供原始数据之外,数据湖也可以直接为上层的数据应用提供服务。
5、大数据平台:个性化、多样化数据,以处理海量数据存储、计算及流数据实时计算等场景为主的一套基础设施,使用大数据平台,企业可以比竞争对手更快地作出数据驱动的决策,更快地推出适应客户需求的产品。
6、数据中台:我们知道所有关于数据工具的建设,其目的都是为了从数据中提取价值来支持更有效的数据运营,那么不能指导实际行动,创造实际价值的数据以及从数据中产生的知识是无用的,那花大价钱来做这个系统也没有必要。
说到底,数据工具的建设还是要以 ROI(Return On Investment)来支持,数据中台概念的出现,很大程度上是原来的大数据系统建设的ROI 不如人意,企业投入了大量的物力、财力和人力建设了大数据平台,却发现并没有给企业带来应用的价值,大数据平台更多的沦为“形象工程“,甚至产生了新的数据孤岛,更不用说实现数据能力的全局抽象、复用和共享了,而数据中台可以说是为此类大数据平台了个“补丁”,其全局的数据仓库、大数据协调共享等能力,真正解决了重复开发、数据标准不统一、数据孤岛等问题,从而提高了数据价值实现效率和ROI。
以下是数据平台建设的架构图:
大数据计算体系 数据中台
网友评论