“数据湖是一个集中式存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析– 从控制面板和可视化到大数据处理、实时分析和机器学习,以指导做出更好的决策。”
2. 数据湖内容
数据湖中包括来自于关系型数据库中的结构化数据(行和列)、半结构化数据(如CSV、日志、XML、JSON)、非结构化数据(如 email、文档、PDF 等)和 二进制数据(如图像、音频、视频)。
3. 数据湖的特点
统一的数据存储,存放原始的数据。
支持任意结构的数据存储,包括结构化、半结构化、非结构化。
支持多种计算分析,适用多种应用场景。
支持任意规模的数据存储与计算能力。
目标都是为了更好,更快的发现数据价值。
![](https://img.haomeiwen.com/i9149867/aad0b5566428e743.jpg)
数据中台、数据仓库和数据湖没有直接的关系;
数据中台、数据平台、数据仓库和数据湖在某个维度上为业务产生价值的形式有不同的侧重;
数据仓库是数据驱动业务的逻辑概念,用于支持管理决策分析,为业务提供服务的主要方式是报表;
数据中台是企业级的逻辑概念,体现企业数据向业务价值转化的能力,为业务提供服务的主要方式是数据 API;
数据湖是企业级的技术逻辑概念,体现企业级数据湖架构加速数据向业务价值转化的能力,为业务提供服务的主要方式是原始数据;
数据中台、数据湖距离业务更近,能够更快速的响应业务和应用开发需求,从而为业务提供速度更快的服务;
数据中台可以建立在数据仓库和数据平台之上,是加速企业从数据到业务价值的过程的中间层;
网友评论