前言 最近公司启动了一个规划2年的项目,是做一个数据平台。主要包括数据同步(实时/离线)、mapping(实时/离...[作者空间]
何为数仓DW Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是...[作者空间]
一、Lucene简介 1.1 Lucene是什么? Lucene是Apache基金会jakarta项目组的一个子项...[作者空间]
Flink作为流批一体的大数据计算引擎,在大数据生态圈当中得到越来越多的重视,流计算需求越来越多,实时性要求越来越...[作者空间]
1.redis持久化的意义----redis故障恢复在实际的生产环境中,很可能会遇到redis突然挂掉的情况,比如...[作者空间]
Overview 为了使 Flink 应用程序能够可靠地大规模运行,必须满足两个条件: 应用程序需要能够可靠地获取...[作者空间]
原文地址[https://juejin.cn/post/6844903774402641927]附视频讲解:htt...[作者空间]
环境 CDH-6.3.2Flink-1.12.2最后会补充说明Flink-1.13.1的使用方法 准备 在flin...[作者空间]
1.高可用概述 高可⽤性(High Availability),指系统无间断地执⾏其功能的能力,代表系统的可⽤性程...[作者空间]
笔者根据自己理解总结,如有谬误,恳请指正 事实表 事实表,即为事实数据表的简称。主要特点是含有大量的数据,并且这些...[作者空间]
其他相关专题 JAVA IO专题一:java InputStream和OutputStream读取文件并通过soc...[作者空间]
相关java IO专题 JAVA IO专题一:java InputStream和OutputStream读取文件并...[作者空间]
HDFS作为Hadoop的分布式文件系统,其在大数据平台当中的地位是显而易见的。面对越来越大规模的数据存储任务,H...[作者空间]
Distributed log processing is enabled by default since HB...[作者空间]
前言 1 Flink基础(适合初入职场) 简单介绍一下 Flink Flink相比传统的Spark Streami...[作者空间]
作为分布式文件系统的HDFS,在Hadoop技术生态当中,始终是不容忽视的。HDFS的稳定性和可靠性,对于后续的数...[作者空间]
在HBase写入的过程中,要从client和server端两部分来看。在client端,会将写入的数据添加到本地缓...[作者空间]
公众号:大数据技术派 分层建设理论 简单点儿,直接ODS+DM就可以了,将所有数据同步过来,然后直接开发些应用层的...[作者空间]
维表是数仓中的一个概念,维表中的维度属性是观察数据的角度,在建设离线数仓的时候,通常是将维表与事实表进行关联构建星...[作者空间]
HDFS写数据流程,如图4-1所示。 1)客户端通过Distributed FileSystem模块向NameNo...[作者空间]