对Flink的内部运行机制的理解,是整个框架的学习当中,是非常关键的一部分,其中Flink基于内存的数据存储和管理...[作者空间]
Flink作为流计算代表性的框架,近几年来的热度越来越高,而Flink流处理,核心思想是有状态的流计算,这就要求在...[作者空间]
基于分布式构建的大数据系统平台,容错性是一个重要的指标,尤其是在数据规模越来越大,数据格式也越来越复杂的背景下,容...[作者空间]
在大数据技术生态当中,分布式集群是解决大规模数据处理任务的主要解决思路,主流的几代框架,如Hadoop、Spark...[作者空间]
在大数据技术生态当中,消息队列,主要是针对实时消息流的处理,而实时消息流场景下,常常需要解决的一个问题,就是数据一...[作者空间]
实时消息流处理,是当前大数据计算领域面临的常见场景需求之一,而消息队列对实时消息流的处理,常常会遇到的问题之一,就...[作者空间]
消息队列是越来越多的实时计算场景下得到应用,而在实时计算场景下,重复消息的情况也是非常常见的,针对于重复消息,如何...[作者空间]
消息队列在大数据技术生态当中,一直都是值得重视的存在,开源的消息队列产品,市面上也不少,基于不同的场景,需要去匹配...[作者空间]
众所周知,作为Hive列式存储提供了高性能的存储方式,面对大规模的数据存储任务,也能高效快速地完成,这也是Hive...[作者空间]
Hive作为数仓工具而言,在Hadoop生态的地位是值得肯定的。而Hive在数据查询管理上,涉及到的细节也很多。今...[作者空间]
Hbase作为分布式数据库而言,一个典型的特征,就是易扩展性,能够支持足够大的集群规模,完成相应的数据存储任务。但...[作者空间]
Hbase作为Hadoop原生数据库,在数据存储上与底层的HDFS是互相配合的重要组件。Hbase也提供相应的AP...[作者空间]
Kafka 作为大数据技术生态当中必学的一个组件,尤其是作为消息队列而言,也是主流选择比较多的一种方案。学习kak...[作者空间]
对于消息队列组件,在大数据技术生态当中,是有着多种解决方案的,在实际的开发任务当中,往往需要根据具体的需求,去规划...[作者空间]
消息队列的组件,在大数据技术生态当中占据重要的地位,而归根结底,之所以重要,那是因为有需求,能够满足具体场景下的消...[作者空间]
在大数据技术生态当中,消息中间件的解决方案很多,基于不同的应用场景,对于消息传递也有不同的需求,这其中,消息队列算...[作者空间]
解决大规模的分布式数据存储问题,离不开分布式数据库,目前市场上开源的分布式数据库产品也不少,作为大数据开发者,对于...[作者空间]
在大数据技术生态,对于大规模的数据存储问题,主要依赖于分布式去解决。而分布式环境下的数据存储,就不免需要去解决一致...[作者空间]
Hadoop作为分布式基础架构,有分布式文件系统HDFS进行存储划分,而落实到最终的存储上,还需要分布式数据库的配...[作者空间]
作为Hadoop技术生态当中的分布式文件系统,HDFS在底层存储上提供了稳固的支持,从数据引入到数据落盘,离不开H...[作者空间]