Kafka允许topic的分区拥有若干副本,这个数量是可以配置的,你可以为每个topci配置副本的数量。Kafka...[作者空间]
简介: 广电运通 区块链 供应链金融 2018年5月,公司全资子公司设立广电运通区块链科技有限公司,以区块链技术等...[作者空间]
from+size 实现分页 "浅"分页可以理解为简单意义上的分页。它的原理很简单,就是查询前20条数据,然后截断...[作者空间]
Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法? 1、关闭缓存 swap;2、堆内存设...[作者空间]
Apache Spark是什么? Spark是一个用来实现快速而通用的集群计算的平台。扩展了广泛使用的MapRed...[作者空间]
一、概述 Storm Trident中的核心数据模型就是“Stream”,也就是说,Storm Triden...[作者空间]
Hadoop 是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop 的核心是...[作者空间]
hbase工作流程 HRegionServer负责打开region,并创建HRegion实例,它会为每个表的HCo...[作者空间]
Spark通过在数据处理过程中成本更低的洗牌(Shuffle)方式,将MapReduce提升到一个更高的层次。利用...[作者空间]
Nginx由内核和模块组成。 Nginx本身做的工作实际很少,当它接到一个HTTP请求时,它仅仅是通过查找配置文件...[作者空间]
Oozie是一个开源的工作流调度系统,它能够管理逻辑复杂的多个Hadoop作业,按照指定的顺序将其协同运行起来。 ...[作者空间]
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在...[作者空间]
源自谷歌的Bigtable论文,是一个建立在HDFS之上,面向列的针对结构化的数据可伸缩,高可靠,高性能分布式和面...[作者空间]
源自于谷歌的MapReduce论文,"Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来...[作者空间]
1.reduce(func):通过函数func先聚集各分区的数据集,再聚集分区之间的数据,func接收两个参数,返...[作者空间]
Spouts 你将在本章了解到 spout 作为拓扑入口和它的容错机制相关的最常见的设计策略。 可靠的消息 VS ...[作者空间]
注意:谷歌翻译 仅供参考学习用,建议学习看英文。版本Storm Version: 1.2.2 Storm现在有4...[作者空间]
Storm 的主要概念, 概念如下: Topologies(拓扑)Streams(流)SpoutsBoltsStr...[作者空间]
序列化 序列化 本文阐述了 Storm 0.6.0 以上版本的序列化机制。在低于 0.6.0 版本的 Storm ...[作者空间]
一个运行中的拓扑是由什么构成的: 工作进程(worker processes),执行器(executors)和任务...[作者空间]