《超级大数据》专题

专题列表页

Linux，hive,Hadoop，Storm，Spark，日志，任务等

Kafka主从同步及leader&follower
0
2020-09-07

Kafka允许topic的分区拥有若干副本，这个数量是可以配置的，你可以为每个topci配置副本的数量。Kafka...[作者空间]

数字货币相关板块单位简介
0
2020-08-23

简介：广电运通区块链供应链金融 2018年5月，公司全资子公司设立广电运通区块链科技有限公司，以区块链技术等...[作者空间]

Elasticsearch from+size 分页
0
2020-06-21

from+size 实现分页 "浅"分页可以理解为简单意义上的分页。它的原理很简单，就是查询前20条数据，然后截断...[作者空间]

elasticsearch 常见面试问题整理（1）
0
2020-06-20

Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？ 1、关闭缓存 swap;2、堆内存设...[作者空间]

大数据Apache Spark是什么？
0
2020-06-14

Apache Spark是什么？ Spark是一个用来实现快速而通用的集群计算的平台。扩展了广泛使用的MapRed...[作者空间]

Storm Trident介绍
1
2019-06-15

一、概述 Storm Trident中的核心数据模型就是“Stream”，也就是说，Storm Triden...[作者空间]

大数据生态圈
3
2019-06-13

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop 的核心是...[作者空间]

Hbase物理模型架构体系
2
2019-06-12

hbase工作流程 HRegionServer负责打开region，并创建HRegion实例，它会为每个表的HCo...[作者空间]

Spark特性
4
2019-06-09

Spark通过在数据处理过程中成本更低的洗牌（Shuffle）方式，将MapReduce提升到一个更高的层次。利用...[作者空间]

Nginx工作原理
2
2019-06-02

Nginx由内核和模块组成。 Nginx本身做的工作实际很少，当它接到一个HTTP请求时，它仅仅是通过查找配置文件...[作者空间]

Oozie的作用
1
2019-05-31

Oozie是一个开源的工作流调度系统，它能够管理逻辑复杂的多个Hadoop作业，按照指定的顺序将其协同运行起来。 ...[作者空间]

大数据入门（三）
0
2019-05-30

Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在...[作者空间]

大数据入门（二）
0
2019-05-30

源自谷歌的Bigtable论文，是一个建立在HDFS之上，面向列的针对结构化的数据可伸缩，高可靠，高性能分布式和面...[作者空间]

大数据入门（一）
9
2019-05-30

源自于谷歌的MapReduce论文，"Hadoop Map/Reduce是一个使用简易的软件框架，基于它写出来...[作者空间]

spark 函数
2
2019-05-29

1.reduce(func):通过函数func先聚集各分区的数据集，再聚集分区之间的数据，func接收两个参数，返...[作者空间]

Storm Spouts
2
2019-05-28

Spouts 你将在本章了解到 spout 作为拓扑入口和它的容错机制相关的最常见的设计策略。可靠的消息 VS ...[作者空间]

storm（基础二）Scheduler（调度器）
1
2019-04-26

注意：谷歌翻译仅供参考学习用，建议学习看英文。版本Storm Version: 1.2.2 Storm现在有4...[作者空间]

storm（基础一）概念
3
2019-04-25

Storm 的主要概念, 概念如下： Topologies（拓扑）Streams（流）SpoutsBoltsStr...[作者空间]

storm（中级一）的Serialization（序列化）
2
2019-04-25

序列化序列化本文阐述了 Storm 0.6.0 以上版本的序列化机制。在低于 0.6.0 版本的 Storm ...[作者空间]

深入了解 Storm 拓扑的基本知识概念
1
2019-04-24

一个运行中的拓扑是由什么构成的：工作进程（worker processes），执行器（executors）和任务...[作者空间]

栏目导航

延伸阅读

栏目导航

爱情美文推荐

热点爱情美文

最新爱情美文