美文网首页
Storm基本概念

Storm基本概念

作者: Aiibai | 来源:发表于2019-04-03 09:52 被阅读0次
核心概念
  • Topology
  • Nimbus
  • Supervisor
  • Worker
  • Executor
  • Task
  • Spout
  • Bolt
  • Tuple
  • Stream
  • Stream Group


    image.png
Spout/Bolt 工作示意图
image.png
Stream 分组方式
  • Shuffle


    image.png
  • Fields


    image.png
  • All


    image.png
  • Global


    image.png
  • None
    暂时类似于 Shuffle

  • Direct
    这是一种特殊的分组方式,也就是产生数据的 Spout/Bolt 自己明确决定这个 TupleBolt 的那些 Task 所消费。如果使用这种分组凡是,需要使用 OutputCollectoremitDirect 方法来实现。

  • Local or shuffle
    如果目标 Bolt 中的一个或多个 Task 和当前产生数据的 Task 在同一个 Worker 进程中,那么就走内部的线程间通信,将 Tuple 直接发给在当前 Worker 进程中的目标 Task。否则,同 Shuffle 分组。

特性
  • 易用性
    开发人员只要定义自己的 Topology/Spout/Bolt 就可以,不用关心底层 RPC/Worker 之间冗余以及数据分流等操作。

  • 容错性
    Storm 的守护进程(Nimbus/Supervisor)是无状态的,状态是保存在 Zookeeper 中的,可以随意重启。

  • 扩展性
    通过配置并发数,实现线性扩展。

  • 完整性
    采用 Acker 机制,保证数据不丢失。使用事务机制,保证数据的准确性。

相关文章

  • storm笔记:storm基本概念

    本文主要介绍storm中的基本概念,从基础上了解strom的体系结构,便于后续编程过程中作为基础指导。主要的概念包...

  • 流式计算引擎 —— Storm

    一、Apache Storm 简介 1、基本概念   Storm 为分布式实时计算提供了一组通用原语,可被用于 “...

  • Storm 基本概念

    Topology一个topology 是 spouts 和 bolts 组成的图,通过stream groupin...

  • storm基本概念

    流式计算中,各个中间件产品对计算过程中的角色的抽象都不尽相同,实现方式也是千差万别。本文针对storm中间件在进行...

  • storm基本概念

    Storm 系统中包含以下几个基本概念:拓扑(Topologies)流(Streams)数据源(Spouts)数据...

  • Storm基本概念

    核心概念 Topology Nimbus Supervisor Worker Executor Task Spou...

  • Storm实战—基本概念

    本文同步于个人Github博客:https://github.com/johnnian/Blog/issues/2...

  • storm介绍

    1 基本概念 1.1 Nimbus Storm集群主节点,负责资源分配和任务调度。我们提交任务和截止任务都是在Ni...

  • hadoop系列之Storm入门

    并发编程网有更好的翻译 一.Javadoc javadoc 二.概念 下面介绍storm的一些基本概念和一些...

  • Storm入门

    Storm 基本介绍 什么是 Storm 首先Storm是Apache顶级项目之一Storm 官网 Storm 是...

网友评论

      本文标题:Storm基本概念

      本文链接:https://www.haomeiwen.com/subject/ncfabqtx.html