美文网首页
Storm 简介

Storm 简介

作者: DongGuangqing | 来源:发表于2016-11-27 16:02 被阅读110次

Storm是一个分布式的,可靠的,容错的数据流处理系统。它会把工作任务委托给不同类型的组件,每个组件负责处理一项简单特定的任务.

类似于Hadoop MR, 用户只需要按照规定的编程规范实现一个任务, 将任务Submit 到Storm, Storm 就可以将任务 7 * 24 小时的调度起来。

Storm 基本概念

Hadoop(MR job) Storm 描述
JobTracker Nimbus 负责资源分配和任务调度. 接收client 提交的Topology
TaskTracker Supervisior 接收Nimbus 分配的任务,启动和停止属于自己管理的worker 进程
Child Worker 运行具体处理组件逻辑的进程
Job Topology 由Spout 和 Bolt 构成, 处理的最小信息单位是一个Tuple
Mapper/Reducer Spout/Bolt Spout 是发出Tuple 的节点。 Bolt 可以随意订阅某个Spout 或 Bolt 发出的Tuple. Spout 和 Bolt 统称为Component

系统架构图

Components of a Storm cluster

角色之间的关系:

  1. Storm中节点状态信息保存在Zookeeper里面,Nimbus通过向Zookeeper写状态信息分配任务
  2. Supervisor通过从Zookeeper订阅相关数据领取任务,根据需要启动/ 关闭worker进程
  3. 同时Supervisor也定期发送心跳信息到Zookeeper,使得Nimbus可以掌握整个Storm集群的状态,从而可以进行任务调度或负载均衡。

相关文章

  • java大数据之storm

    一、Storm简介 1.1 Storm是什么 Apache Storm(http://storm.apache.o...

  • storm简介

    Storm:Apache Storm is a free and open source distributed ...

  • Storm 简介

    Storm是一个分布式的,可靠的,容错的数据流处理系统。它会把工作任务委托给不同类型的组件,每个组件负责处理一项简...

  • storm简介

    概述 Storm是Twitter开源的分布式实时大数据处理框架,最早开源于github,从0.9.1版本之后,归于...

  • Storm简介

    Storm是一个开源的分布式实时计算框架,可以简单、可靠的方式进行大数据流处理。通常用于实时分析,在线机器学习,次...

  • Apache Storm简介

    Apache Storm简介 转载: https://www.w3cschool.cn/apache_storm/...

  • storm

    Storm是什么Storm官方网站有段简介Storm是一个免费并开源的分布式实时计算系统。利用Storm可以很容易...

  • 【Storm的简介】

    storm分布式实时计算框架,在整个程序中,spout接收数据源并封装数据为tuple,然后将tuple发送给bo...

  • 1 Storm简介

    为什么选择Storm 因为公司业务需求实时性高。尝试了sparkstream,实时性没有storm高。所以就选择了...

  • Storm 概念简介

    刚刚甩了自己几个大嘴巴子,让自己好好静一静。不多说了,重新整理下Storm的简介。按下自己看啥都难受的心。 一、A...

网友评论

      本文标题:Storm 简介

      本文链接:https://www.haomeiwen.com/subject/qzknpttx.html