美文网首页
strom shuffle的问题

strom shuffle的问题

作者: NazgulSun | 来源:发表于2023-06-01 13:16 被阅读0次

问题场景

topo里面有多个bolt 任务,配了3个work,但是不管流量怎么变,就是只到一个work上,比如machineA. 3个wokr 分布在不同机器。
顺着整个topo 网上看,上一个任务,基本也是再A上跑,也就是dependency的任务都是再A上,没有下发到其他机器。

shuffle的问题

默认使用了,shufflegrouping的策略。文档里是说保重均匀分发,但是也有人遇到了相同的情况,就是倾向于先local 然后再随机shufflegroup。
也就是说,我下发数据到下游任务的时候,就看下游任务再我本机上是否有work,如果有,就都给他了。local 的优先级,大于均衡的优先级,所有造成了任务都给到A。

解决的方法

因为我们上游只设置了一个spout, 所以就只往一个机器上发。我们增大spout的个数,然后能部分解决。
做保险的做法,修改 shuffle策略,强制往不同机器发。

其他优化的参数

https://blog.csdn.net/it_freshman/article/details/113111268
比如topology.buffer.spout.pending,这个值,对机器性能有较大的影响。

相关文章

  • Storm部署与运行

    环境配置 Strom 下载 首先从官网下载Strom压缩包,这里以最新的Strom1.2.2作为演示。 解压到/u...

  • 流式计算的代表:Storm,Flink,Spark Stream

    流式计算的代表:Storm,Flink,Spark Streaming Strom 1.Strom的主从架构 ni...

  • Spark shuffle-write 和 shuffle-re

    主要想回答两个问题: map端(shuffle-write)如何对数据进行分片? reduce端(shuffle-...

  • 常见面试题

    一、mr的shuffle流程 说到mr的Shuffle,那么首先要明确shuffle属于哪个阶段。shuffle就...

  • 【Spark】Spark 存储原理--shuffle 过程

    本篇结构: Spark Shuffle 的发展 Spark Shuffle 中数据结构 Spark Shuffle...

  • Strom自学

    简介:strom能实现高频数据和大规模数据的实时处理 Strom和hadoop的区别: H:大规模的离线批处理;...

  • [spark] Shuffle Read解析 (Sort Bas

    Shuffle Write 请看 Shuffle Write解析。 本文将讲解shuffle Reduce部分,s...

  • strom原理

    http://storm.apache.org/releases/current/Understanding-th...

  • Strom安装

    安装版本:apache-storm-1.1.0.tar 1.准备工作(1)安装jdk1.8(2)安装zookeep...

  • The wolven strom

    因为《巫师三》这个游戏我喜欢上了The wolven strom这首充满感情,旋律优美的歌曲。推荐大家去搜来听听...

网友评论

      本文标题:strom shuffle的问题

      本文链接:https://www.haomeiwen.com/subject/qjbuedtx.html