美文网首页程序员
基于akka的分步式实时的分布式系统

基于akka的分步式实时的分布式系统

作者: 93张先生 | 来源:发表于2019-11-21 23:02 被阅读0次
S4

采用Mapreduce和Actor模型进行实时数据的计算;


S4.png
Storm

采用了拓扑结构,进行数据处理,定义处理流程,Strom用于集群之间的通信,故障的处理,还有维护集群的拓扑关心;数据源Spout,处理着bolt,据传输的tuple;拓扑的设计做到算法和框架的交互;


storm.png

数据传输tuple的载体;
传输的分发厕所及模式

Spark

它是一个基于共享内存的流处理引擎,核心是RDD高度受限的共享内存模型;将一个数据流分解成短小的批处理作业;


spark.png
三大节点

前端处理节点frontend 控制节点master 工作节点backend

四个模块

前端调度模块 调度模块 工作节点模块 资源管理模块

场景

实时计算 批次计算 响应式查询

设计
分布式设计

前端处理节点frontend 控制节点master 工作节点backend
流式计算设计
流式数据进入的数据管道
流程式设计
每一个工作节点的流程规划;

模块

前端节点处理模块:负责流程任务启动前的准备工作,以及工作节点数据流的输入。
通信模块:通过Akka支持的Actor模型的通信机制特点设计,其主要的通信包括有:前端
和调度模块的通信,调度模块和工作节点的通信,工作节点之间的通信。
节点控制模块:主要负责节点资源的控制管理与分发。
后台工作节点处理模块:负责后台实际任务的并发执行和对数据流的计算处理。

Akka容错

Actor工作节点有良好的监控,提供了默认监管策略;对子Actor进行处理,主要动作:
1.停止发生错误的子Actor,
2.重启发生错误的子Actor
3将错误升级到其父Actor处理。如果最终配置的子Actor是交给了根监管者Actor,此时根监管者会按照配置默认的策略处理。


实时数据和历史数据,mapreduce对于流式数据计算的缺点,mapreduce的优点
资源搜索
搜索引擎应对与静态数据,Dataflow流式计算框架,应用于变化频率比较大的动态数据;'
分布式系统设计
系统之间的通信,模块的划分,任务的调度,数据的备份,节点的挂了的处理;

相关文章

  • 基于akka的分步式实时的分布式系统

    S4 采用Mapreduce和Actor模型进行实时数据的计算; Storm 采用了拓扑结构,进行数据处理,定义处...

  • 蚂蚁金服大数据团队持续招人

    分布式计算系统研发 岗位描述: 基于金融级业务场景,设计和实现高效、实时、智能的分布式计算引擎; 分布式计算平台的...

  • 分布式调度与计算框架:OhMyScheduler

    产品简介 OhMyScheduler是基于Akka架构的一款分布式调度平台与分布式计算框架(对标 Alibaba ...

  • Elasticsearch入门教程

    Elasticsearch是著名的开源分布式搜索和数据处理平台,是一个基于Lucene的分布式、实时、全文搜索系统...

  • # Schedulerx正式登陆Ali-k8s应用目录

    简介 分布式任务调度 SchedulerX 是阿里巴巴基于 Akka 架构自研的的分布式任务调度平台,今天正式登陆...

  • Kafka

    定义 Kafka 是一个开源的分布式事件流平台。分布式的基于订阅发布模式的高吞吐高性能的实时消息队列系统。 功能 ...

  • 【Akka 精选】Akka 架构简介

    1.Akka 是什么 Akka 基于 Actor 模型,提供了一个在 JVM 上构建高并发、分布式和高容错应用程序...

  • Zipkin分布式任务追踪

    zipkin简介Zipkin 是一款开源的分布式实时数据追踪系统,由基于 Google Dapper 的论文设计而...

  • Akka系列(九):Akka分布式之Akka Remote

    Akka作为一个天生用于构建分布式应用的工具,当然提供了用于分布式组件即Akka Remote,那么我们就来看看如...

  • elasticsearch入门

    环境准备 elasticsearch是基于java语言构建的一套支持实时数据存储、字段检索、数据分析的分布式系统,...

网友评论

    本文标题:基于akka的分步式实时的分布式系统

    本文链接:https://www.haomeiwen.com/subject/gwbxwctx.html