美文网首页spark
Actor模型与Akka Actor体系基础总结

Actor模型与Akka Actor体系基础总结

作者: LittleMagic | 来源:发表于2020-09-01 23:17 被阅读0次

前言

最近用业余时间把Flink的RPC基础设施翻了个底朝天,又与之前分析过的Spark RPC机制做了一些对比,越发觉得Actor模型甚为精妙,值得简单记录一下,顺便也可作为日后解析Flink RPC机制的基础入门。

Actor模型

Actor模型由Hewitt、Bishop和Steiger在1973年通过论文《A Universal Modular Actor Formalism for Artificial Intelligence》提出,是一个创新的并发、分布式计算和编程模型。该模型的理念是“万物皆Actor”,即以Actor作为最基本的功能单元,且需要遵循以下几个基本规则。

  • 所有的计算都是在Actor中执行的。
  • Actor之间只能通过消息进行通信,且消息是不可变的。
  • Actor串行处理并响应消息。当一个Actor响应消息时,它可以进行下列操作:
    • 更改状态或行为;
    • 发送有限数量的消息给其他Actor;
    • 创建有限数量的子Actor。

Actor一词在此语境下仍然没有确定的中文译名,有人把它翻译为“角色”,大致贴切。

一个符合Actor模型的简单系统如下图所示。Actor本质上是状态、行为、邮箱三要素的集合。

  • 状态(State):Actor内部维护的变量及数据。每个Actor都单独维护自己的状态,与其他Actor隔离。
  • 行为(Behavior):Actor内部定义的一组计算逻辑(如函数),用于处理接收到的消息以及改变状态数据。
  • 邮箱(Mailbox):可以视为与接收方Actor关联的FIFO消息队列。由于Actor串行处理消息,发送方发来的来不及处理的消息会存入邮箱中,接收方再从邮箱逐条获取pending的消息。(当然,一个Actor既可以是发送方也可以是接收方)

可见,Actor模型另辟蹊径解决了并发环境中最棘手的问题,即共享数据的问题。在传统方案中,总需要通过同步机制(锁、信号量、原子性内存操作等)保证共享数据的一致性。但是同步操作的开销都比较大,往往会拖累高并发情况下的性能表现,并且容易引起死锁等其他问题。而Actor模型纯依赖消息传递,消息可以异步、非阻塞地处理,且状态是隔离的,不需要再考虑同步,简单而高效。

当然,Actor的结构也很简洁,单个Actor只需利用单线程执行,所以非常轻量级,1GB的内存可以容纳上百万的Actor实例。

Actor模型有众多成熟的实现,例如Erlang语言的并发机制就是完全基于它来实现的。接下来简要介绍Akka,它是目前最活跃的Actor模型开源项目之一,同时也是Flink RPC的基础。而Spark的旧版本同样使用Akka构建其RPC体系,后来的新版本虽然换用了Netty,但其设计理念仍然可以近似视为简化版的Akka。

Akka Actor体系

Akka官网首页的介绍如下。

高并发、分布式、弹性、消息驱动、基于JVM,这就是Akka的五个关键词,可见是深得Actor模型的精髓。

整个Akka生态分为很多库(也叫模块),如:Actor、Remoting、Cluster、Persistence、Streams、HTTP等。当然,Actor库是Akka核心中的核心,下面也仅简要总结与Actor库相关的基础知识。

Akka Actor是按照树形层次结构来组织的,其关系示意图如下所示。

Akka通过Actor系统(ActorSystem)来管理所有Actor,每个JVM实例内只有一个ActorSystem。当ActorSystem启动时,默认有3个守护(guardian)Actor:

  • /:根守护Actor,如同文件系统中的根,最先被创建,最后被销毁;
  • /system:系统守护Actor,Akka本身以及基于Akka构建的某些模块会在该路径下创建子Actor;
  • /user:用户守护Actor,我们在使用Akka过程中创建的Actor都会位于这个路径下。当调用ActorSystem.actorOf()方法时,会在/user下直接创建;而当调用某Actor的ActorContext.actorOf()方法时,会在该Actor下创建子Actor。

创建或者根据路径查找Actor,返回给用户的都是ActorRef,可以视为Actor实例的不可变、可序列化的句柄(引用),用户通过ActorRef来操作Actor,比如向其发送消息。

下图示出Actor从低级到高级的三层抽象,即Actor、ActorContext和ActorRef,以及它们对应的路径ActorPath。

可见,Actor的实际层级关系维护在上下文实例ActorContext中(ActorContext也包含有向当前Actor发送消息的那个ActorRef),而Actor的路径则维护在ActorRef中。这样就保证了从属于不同ActorSystem的Actor之间可以正常通信。

Actor的层次结构同时也是监督(supervision)机制的基础。当一个Actor失败时,它会通知其父Actor采取相应的动作(如直接恢复、重启、停止或者将失败信息继续向高层传递)。下图示出一个Akka Actor的完整生命周期。

可见,Akka还提供了一些生命周期的触发器方法(称为hook/钩子),用户可以通过重写这些方法来管理Actor的生命周期。特别需要注意的是,如果一个Actor停止,那么它的所有子Actor也会随着停止。

最后有一个问题,整个ActorSystem是如何被驱动的呢?答案是依靠一个中心化组件——Dispatcher(调度器/分发器),负责将Actor和与其关联的邮箱中的消息调度到线程中进行处理。它的原理并不难,形象的图示如下,就不多废话了。

The End

随便写了一些,还是趁早洗洗睡了。早睡早起有益健康。

民那晚安晚安。

相关文章

  • Actor模型与Akka Actor体系基础总结

    前言 最近用业余时间把Flink的RPC基础设施翻了个底朝天,又与之前分析过的Spark RPC机制做了一些对比,...

  • akka编程demo

    AKKA akka基于actor模型, 是一个用于构建可扩展的弹性的快速响应的应用程序的平台;actor模型:是一...

  • AKKA介绍(二)

    上一篇提到,Akka是Actor内单线程编程模型,不共享状态,使用消息在actor间通信。有效的提升actor内的...

  • actor模型

    概述 本文主要介绍actor模型的定义和使用场景,最后介绍一个使用akka的例子。 actor模型定义 在许多并发...

  • 为什么现代系统需要新的编程模型Akka

    Akka中最重要的便是actor模型。 几十年前,Carl Hewitt提出了actor模型,以作为在高性能网络下...

  • AKKA介绍(一)

    说起AKKA,不得不说AKKA实现的编程模型, Carl Hewittd在1973年正式提出的Actor模型。Ac...

  • 集成Akka

    Integrating with Akka Akka 使用Actor模型来提升抽象等级并且提供一个更好的平台去构建...

  • akka(1)

    akka 处理并发的基于actor

  • Akka系列(二):Akka中Actor系统

    Actor作为Akka中最核心的结构,其在Akka中的中的组织结构也至关重要,今天我们就来讲讲Akka中Actor...

  • 2018-03-23

    FreeSSL 使用Akka的Actor模型和领域驱动设计构建反应式系统 First Contact With ‘...

网友评论

    本文标题:Actor模型与Akka Actor体系基础总结

    本文链接:https://www.haomeiwen.com/subject/lvjgjktx.html