美文网首页erlang
erlang 网络加载(boot_server & erl_pr

erlang 网络加载(boot_server & erl_pr

作者: Alking | 来源:发表于2020-01-09 23:29 被阅读0次

1. 使用说明

官方说法:

This server is used to assist diskless Erlang nodes that fetch all Erlang code from another machine.

简单的说就是帮助那些磁盘较小的机器来从网络启动erlang节点

一般配合erl_prim_loader使用,boot_server针对其他的slave来说,就是本地erl_prim_loader代理

2. 使用方法

2.1 在master上开启boot_server服务
erl -setcookie ${COOKIE} -name ${NAME}@${IP} -kernel start_boot_server true -kernel boot_server_slaves = ${SLAVE_HOSTS} .....

注意:
-kernel start_boot_server true 如果使用app.config文件,请在app.config文件配置,这个环境变量是必须的,否则不会启动boot_server

SLAVE_HOSTS:其实是可以接入的IP白名单

如果需要动态添加SLAVE_HOST,请调用 erl_boot_server:add_slave/1  方法

example:
erl -setcookie cookie -name boot_server@192.168.36.84 -kernel start_boot_server true -kernel boot_server_slaves = '[{192,168,36,84}]'

2.2 在slave机器上开启erlang节点
erl -setcookie ${COOKIE} -name ${NAME}@${IP} -hosts ${HOST}   -loader inet ......
注意:
-loader inet 是必须的,指定从网络来载入模块和文件
-hosts ${HOST} HOST 是 master  节点的IP, 但是要保证 ${IP}  在2.1中的白名单中

example:

erl -setcookie cookie -name slave@192.168.36.84 -hosts "192.168.36.84"   -loader inet

节点开启之后就可以正常使用boot_server上的模块了

3. 代码分析

3.1 boot_server
erl_boot_server.erl

init(Slaves) ->
    % 4368 UDP端口打开
    {ok, U} = gen_udp:open(?EBOOT_PORT, []),
    {ok, L} = gen_tcp:listen(0, [binary,{packet,4}]),
    {ok, Port} = inet:port(L),
    {ok, UPort} = inet:port(U),
    Ref = make_ref(),
    % Pid 执行 boot_loop 函数
    Pid = proc_lib:spawn_link(?MODULE, boot_init, [Ref]),
    ok = gen_tcp:controlling_process(L, Pid),
    Pid ! {Ref, L},
    %% We trap exit inorder to restart boot_init and udp_port 
    process_flag(trap_exit, true),
    {ok, #state{priority = 0,
        version = erlang:system_info(version),
        udp_sock = U,
        udp_port = UPort,
        listen_sock = L,
        listen_port = Port,
        slaves = ordsets:from_list(Slaves),
        bootp = Pid}}.

#主要的请求
boot_loop(Socket, PS) ->
    receive
    {tcp, Socket, Data} ->
        PS2 = handle_command(Socket, PS, Data),
        boot_loop(Socket, PS2);
    {tcp_closed, Socket} ->
        true
    end.

handle_command(S, PS, Msg) ->
    case catch binary_to_term(Msg) of
    {get,File} ->
       ......
    {'EXIT',Reason} ->
        send_result(S, {error,Reason}),
        PS;
    _Other ->
        send_result(S, {error,unknown_command}),
        PS
    end.

## 第一次收 erl_priv_loader的请求
handle_info({udp, U, IP, Port, Data}, S0) ->
    Token = ?EBOOT_REQUEST ++ S0#state.version,
    Valid = member_address(IP, ordsets:to_list(S0#state.slaves)),
    % 判断是否在白名单中(slaves)
    case {Valid, Data,Token} of
    {true,Token,Token} ->
         % 将本地打开的tcp的端口返回给slave,方便下次请求的时候直接通过tcp请求
        case gen_udp:send(U,IP,Port,[?EBOOT_REPLY,S0#state.priority,
                                         int16(S0#state.listen_port),
                                         S0#state.version])
           .....
        {noreply,S0};
    {false,_,_} ->
       ......
    {true,_,_} ->
        .....
    end;

3.2 erl_prim_loader.erl
% erl_prim_loader.erl

% 发现master 的主要逻辑
find_master(...) -> .....

% 最后得到连上master 的socket 放在state中
find_master(U, Retry, AddrL, ReqDelay, SReSleep, Ignore, Tries, LReSleep) ->
    case find_loop(U, Retry, AddrL, ReqDelay, SReSleep, Ignore, Tries, LReSleep) of
        [] ->   
            find_master(U, Retry, AddrL, ReqDelay, SReSleep, Ignore, Tries, LReSleep);
        Servers ->
             % [{Priotity,IP,Port}..]
            ?dbg(servers, Servers),
            case connect_master(Servers) of
                {ok, Socket} -> 
                    .....
                    {ok, Socket};
                 .....
            end
    end..

send_all(U, [IP | AL], Cmd) ->
    ?dbg(sendto, {U, IP, ?EBOOT_PORT, Cmd}),
    % 向 MasterIP:4368  UDP发送一个请求
    prim_inet:sendto(U, IP, ?EBOOT_PORT, Cmd),
    send_all(U, AL, Cmd);
send_all(_U, [], _) -> ok.

% 主循环,处理例如get_file等请求
loop(St0, Parent, Paths) ->
  receive
    {Pid, {set_path, NewPaths}} when is_pid(Pid) ->
      Pid ! {self(), ok},
      loop(St0, Parent, to_strs(NewPaths));
    {Pid, Req} when is_pid(Pid) ->
      case handle_request(Req, Paths, St0) of
        ignore ->
          ok;
        {Resp, #state{} = St1} ->
          Pid ! {self(), Resp},
          loop(St1, Parent, Paths);
        {_, State2, _} ->
          exit({bad_state, Req, State2})
      end;
   ......
  after St0#state.timeout ->
    St1 = handle_timeout(St0, Parent),
    loop(St1, Parent, Paths)
  end.

% 处理请求的入口
handle_request(Req, Paths, St0) ->
  case Req of
    {get_path, _} ->
      {{ok, Paths}, St0};
    {get_file, File} ->
      handle_get_file(St0, Paths, File);
   .....
    _ ->
      ignore
  end.

对此整个链路分析完成

4. 优缺点分析

4.1 优点

  • 可以从远程加载模块和文件
  • 为了那些硬盘紧缺的机器提供了一种加载方式
  • 为运维提供一种erlang shell的运维思路

4.2 缺点

  • master 节点和slave 节点不能有防火墙,当然这个在内网中很容易实现(为什么不通过cookie?)
  • master,slave使用的erts版本要保持一致

5. 总结

本文简要的讲述了如何从远程加载模块文件,分析了实现方式以及优缺点。
虽然在生产环境中,我们从来没有尝试过,但是还是推荐一下。

6. 参考文献

  1. https://github.com/erlang/otp/blob/master/lib/kernel/src/erl_boot_server.erl
  2. https://github.com/erlang/otp/blob/master/erts/preloaded/src/erl_prim_loader.erl

相关文章

网友评论

    本文标题:erlang 网络加载(boot_server & erl_pr

    本文链接:https://www.haomeiwen.com/subject/wlguactx.html