美文网首页
《深入浅出Node.js》进程

《深入浅出Node.js》进程

作者: 我叫Aliya但是被占用了 | 来源:发表于2022-08-31 15:20 被阅读0次

Apache是采用多线程/多进程模型实现的;Node与Nginx均是基于事件驱动的。

根据CPU核心数计算要创建的线程/进程数是一个比较合理的方案:

const cpus = require('os').cpus()
console.log(cpus)
> [
    {
      model: 'Intel(R) Core(TM) i5-7360U CPU @ 2.30GHz',
      speed: 2300, // 当前速度
      times: { 
        user: 14576310,  // 用户进程,比如数据库、WEB服务
        nice: 0,         // 用户进程的CPU调度优先级[-20,19]
        sys: 9656410,    // 分配内存、IO操作、创建子进程等
        idle: 85775430,  // 空闲状态时间
        irq: 0           // CPU中断时间,压力均衡
      }
    },
    ...
  ]

Master-Worker模式,又称主从模式

主进程负责管理和调度子进程,子进程处理具体业务。

child_process可以生成子进程:

  • exec 创建一个shell环境(子进程)执行给定的命令
  • execFile 创建一个子进程执行 可执行文件(默认无shell环境)
  • spawn 创建一个子进程执行给定的命令,可与主进程大量通信
  • fork 是特殊的spawn ,专门用来生成NODE子进程,有独立的内存和V8实例(高能耗)
spawn('node', [index.js])
exec('node index.js', (err, stdout, stderr) => {})
execFile('xxx.exe', (err, stdout, stderr) => {})
fork('index.js')

js文件首行添加#! /usr/bin/env node可以直接执行(#! 脚本标识符,/usr/bin/env node 环境变量中去找node来执行)

多进程监听同一个端口 - 句柄传递 sendHandle

子进程们监听同一个端口会报EADDRINUSE异常(端口被占用),多进程监听同一个端口需要借助句柄传递实现。

句柄:用来标识资源的引用,内部包含指向对象的文件描述符。比如句柄可以用来标识一个服务器端socket对象、一个客户端socket对象、一个UDP套接字、一个管道等。

const cp = require('child_process');
const child1 = cp.fork('child.js');
const child2 = cp.fork('child.js');

const server = require('net').createServer();
server.listen(8888, () => {
  child1.send('tcp-handle', server);
  child2.send('tcp-handle', server);
  server.close();
  console.log('main server close');
});
// child.js
var http = require('http');
var server = http.createServer(function (req, res) {
  console.log('http res', process.pid);
  res.writeHead(200, { 'Content-Type': 'text/plain' });
  res.end('子进程 ' + process.pid + ' 回复\n');
});

process.on('message', (cmd, tcp) => {
  if (cmd === 'tcp-handle') {
    tcp.on('connection', (socket) => {
      console.log('connection on', process.pid);
      // 转为了 HTTP 服务
      server.emit('connection', socket); 
      // 不太理解,API 上也没有找到 Class: http.Server 的用法
    });
    // --- OR 纯 socket 服务 ---
    // tcp.on('connection', (socket) => {
    //   socket.end('子进程 ' + process.pid + ' 回复\n');
    // });
  }
});
$ curl 'http://127.0.0.1:8888'
子进程 23287 回复
$ curl 'http://127.0.0.1:8888'
子进程 23286 回复

-- 服务的日志
main server close    -- 主进程的服务已经关闭
connection on 23287  -- 子进程的tcp变量还是能监听到连接事件
http res 23287
connection on 23286
http res 23286

主进程的服务已经关闭,子进程的tcp变量还是能监听到连接事件,说明tcp并不是主进程的server的传递,传递的只是它的句柄(server资源的引用,包含文件描述符。这里可以理解为对端口/端口监听的引用?)

子进程拿到句柄后,根据类型(共4种),用句柄还原一个服务。所以在主进程的服务关闭后,子进程的tcp依然可以监听到端口上的事件。

多个应用监听相同端口时,文件描述符同一时间只能被某个进程所用。这种监听是抢占式的。

可以传递的句柄有:net.Server(TCP服务,即上头那个)net.Socket、net.Native(C++层面的TCP Socket或IPC管道)、dgram.Socket(UDP Socket)、dgram.Native

稳定性

  • 自动重启:一旦有未捕获的异常出现,子进程立即停止接收新的连接;当所有连接断开后,退出进程。主进程在侦听到子进程的exit后,立即启动新的进程服务,以此保证整个集群中总是有进程在为用户服务的。
  • 平滑重启:一旦有异常出现,主进程会创建新的工作进程来为用户服务,旧的进程一旦处理完已有连接就自动断开。
  • 限量重启:单位时间内规定只能重启多少次,超过限制就触发giveup事件,告知放弃重启工作进程这个重要事件。
  • 负载均衡:Node默认采用操作系统的抢占式策略,但是对于Node而言,需要分清的是它的繁忙是由CPU、I/O两个部分构成的,影响抢占的是CPU的繁忙
    • 轮叫调度:分发的策略是在N个工作进程中,每次选择第i = (i + 1) mod n个进程来发送连接。在cluster模块中以cluster.schedulingPolicy = cluster.SCHED_RRexport NODE_CLUSTER_SCHED_POLICY = rr
  • 状态共享:第三方存储(数据库)、主动通知(一个进程单独处理轮询通知各工作进程)

集群 Cluster

cluster模块就是child_process和net模块的组合应用。cluster启动时,会在内部启动TCP服务器,在cluster.fork()子进程时,将这个TCP服务器端socket的文件描述符发送给工作进程。如果进程是通过cluster.fork()复制出来的,那么它的环境变量里就存在NODE_UNIQUE_ID,如果工作进程中存在listen()侦听网络端口的调用,它将拿到该文件描述符,通过SO_REUSEADDR端口重用,从而实现多个子进程共享端口。

cluster模块,用以解决多核CPU的利用率问题,同时也提供了较完善的API,用以处理进程的健壮性问题。

主进程可用的方法和属性有:

  • setupPrimary(setting) 用于修改 fork 的默认行为

    import cluster from 'node:cluster';
    
    cluster.setupPrimary({  // NODE<16 使用 setupMaster
      exec: 'worker.js'
    });
    
    const cpus = require('os').cpus();
    cpus.forEach(() => { cluster.fork(); }); 
    
  • fork([env]) 产生一个新的工作进程

  • isPrimary 是否为主进程

  • isWorker === !isPrimary

  • worker 当前工作(子)进程对象的引用 {id, send: function }

事件有:

  • fork 复制通知
  • online 复制完成,子进程通知主进程上线
  • listening 子进程使用了文件描述符(共享了Socket监听)
  • disconnect 进程间通道断开后触发
  • exit 子进程退出时触发

注意:一旦主进程出现问题,所有子进程将会失去管理。在Node的进程管理之外,还需要用监听进程数量或监听日志的方式确保整个系统的稳定性,即使主进程出错退出,也能及时得到监控警报,使得开发者可以及时处理故障。

相关文章

  • Node.js 中的主从模式

    《深入浅出 Node.js》阅读随笔 由来Node.js 是以单进程单线程的方式运行在 V8 引擎中的,另外还有对...

  • child_process

    目录 进程 线程 Node.js的进程控制 Node.js的线程控制 进程 Process 场景 notepad....

  • 2021-04-07each和foreach

    深入浅出 Node.js(三):深入 Node.js 的模块机制 https://www.infoq.cn/art...

  • Node.js 有什么弊端

    《深入浅出 Node.js》阅读随笔 此文为《为什么选择 Node.js》姊妹篇,简单聊一下 Node.js 的缺...

  • Node.js

    process对象是一个全局变量,它提供当前 Node.js 进程的有关信息,以及控制当前 Node.js 进程。...

  • Node.js 有必要写测试用例吗?

    《深入浅出 Node.js》阅读随笔 先说结论:很有必要!不单是 Node.js,除非是作为体验或者 Demo 演...

  • 异步编程的困惑

    《深入浅出 Node.js》阅读随笔 众所周知,Node.js 虽然也有部分同步编程的方式,但主要还是以后异步编程...

  • 发布/订阅模式

    《深入浅出 Node.js》阅读随笔 Node.js 下使用发布/订阅的模式写程序,可以很优雅的解藕业务逻辑,尤其...

  • Node.js多进程

    Node.js多进程Node.js单线程模式运行的,使用事件处理并发。 exec() 使用子进程的执行命令,缓存子...

  • 读书笔记——深入浅出 node.js

    深入浅出 Node.js 阅读目的 node.js 工具链在 Web 前后端开发的作用越来越显著。我希望通过阅读本...

网友评论

      本文标题:《深入浅出Node.js》进程

      本文链接:https://www.haomeiwen.com/subject/wclsnrtx.html