浅谈NodeJS多进程服务架构基本原理

2019-07-05 22:28 龙恩0707 阅读(6410) 评论(2) 收藏举报

阅读目录

一：nodejs进程进化及多进程架构原理
二：node中child_process模块实现多进程
三：父子进程间如何通信？
四：理解cluster集群

一：nodejs进程进化及多进程架构原理

NodeJS是基于chrome浏览器的V8引擎构建的，它是单线程单进程模式，nodeJS的单线程指js的引擎只有一个实列。且是在主线程执行的，这样的
优点是：可以减少线程间切换的开销。并且不用考虑锁和线程池的问题。

那么nodejs是单线程吗？如果严格的来讲，node存在着多种线程。比如包括：js引擎执行的线程、定时器线程、异步http线程等等这样的。

nodejs是在主线程执行的，其他的异步IO和事件驱动相关的线程是通过libuv来实现内部的线程池和线程调度的。libuv存在着一个Event Loop,通过 Event Loop（事件循环）来切换实现类似多线程的效果。Event Loop 是维持一个执行栈和一个事件队列，在执行栈中，如果有异步IO及定时器等函数的话，就把这些异步回调函数放入到事件队列中。等执行栈执行完成后，会从事件队列中，按照一定的顺序执行事件队列中的异步回调函数。
nodeJS中的单线程是指js引擎只在唯一的主线程上运行的。其他的异步操作是有独立的线程去执行。通过libuv的Event Loop实现了类似多线程的上下文切换以及线程池的调度。线程是最小的进程，因此node也是单进程的。

理解服务器进程进化

1. 同步单进程服务器

该服务器是最早出现的，执行模型是同步的。它的服务模式是一次只能处理一个请求。其他的请求需要按照顺序依次等待处理执行。也就是说如果当前的请求正在处理的话，那么其他的请求都处于阻塞等待的状态。因此这样的服务器处理速度是不好的。

2. 同步多进程服务器

为了解决上面同步单进程服务器无法处理并发的问题，我们就出来一个同步多进程服务器，它的功能是一个请求需要一个进程来服务，也就是说如果有100个请求就需要100个进程来进行服务。那么这样就会有很大进程的开销问题了。并且相同的状态在内存中会有多种，这样就会造成资源浪费。

3. 同步多进程多线程服务器

为了解决上面多进程中资源浪费的问题，我们就引入了多进程多线程服务器模式，从我们之前一个进程处理一个请求，现在我们改成为一个线程来处理一个请求，线程相对于进程来说开销会少很多，并且线程之间还可以共享数据。并且我们还可以使用线程池来减少创建和销毁线程的开销。
但是多线程也有缺点，比如多个请求需要使用多个线程来服务，但是每个线程需要一定的内存来存放自己的堆和栈的。这样就会导致占用太多的内存。第二就是：CPU核心只能处理一件事情，系统是通过将CPU切分为时间片的方法来让线程可以均匀地使用CPU的资源的。在系统切换线程的过程中也会进行线程上下文切换，当线程数量过多时进行上下文切换会非常耗费时间的。因此在很大的并发量下，多线程还是无法做到很好的伸缩性。Apache服务器就是这样架构的。

4. 单进程单线程基于事件驱动的服务器

为了解决上面的问题，我们出现了单进程单线程基于事件驱动的模式出现了，使用单线程的优点是：避免内存开销和上下文切换的开销。
所有的请求都在单线程上执行的，其他的异步IO和事件驱动相关的线程是通过libuv中的事件循环来实现内部的线程池和线程调度的。可伸缩性比之前的都好，但是影响事件驱动服务模型性能的只有CPU的计算能力，但是只能使用单核的CPU来处理事件驱动，但是我们的计算机目前都是多核的，我们要如何使用多核CPU呢？如果我们使用多核CPU的话，那么CPU的计算能力就会得到一个很大的提升。

5. NodeJS的实现多进程架构

如上第四点，面对单线程单进程对多核使用率不好的问题，因此我们使用多进程，每个进程使用一个cpu，因此我们就可以实现多核cpu的利用。
Node提供了child_process模块和cluster模块来实现多进程以及进程的管理。也就是我们常说的 Master-Worker模式。也就是说进程分为Master(主)进程和 worker（工作）进程。master进程负责调度或管理worker进程，那么worker进程负责具体的业务处理。在服务器层面来讲，worker可以是一个服务进程，负责出来自于客户端的请求，多个worker就相当于多个服务器，因此就构成了一个服务器群。master进程则负责创建worker，接收客户端的请求，然后分配到各个服务器上去处理，并且监控worker进程的运行状态及进行管理操作。

如下图所示：

回到顶部

二：node中child_process模块实现多进程

nodejs 是单进程的，因此无法使用多核cpu，node提供了child_process模块来实现子进程。从而会实现一个广义上的多进程模式，通过child_process模块，可以实现一个主进程，多个子进程模式，主进程叫做master进程，子进程叫做worker(工作)进程，在子进程中不仅可以调用其他node程序，我们还可以调用非node程序及shell命令等。执行完子进程后，我们可以以流或回调形式返回给主进程。

child_process提供了4个方法，用于创建子进程，这四个方法分别为 spawn, execFile, exec 和 fork. 所有的方法都是异步的。

该如上4个方法的区别是什么？

spawn: 子进程中执行的是非node程序，提供一组参数后，执行的结果以流的形式返回。
execFile: 子进程中执行的是非node程序, 提供一组参数后，执行的结果以回调的形式返回。
exec: 子进程执行的是非node程序，提供一串shell命令，执行结果后以回调的形式返回，它与 execFile不同的是，exec可以直接执行一串
shell命令。

fork: 子进程执行的是node程序，提供一组参数后，执行的结果以流的形式返回，它与spawn不同的是，fork生成的子进程只能执行node应用。

2.1 execFile 和 exec

该两个方法的相同点和不同点如下：

相同点：执行的都是非node应用，且执行的结果以回调函数的形式返回。
不同点：execFile执行的是一个应用，exec执行的是一段shell命令。

比如来说：echo是Unix系统的一个自带命令，我们可以直接在命令行中执行如下命令：

echo hello world

如下所示：

如上可以看到，我们在命令行中会打印 hello world. 因此这个我们可以使用 exec 来实现。

1）通过exec来实现：

exec执行shell命令代码如下：

const cp = require('child_process');
console.log(cp);
cp.exec('echo hello world', function(err, res) {
  console.log(res);
});

执行如下图所示：

如上我们可以看到，我们的 child_process模块有如下属性：

{ ChildProcess: [Function: ChildProcess],
  fork: [Function: fork],
  _forkChild: [Function: _forkChild],
  exec: [Function: exec],
  execFile: [Function: execFile],
  spawn: [Function: spawn],
  spawnSync: [Function: spawnSync],
  execFileSync: [Function: execFileSync],
  execSync: [Function: execSync] }

执行如上exec命令后，结果输出为 hello world.

2) 通过execFile实现

const cp = require('child_process');
cp.execFile('echo', ['hello', 'world'], function(err, res) {
  console.log(res);
});

如上结果也是为 "hello world".

2.2 spawn

spawn是用于执行非node应用的，并且是不能直接执行shell。spawn执行的结果是以流的形式输出的，通过流的方式可以节约内存的。

2.3 fork

在node中提供了fork方法，通过使用fork方法在单独的进程中执行node程序，通过使用fork新建worker进程，上下文都复制主进程。并且通过父子之间的通信，子进程接收父进程的信息，并执行子进程后结果信息返回给父进程。降低了大数据运行的压力。

现在我们来理解下使用fork()方法来创建子进程，fork()方法只需要指定要执行的javascript文件模块，即可创建Node的子进程。下面我们是简单的hello world的demo，master进程根据cpu的数量来创建出相应数量的worker进程，worker进程利用进程ID来标记。

|------ 项目
|  |--- master.js
|  |--- worker.js
|  |--- package.json
|  |--- node_modules

如上是我们的简单项目结构，其中 worker.js 代码如下：

console.log('Worker-' + process.pid + ': Hello world.');

master.js 代码如下：

const childProcess = require('child_process');
const cpuNum = require('os').cpus().length;

for (let i = 0; i < cpuNum; ++i) {
  childProcess.fork('./worker.js');
}

console.log('Master: xxxx');

然后我们进入项目中的根目录，执行 node master.js 命令即可看到打印信息如下：

如上图可以看到，我们的master创建了4个worker进程后输出 hello world信息。如上就是根据cpu的数量创建了4个工作进程。

回到顶部

三：父子进程间如何通信？

如上创建了4个worker进程后，现在我们需要考虑的是如何实现 master进程与worker进程通信的问题。

在NodeJS中父子进程之间通信可以通过 on('message') 和 send()方法来实现通信，on('message') 是监听message事件的。
当该进程收到其他进程发送的消息时候，便会触发message事件。send()方法则是用于向其他进程发送消息的。

具体如何做呢？

master进程中可以调用 child_process的fork()方法后会得到一个子进程的实列，通过该实列我们可以监听到来自子进程的消息或向子进程发送消息。而worker进程则通过process对象接口来监听父进程的消息或向父进程发送消息。现在我们把master.js 代码改成如下：

const childProcess = require('child_process');
const worker = childProcess.fork('./worker.js');

// 主进程向子进程发送消息
worker.send('Hello World');

// 监听子进程发送过来的消息
worker.on('message', (msg) => {
  console.log('Received message from worker:' + msg);
});

worker.js 代码如下：

// 接收主进程发来的消息
process.on('message', (msg) => {
  console.log('Received message from master:' + msg);
  // 子进程向主进程发送消息
  process.send('Hi master.');
});

我们继续在命令中执行 node master.js 命令后，看到如下信息被打印了

3.2 Master实现对Worker的请求进行分发

如上只是简单的父进程和子进程进行通信的demo实列，现在我们继续来看一个更复杂一点的demo。我们知道master进程最主要是创建子进程，及对子进程进行管理和分配，而子进程最主要做的事情是处理具体的请求及业务。

进程通信除了使用到上面的send()方法，发送一些普通对象以外，我们还可以发送句柄，什么是句柄呢，句柄是一种引用，可以用来标识资源。
比如通过句柄可以标识一个socket对象等。我们可以利用该句柄实现请求的分发。

现在我们通过master进程来创建一个TCP服务器来监听一些特定的端口，master进程会收到客户端的请求，我们会得到一个socket对象，通过这个socket对象就可以和客户端进行通信，从而我们可以处理客户端的请求。

比如如下demo实列，master创建TCP服务器并且监听8989端口，收到该请求后会将请求分发给worker处理，worker收到master发来的socket以后，通过socket对客户端的响应。

|------ 项目
|  |--- master.js
|  |--- worker.js
|  |--- tcp_client.js
|  |--- package.json
|  |--- node_modules

master.js 代码如下：

const childProcess = require('child_process');
const net = require('net');

// 获取cpu的数量
const cpuNum = require('os').cpus().length;

let workers = [];
let cur = 0;

for (let i = 0; i < cpuNum; ++i) {
  workers.push(childProcess.fork('./worker.js'));
  console.log('worker process-' + workers[i].pid);
}

// 创建TCP服务器
const tcpServer = net.createServer();

/*
 服务器收到请求后分发给工作进程去处理
*/
tcpServer.on('connection', (socket) => {
  workers[cur].send('socket', socket);
  cur = Number.parseInt((cur + 1) % cpuNum);
});

tcpServer.listen(8989, () => {
  console.log('Tcp Server: 127.0.0.8989');
});

worker.js 代码如下：

// 接收主进程发来的消息
process.on('message', (msg, socket) => {
  if (msg === 'socket' && socket) {
    // 利用setTimeout 模拟异步请求
    setTimeout(() => {
      socket.end('Request handled by worker-' + process.pid);
    },100);
  }
});

tcp.client.js 代码如下：

const net = require('net');
const maxConnectCount = 10;

for (let i = 0; i < maxConnectCount; ++i) {
  net.createConnection({
    port: 8989,
    host: '127.0.0.1'
  }).on('data', (d) => {
    console.log(d.toString());
  })
}

如上代码，tcp_client.js 负责创建10个本地请求，master.js 首先根据cpu的数量，创建多个worker进程，然后创建一个tcp服务器，使用connection来监听net中 createConnection 方法创建事件，当有事件来的时候，就使用worker子进程依次进行分发事件，最后我们通过worker.js 来使用 process中message事件对事件进行监听。如果收到消息的话，就打印消息出来，比如如下代码：

// 接收主进程发来的消息
process.on('message', (msg, socket) => {
  if (msg === 'socket' && socket) {
    // 利用setTimeout 模拟异步请求
    setTimeout(() => {
      socket.end('Request handled by worker-' + process.pid);
    },100);
  }
});

为了查看效果，我们可以在项目的根目录下运行命令 node master.js 启动服务器，然后我们打开另一个命令行，执行 node tcp_client.js 启动客户端，然后我们会看到我们的10个请求被分发到不同的服务器上进行处理，如下所示：

3.3 Worker监听同一个端口

我们之前已经实现了句柄可以发送普通对象及socket对象外，我们还可以通过句柄的方式发送一个server对象。我们在master进程中创建一个TCP服务器，将服务器对象直接发送给worker进程，让worker进程去监听端口并处理请求。因此master进程和worker进程就会监听了相同的端口了。当我们的客户端发送请求时候，我们的master进程和worker进程都可以监听到，我们知道我们的master进程它是不会处理具体的业务的。
因此需要使用worker进程去处理具体的事情了。因此请求都会被worker进程处理了。

那么在这种模式下，主进程和worker进程都可以监听到相同的端口，当网络请求到来的时候，会进行抢占式调度，只有一个worker进程会抢到链接然后进行服务，由于是抢占式调度，可以理解为谁先来谁先处理的模式，因此就不能保证每个worker进程都能负载均衡的问题。下面是一个demo如下：

master.js 代码如下：

const childProcess = require('child_process');
const net = require('net');

// 获取cpu的数量
const cpuNum = require('os').cpus().length;

let workers = [];
let cur = 0;

for (let i = 0; i < cpuNum; ++i) {
  workers.push(childProcess.fork('./worker.js'));
  console.log('worker process-' + workers[i].pid);
}

// 创建TCP服务器
const tcpServer = net.createServer();

tcpServer.listen(8989, () => {
  console.log('Tcp Server: 127.0.0.8989');
  // 监听端口后将服务器句柄发送给worker进程
  for (let i = 0; i < cpuNum; ++i) {
    workers[i].send('tcpServer', tcpServer);
  }
  // 关闭master线程的端口监听
  tcpServer.close();
});

worker.js 代码如下：

// 接收主进程发来的消息
process.on('message', (msg, tcpServer) => {
  if (msg === 'tcpServer' && tcpServer) {
    tcpServer.on('connection', (socket) => {
      setTimeout(() => {
        socket.end('Request handled by worker-' + process.pid);
      }, 100);
    })
  }
});

tcp_client.js 代码如下：

const net = require('net');
const maxConnectCount = 10;

for (let i = 0; i < maxConnectCount; ++i) {
  net.createConnection({
    port: 8989,
    host: '127.0.0.1'
  }).on('data', (d) => {
    console.log(d.toString());
  })
}

如上代码，我们运行 node master.js 代码后，运行结果如下所示：

然后我们进行运行 node tcp_client.js 命令后，运行结果如下所示：

如上我们可以看到进程id为 37660 调度的比较多。

3.4 实现进程重启

worker进程可能会因为其他的原因导致异常而退出，为了提高集群的稳定性，我们的master进程需要监听每个worker进程的存活状态，当我们的任何一个worker进程退出之后，master进程能监听到并且能够重启新的子进程。在我们的Node中，子进程退出时候，我们可以在父进程中使用exit事件就能监听到。如果触发了该事件，就可以断定为子进程已经退出了，因此我们就可以在该事件内部做出对应的处理，比如说重启子进程等操作。

下面是我们上面监听同一个端口模式下的代码demo，但是我们增加了进程重启的功能。进程重启时，我们的master进程需要重新传递tcpServer对象给新的worker进程。但是master进程是不能被关闭的。否则的话，句柄将为空，无法正常传递。

master.js 代码如下：

const childProcess = require('child_process');
const net = require('net');

// 获取cpu的数量
const cpuNum = require('os').cpus().length;

let workers = [];
let cur = 0;

for (let i = 0; i < cpuNum; ++i) {
  workers.push(childProcess.fork('./worker.js'));
  console.log('worker process-' + workers[i].pid);
}

// 创建TCP服务器
const tcpServer = net.createServer();

/*
 服务器收到请求后分发给工作进程去处理
*/
tcpServer.on('connection', (socket) => {
  workers[cur].send('socket', socket);
  cur = Number.parseInt((cur + 1) % cpuNum);
});

tcpServer.listen(8989, () => {
  console.log('Tcp Server: 127.0.0.8989');
  // 监听端口后将服务器句柄发送给worker进程
  for (let i = 0; i < cpuNum; ++i) {
    workers[i].send('tcpServer', tcpServer);
    // 监听工作进程退出事件
    workers[i].on('exit', ((i) => {
      return () => {
        console.log('worker-' + workers[i].pid + ' exited');
        workers[i] = childProcess.fork('./worker.js');
        console.log('Create worker-' + workers[i].pid);
        workers[i].send('tcpServer', tcpServer);
      }
    })(i));
  }
  // 不能关闭master线程的，否则的话，句柄将为空，无法正常传递。
  // tcpServer.close();
});

worker.js 代码如下：

// 接收主进程发来的消息
process.on('message', (msg, tcpServer) => {
  if (msg === 'tcpServer' && tcpServer) {
    tcpServer.on('connection', (socket) => {
      setTimeout(() => {
        socket.end('Request handled by worker-' + process.pid);
      }, 100);
    })
  }
});

tcp_client.js 代码如下：

const net = require('net');
const maxConnectCount = 10;

for (let i = 0; i < maxConnectCount; ++i) {
  net.createConnection({
    port: 8989,
    host: '127.0.0.1'
  }).on('data', (d) => {
    console.log(d.toString());
  })
}

当我们在命令中运行 node master.js 和 node tcp_client.js 执行后，如下图所示：

然后我们进入我们的电脑后台(我这边是mac电脑)，进入活动监视器页面，结束某一个进程，如下图所示：

结束完成后，我们再来看下我们的 node master.js 命令可以看到，先打印某某工作进程被退出了，然后某某工作进程被创建了，如下图所示
：

然后我们再到我们的活动监视器可以看到新的进程号被加进来了，如下图所示：

回到顶部

四：理解cluster集群

如上我们了解了使用 child_process实现node集群操作，现在我们来学习使用cluster模块实现多进程服务充分利用我们的cpu资源以外，还能够帮我们更好地进行进程管理。我们使用cluster模块来实现我们上面同样的功能，代码如下：

master.js 代码如下：

const cluster = require('cluster');
if (cluster.isMaster) {
  const cpuNum = require('os').cpus().length;
  for (let i = 0; i < cpuNum; ++i) {
    cluster.fork();
  }

  // 创建进程完成后输出信息
  cluster.on('online', (worker) => {
    console.log('Create worker-' + worker.process.pid);
  });

  // 监听子进程退出后重启事件
  cluster.on('exit', (worker, code, signal) => {
    console.log('[Master] worker ' + worker.process.pid + ' died with code:' + code + ', and' + signal);
    cluster.fork(); // 重启子进程
  });
} else {
  const net = require('net');
  net.createServer().on('connection', (socket) => {
    setTimeout(() => {
      socket.end('Request handled by worker-' + process.pid);
    }, 10)
  }).listen(8989)
}

如上代码，我们可以使用 cluster.isMaster 来判断是主进程还是子进程，如果是主进程的话，我们使用cluster创建了和cpu数量相同的worker进程，并且通过监听 cluster中的online事件来判断worker是否创建成功。并且使用了 cluster监听了 exit事件，当worker进程退出后，会触发master进程中cluster的online事件来判断worker是否创建成功。如下图我们在命令行中运行命令：

如下所示：

我们现在同样的道理，我们去活动监视器去吧 47575这个端口号结束掉。在看看我们的命令行如下所示：

从上图我们也可以看到 47575 进程结束掉，并且47898进程重启了。如上代码使用 cluster模块实现了child_process集群的操作。

有关更多的cluster中的API可以看这篇文章(http://wiki.jikexueyuan.com/project/nodejs/cluster.html)

我们在下一篇文章会深入学习使用cluster的应用场景demo。基本原理先到这里。

注：我也是在看资料学习的。

刷新页面返回顶部

龙恩0707 ..........

浅谈NodeJS多进程服务架构基本原理

About