nodejs中的并发编程

从sleep的实现说起

在nodejs中，如果要实现sleep的功能主要是通过“setTimeout + promise”实现，也可以通过“循环空转”来解决。前者是利用定时器实现任务的延迟执行，并通过promise链管理任务间的时序与依赖，本质上nodejs的执行线程并没有真正的sleep，事件循环以及v8仍在运行，是仅仅表现在业务逻辑上sleep；而后者的实现则无疑实在浪费CPU性能，有点类似自旋锁，不符合大多数场景。

若要实现引擎层面（运行时）的sleep，事情在ECMAScript Latest Draft (ECMA-262)出现之后开始有了转机。ECMA262规定了 Atomics.wait，它会将调用该方法的代理（引擎）陷入等待队列并让其sleep，直到被notify或者超时。该规范在8.10.0以上版本的nodejs上被实现。

事实上，Atomics.wait 的出现主要解决浏览器或nodejs的worker之间数据同步的问题。浏览器上的web-worker、正式被nodejs@12纳入的worker-threads模块，这些都是ECMAScript多线程模型的具体实现。既然出现多线程那么线程间的同步也就不可避免的被提到，在前端以及nodejs范围内可以使用Atomics.wait和notify来解决。

说的有些跑题，回到本节，如何实现运行时的sleep呢？很简单，利用Atomics.wait的等待超时机制：

let sharedBuf = new SharedArrayBuffer(4);
let sharedArr = new Int32Array(sharedBuf);
// 睡眠n秒
let sleep = function(n){
	Atomics.wait(sharedArr, 0, 0, n * 1000);
}

此处的sleep并不是异步方法，它会阻塞执行线程直到超时，因此需要根据业务场景来使用该sleep模型。
关于Atomics.wait的具体使用方法，下文会着重讲解。

多线程同步

虽然nodejs多线程使用场景不是很多，但是一旦涉及到多线程，那么线程间同步就必不可少，否则无法解决临界区的问题。不过nodejs的work_threads对线程的创建不同于c或者java，它使用libuv的API创建线程 “uv_thread_create”，但是在此之前需要初始化一些设施如MessagePort、v8实例设置等，因此创建一个thread并不是一个轻量级的操作，需要结合场景酌情创建适量的threads。

回到正题，多线程间的同步一般需要依赖锁，而锁的实现需要依赖于全局变量。在nodejs的work_threads实现中，主线程无法设置全局变量，因此可以通过Atomics实现。正如上例中所示，Atomics.wait依赖 SharedArrayBuffer，这是共享内存的ArrayBuffer，threads之间可通过它共享数据，可真正操作ArrayBuffer时并不直接使用该对象，而是TypeArray。如Atomics.wait，第一个参数必须是Int32Array对象，而该对象指向的缓冲区为SharedArrayBuffer。当线程A因为Atomics.wait而阻塞后，可通过其它线程B调用Atomics.notify进行唤醒从而让线程A的v8继续执行。

let { Worker, isMainThread, parentPort, workerData } = require('worker_threads');
var sab = new SharedArrayBuffer(1024);
var int32 = new Int32Array(sab);
if (isMainThread) {
	const  worker  =  new Worker(__filename, {
		workerData: sab
	});
	worker.on('message', (d) => {
		console.log('parent receive message:', d);
	});
	worker.on('error', (e) => {
		console.error('parent receive error', e);
	});
	worker.on('exit', (code) => {
		if (code !==  0)
			console.error(new  Error(`工作线程使用退出码 ${code} 停止`));
	});

	Atomics.wait(int32, 0, 0); // A
	console.log(int32[0]); // C: 123
} else {
	let buf = workerData;
	let arrs = new Int32Array(buf);
	Atomics.store(arrs, 0, 123); 
	Atomics.notify(arrs, 0); // B
}

上例中，主线程创建thread后，在A处进行阻塞；在新线程中，通过原子操作Atomics.store修改SharedArrayBuffer的第一项为123后，于B处唤醒阻塞在SharedArrayBuffer第一项的其它线程；此时主线程被唤醒，执行console.log(int32[0])，输出被新线程修改后的SharedArrayBuffer第一项数据123。

锁

分析一个公平、排它、不可重入锁的实现，它使用Atomics.wait/notify/compareExchange完成线程的同步。

main-thread.js

let  Lock  =  require('./lock').Lock;
let { Worker } =  require('worker_threads');
const  sharedBuffer  =  new SharedArrayBuffer(1 * Int32Array.BYTES_PER_ELEMENT);
const  sharedArray  =  new  Int32Array(sharedBuffer);
let worker = new Worker('./worker-lock.js', {
	workerData:  sharedBuffer
});
Lock.initialize(sharedArray, 0);
const  lock  =  new  Lock(sharedArray, 0);
// 获取锁
lock.lock(); 

// 3s后释放锁
setTimeout(() => {
	lock.unlock(); // (B)
}, 3000)

worker-thread.js

let  Lock  =  require('./lock').Lock;
let { parentPort, workerData } =  require('worker_threads');
const  sharedArray  =  new  Int32Array(workerData);
const  lock  =  new  Lock(sharedArray, 0);

console.log('Waiting for lock...'); // (A)
// 获取锁
lock.lock(); // (B) blocks!
console.log('Unlocked'); // (C)

主线程初始化互斥锁，同时创建线程，主线程获取锁后三秒钟释放；
worker线程尝试获取锁，此时锁已被主线程获取，因此worker线程在此阻塞，等待3s后主线程释放锁被唤醒，继续执行输出。

lock.js

const  UNLOCKED  =  0;
const  LOCKED_NO_WAITERS  =  1;
const  LOCKED_POSSIBLE_WAITERS  =  2;
const  NUMINTS  =  1;

class  Lock {
	// 'iab' must be a Int32Array mapping shared memory.
	// 'ibase' must be a valid index in iab, the first of NUMINTS reserved for the lock.
	constructor(iab, ibase) {
		if (!(iab  instanceof  Int32Array  &&  ibase|0  ===  ibase  &&  ibase  >=  0  &&  ibase+NUMINTS  <=  iab.length)) {
			throw  new  Error(`Bad arguments to Lock constructor: ${iab}  ${ibase}`);
		}
		this.iab  =  iab;
		this.ibase  =  ibase;
	}
	static  initialize(iab, ibase) {
		if (!(iab  instanceof  Int32Array  &&  ibase|0  ===  ibase  &&  ibase  >=  0  &&  ibase+NUMINTS  <=  iab.length)) {
			throw  new  Error(`Bad arguments to Lock constructor: ${iab}  ${ibase}`);
		}
		Atomics.store(iab, ibase, UNLOCKED);
		return  ibase;
	}
	// Acquire the lock, or block until we can. Locking is not recursive:
	lock() {
		const  iab  =  this.iab;
		const  stateIdx  =  this.ibase;
		var  c;
		if ((c  =  Atomics.compareExchange(iab, stateIdx, UNLOCKED, LOCKED_NO_WAITERS)) !==  UNLOCKED) { // A
			do {
				if (c  ===  LOCKED_POSSIBLE_WAITERS
				||  Atomics.compareExchange(iab, stateIdx, LOCKED_NO_WAITERS, LOCKED_POSSIBLE_WAITERS) !==  UNLOCKED) {
					Atomics.wait(iab, stateIdx, LOCKED_POSSIBLE_WAITERS, Number.POSITIVE_INFINITY);
				}
			} while ((c  =  Atomics.compareExchange(iab, stateIdx, UNLOCKED, LOCKED_POSSIBLE_WAITERS)) !==  UNLOCKED); // B
		}
	}
	tryLock() {
		const  iab  =  this.iab;
		const  stateIdx  =  this.ibase;
		return  Atomics.compareExchange(iab, stateIdx, UNLOCKED, LOCKED_NO_WAITERS) ===  UNLOCKED;
	}
	unlock() {
		const  iab  =  this.iab;
		const  stateIdx  =  this.ibase;
		var  v0  =  Atomics.sub(iab, stateIdx, 1);
		// Wake up a waiter if there are any
		if (v0  !==  LOCKED_NO_WAITERS) {
			Atomics.store(iab, stateIdx, UNLOCKED);
			Atomics.notify(iab, stateIdx, 1);
		}
	}
	toString() {
		return  "Lock:{ibase:"  +  this.ibase  +"}";
	}
}
exports.Lock  =  Lock;

当线程A尝试获取锁成功时，A处判断语句为false，因此由compareExchange设置状态为LOCKED_NO_WAITERS，直接执行其后续逻辑；
若线程B此时执行lock获取锁时，A处判断为true，进入do while循环体，在wait处sleep；
线程A通过unlock释放锁，会将锁状态置为UNLOCKED，同时唤醒阻塞的进程B；
线程B执行循环判断语句B，此时为false，跳出循环执行B的逻辑。

当然，也可通过tryLock实现自旋锁或者其他逻辑实现非阻塞等待。

参考

libuv漫谈之线程
 Atomics
Atomics MDN

posted @ 2020-03-20 17:51 royalrover 阅读(6235) 评论(0) 收藏举报

刷新页面返回顶部

nodejs中的并发编程

从sleep的实现说起

多线程同步

锁

参考

公告