操作系统 Concurrency 并发

1. 线程和进程的区别

名称	执行点	地址空间	状态保存位置
进程 process	一个进程有多个线程，多个执行点	一个进程一个地址空间	Process Control Block 进程控制块
线程 thread	一个执行点	多个线程共享一个地址空间	Thread Control Block 线程控制块

2. Concurrency 并发

critcal section 临界区：访问共享资源的一段代码；
Race condition 竞态条件：多个执行线程大致同时进入临界区时，都试图更新共享资源；
Indeterminate 不确定性：出现由一个或多个竞态条件组成，出现的输出因运行而异；
Mutual exclusion 互斥：互斥原语，可以保证只有一个线程进入临界区，避免出现竞态；

3. Lock 锁

一个朴素的锁代码示例如下，是不安全的，所以需要硬件的支持；

typedef struct lock_t { int flag; } lock_t;

void init(lock_t *mutex) {
	// 0 -> lock is available, 1 -> held
	mutex->flag = 0;
}

//这里的lock方法时不安全的，因为多个线程可能同时执行while条件判断，都是false，所以这个lock时不安全的
void lock(lock_t *mutex) {
	while (mutex->flag == 1) // TEST the flag
		; // spin-wait (do nothing)
	mutex->flag = 1; // now SET it!
}

void unlock(lock_t *mutex) {
	mutex->flag = 0;
}

3.1 test-and-set instruction

TestAndSet逻辑如下：

//该指令是硬件提供的，执行过程时原子的
int TestAndSet(int *old_ptr, int new) {
	int old = *old_ptr; // fetch old value at old_ptr
	*old_ptr = new; // store 'new' into old_ptr
	return old; // return the old value
}

通过该指令实现lock如下：

typedef struct lock_t {
	int flag;
} lock_t;

void init(lock_t *lock) {
	// 0 indicates that lock is available, 1 that it is held
	lock->flag = 0;
}

void lock(lock_t *lock) {
        //当flag为0时上锁成功，为1时，说明锁已经被占用，自旋等待
	while (TestAndSet(&lock->flag, 1) == 1)
	; // spin-wait (do nothing)
}

void unlock(lock_t *lock) {
	lock->flag = 0;
}

3.2 compare-and-exchange instruction

和compare-and-set instruction相比多了expected参数，即old value和expected相等才会更新；其他没有区别，所以只需要对lock()函数轻微修改即可；


int CompareAndSwap(int *ptr, int expected, int new) {
	int actual = *ptr;
	if (actual == expected)
		*ptr = new;
	return actual;
}

void lock(lock_t *lock) {
	while (CompareAndSwap(&lock->flag, 0, 1) == 1)
		; // spin
}

3.3 load-linked and store conditioinal instruction

load-linked指令用于加载指定地址的值到register中，store-conditional用来判断加载后，内存中的值是否有被修改过，没有就修改并返回1，有就直接返回0

//将值从内存中加载到寄存器中
int LoadLinked(int *ptr) {
	return *ptr;
}

int StoreConditional(int *ptr, int value) {
        //判断加载到寄存器后，内存中该值是否有被修改过
	if (no one has updated *ptr since the LoadLinked to this address) {
		*ptr = value;
		return 1; // success!
	} else {
		return 0; // failed to update
	}
}

其对应的加锁解锁代码如下：

void lock(lock_t *lock) {
	while (1) {
                //当flag为1时，说明已经被其他线程占用
		while (LoadLinked(&lock->flag) == 1)
			; // spin until it's zero
                //校验是否有被修改，并修改
		if (StoreConditional(&lock->flag, 1) == 1)
			return; // if set-it-to-1 was a success: all done
					// otherwise: try it all over again
	}
}

void unlock(lock_t *lock) {
	lock->flag = 0;
}

3.4 fetch-and-add instruction

获取并增加指令，能原子地返回该地址的旧值，并让该值自增一；

int FetchAndAdd(int *ptr) {
	int old = *ptr;
	*ptr = old + 1;
	return old;
}

基于该指令的lock代码有些特殊，通过两个变量，每个线程加载自己的ticket，通过判断turn变量是否是自己的ticket来判断，当前自生是否可以运行；

typedef struct lock_t {
	int ticket;
	int turn;
} lock_t;

void lock_init(lock_t *lock) {
	lock->ticket = 0;
	lock->turn = 0;
}



void lock(lock_t *lock) {
        //每个线程线性获取自己唯一ticket即myturn
	int myturn = FetchAndAdd(&lock->ticket);
        //只有myturn和lock.turn相等时才会跳出自旋
	while (lock->turn != myturn)
		; // spin
}

void unlock(lock_t *lock) {
        //执行完毕后，递增lock.turn，让下一个线程执行
	FetchAndAdd(&lock->turn);
}

可以看出基于ticket的lock，每个线程首先都会拿到自己的ticket，然后根据ticket的先后顺序执行，所以是一个 **公平锁**

4. Using Queues: Sleeping Instead Of Spinning 用队列，来实现休眠替代自旋

    前面的几个lock都是通过spinning 自旋来暂停线程，虽然可以在自旋中添加yield()来让出CPU，但是每次自旋还是会占用CPU周期，造成浪费，而且也无法避免因为CPU进行线程调度出现线程饿死的情况；
    为了解决这一点，必须显式地控制锁的释放，谁能抢到锁。
    Solaris系统提供两个调用，park()能够让调用线程自身休眠，unpark(threadID)则会唤醒threadID标识的线程。通过queue以及这两个指令来实现：

typedef struct lock_t {
	int flag;//是否有线程占用锁的标记
	int guard;//是否有线程在执行lock() unlock()函数的标记
	queue_t *q;//线程队列
} lock_t;

void lock_init(lock_t *m) {
	m->flag = 0;
	m->guard = 0;
	queue_init(m->q);
}

void lock(lock_t *m) {
        //这里的自旋是为了保证同一时间只有一个线程执行lock()和unlock()方法，所以lock() unlock()方法结束时都会将guard置为0
        //因为这里lock()和unlock()函数都会执行很快，所以自旋不会消耗很多CPU周期
	while (TestAndSet(&m->guard, 1) == 1)
		; //acquire guard lock by spinning
	if (m->flag == 0) {
                //flag为0 锁是空闲的
		m->flag = 1; // lock is acquired
		m->guard = 0;
	} else {
                //锁已经被别的线程占用了，将当前线程id加入队列，并休眠当前线程
		queue_add(m->q, gettid());
		m->guard = 0;
		park();
	}
}

void unlock(lock_t *m) {
	while (TestAndSet(&m->guard, 1) == 1)
		; //acquire guard lock by spinning
	if (queue_empty(m->q))
		m->flag = 0; // let go of lock; no one wants it
	else
                //如果有别的线程还在排队，那么直接激活队首的线程，flag没必要置为0
		unpark(queue_remove(m->q)); // hold lock (for next thread!)
	m->guard = 0;
}

只是这里的lock()有一点小问题

                queue_add(m->q, gettid());
		m->guard = 0;
		park();

在 m->guard = 0; 之后，可能cpu被调度到另一个线程执行unlock()函数，结果执行unpark发现并没有休眠线程，这被称为唤醒/等待竞争（wakeup/waiting race）；

Solaris系统额外提供setpark()调用来解决这个问题，setpark()申明线程自身马上要park，如果刚好另一个线程被调度，并执行了unpark，那么后续的park调用会直接返回，而不是一直睡眠；所以lock()代码可以做如下修改;

                queue_add(m->q, gettid());
                setpark(); // new code
		m->guard = 0;
		park();

Linux提供的futex，也类似Solaris的接口，但提供了更多的内核功能。具体来说每个futex都关联一个特定的物理内存位置，也有一个事先建好的内核队列。调用者通过futex调用来睡眠或者唤醒；

Linux 采用的是一种古老的锁方案，two-phase lock 两阶段锁，第一阶段会先自旋一段时间，如果第一阶段没有获取到锁，第二阶段会让线程睡眠，直到锁可用。

posted on 2022-03-24 17:50 mindSucker 阅读(75) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

mindSucker