20135223何伟钦—信息安全系统设计基础第十三周学习总结

学习任务:

1. 掌握三种并发的方式:进程、线程、I/O多路复用
2. 掌握线程控制及相关系统调用
3. 掌握线程同步互斥及相关系统调用
 
 

1.并发的意义

  • 概念:只要逻辑控制流在时间上重叠,那么就可以称为并发。
  • 意义
    • 访问慢速设备(如I/O设备):【CPU可以在这样的慢速中“腾出手”再去做其他事情,使自己保持“繁忙”。】
    • 与人交互:每次用户进行某种操作的请求的时候【用户不会在意在自己进行操作的时候系统是否还处理着其他程序】,一个独立的逻辑并发流被用来处理这个程序。
    • 通过推迟工作来降低延迟
    • 服务多个网络客户端
    • 进程:每个逻辑控制流都是一个进程,由内核进行调度和维护。进程间的通信也必须有显式的通信机制。【每个进程都有独立的虚拟地址空间,发生交流的时候肯定要有机制】
    • I/O多路复用:在并发编程中,一个程序在上下文中调用它们自己的逻辑流。因为程序是一个单独的进程,所以所有的流共享一个地址空间。【即,对于从该进程所属的数据空间内进出的I/O道路上“运输”的数据是要提供给多个逻辑流的】
    • 线程:像进程一样由内核调用,像I/O多路复用一样共享同样的虚拟地址空间

2.构造并发服务器过程

  1. (假设是一个服务器端两个客户端,服务器端始终监听)服务器正在监听一个描述符3,客户端1向服务器端提出申请,服务器端返回一个已经建立连接描述符4;
  2. 服务器派生一个子进程处理该连接。子进程拥有从父进程服务器描述符列表中完整的拷贝。此时,父进程与子进程需要各自切断连接:父进程切断它的描述符列表中的连接描述符4,子进程切断它拷贝的监听描述符3;
  3. 服务器接收新的客户端2的连接请求,同样返回连接描述符5,派生一个子进程;
  4. 服务器端继续等待请求,两个子进程并发地处理客户端连接。

基于进程的并发编程的优缺点

  • 优点:进程不可能不小心覆盖另一个进程的虚拟存储器。
  • 缺点:独立的地址空间使得进程共享状态信息变得更加困难。为了共享信息,它们必须使用显示的IPC(进程间通信)机制,而进程控制和IPC的开销很高,因此会比较慢。

 

基于I/O多路复用技术的并发编程的优缺点

  • 优点:
    • 它比基于进程的设计给了程序员更多的对程序行为的控制。
    • 每个逻辑流都能访问该进程的全部地址空间,这使得流之间共享数据变得容易。
  • 缺点:编码复杂。

 

线程与线程池

    线程不是按照严格的父子层次来组织的。和一个线程相关的线程组成一个对等(线程)池独立于其他线程创建的线程。

    主线程和其他线程的区别仅在于它总是进程中第一个运行的线程。在对等线程池中,一个线程可以杀死它的任何对等线程,或者等待它的任意对等线程终止。另外,每个对等线程都能读写相同的共享数据。

 

Posix线程

    Posix线程是在C程序中处理线程的一个标准接口。

  • 创建线程

    线程通过调用pthread_create函数来创建其他进程。

    Pthread_create函数创建一个新进程,带着一个输入变量arg,在线程的上下文中运行线程例程f。能用attr参数来改变新创建线程的默认属性。当pthread_create返回时,参数tid包含新创建线程的ID。新线程可以通过调用pthread_self函数来获得它自己的线程ID。

  • Pthread_create函数创建一个新进程,带着一个输入变量arg,在线程的上下文中运行线程例程f。能用attr参数来改变新创建线程的默认属性。当pthread_create返回时,参数tid包含新创建线程的ID。新线程可以通过调用pthread_self函数来获得它自己的线程ID。

 

  • 终止线程

    一个线程可以通过以下方式终止:

    • 当顶层的线程例程返回时,线程会隐式地终止。
    • 通过调用pthread_exit函数,线程会显示地终止。如果主线程调用pthread_exit,它会等待所有其他对等线程终止,然后再终止主线程和整个进程,返回值为thread_return。

    • 某个对等线程调用Unix的exit函数,该函数终止进程以及所有与该进程有关的线程。
    • 另一个对等进程通过以当前线程ID作为参数调用pthread_cancle函数来终止当前线程。

 

  • 回收已终止线程的资源

    线程通过调用pthread_join函数等待其他线程终止

    pthread_join函数会阻塞,直到线程tid终止,将线程例程返回的(void*)指针赋值为thread_return指向的位置,然后回收已终止线程占用的所有存储器资源。

 

  • 分离线程

    线程是可结合或可分离的。

    • 一个可结合的线程能够被其他线程回收其资源和杀死,在被其他线程回收之前,它的存储器资源是没有被释放的。
    • 一个分离的线程是不能被其他线程回收或杀死的。它的存储器资源在它终止时由系统自动释放。

 

分离线程

在任何一个时间点上,线程是可结合的,或是分离的。

1.可结合的线程

  • 能够被其他线程收回其资源和杀死
  • 被收回钱,它的存储器资源没有被释放
  • 每个可结合线程要么被其他线程显式的收回,要么通过调用pthread_detach函数被分离

2.分离的线程

  • 不能被其他线程回收或杀死
  • 存储器资源在它终止时由系统自动释放

3.pthread_detach函数

#include <pthread.h>

void pthread_detach(pthread_t tid);

若成功返回0,出错为非0

这个函数可以分离可结合线程tid。

线程能够通过以pthread_self()为参数的pthread_detach调用来分离他们自己。

每个对等线程都应该在他开始处理请求之前分离他自身,以使得系统能在它终止后回收它的存储器资源。

初始化线程:pthread_once函数

#include <pthread.h>
pthread_once_t once_control = PTHREAD_ONCE_INIT;

int pthread_once(pthread_once_t *once_control, void (*init_routine)(void));

总是返回0

基于线程的并发服务器中的注意事项

1.调用pthread_create时,如何将已连接描述符传递给对等进程?

传递指针。

2.竞争问题?

见第七节。

3.避免存储器泄露?

必须分离每个线程,使它终止时它的存储器资源能被收回。

多线程程序中的共享变量

一个变量是共享的,当且仅当多个线程引用这个变量的某个实例。

一、线程存储器模型

需要注意的有:

寄存器从不共享,虚拟存储器总是共享的。

二、将变量映射到存储器

三、共享变量

变量v是共享的——当且仅当它的一个实例被一个以上的线程引用。

第五节 用信号量同步线程

一般而言,没有办法预测操作系统是否将为你的线程选择一个正确的顺序。

所以——进度图

一、进度图

进度图是将n个并发线程的执行模型化为一条n维笛卡尔空间中的轨迹线,原点对应于没有任何线程完成一条指令的初始状态。

当n=2时,状态比较简单,是比较熟悉的二维坐标图,横纵坐标各代表一个线程,而转换被表示为有向边

转换规则:

  • 合法的转换是向右或者向上,即某一个线程中的一条指令完成
  • 两条指令不能在同一时刻完成,即不允许出现对角线
  • 程序不能反向运行,即不能出现向下或向左

而一个程序的执行历史被模型化为状态空间中的一条轨迹线

线程循环代码的分解:

  • H:在循环头部的指令块
  • L:加载共享变量cnt到线程i中寄存器%eax的指令。
  • U:更新(增加)%eax的指令
  • S:将%eax的更新值存回到共享变量cnt的指令
  • T:循环尾部的指令块

几个概念

  • 临界区:对于线程i,操作共享变量cnt内容的指令L,U,S构成了一个关于共享变量cnt的临界区
  • 不安全区:两个临界区的交集形成的状态
  • 安全轨迹线:绕开不安全区的轨迹线

具体相关在操作系统课程中讲的更为详细,比如:

临界区使用原则(互斥条件)

  • 有空让进:如果临界区空闲,则只要有进程申请就立即让其进入;
  • 无空等待:每次只允许一个进程处于临界区;
  • 多中择一:当没有进程在临界区,而同时有多个进程要求进入临界区,只能让其中之一进入临界区,其他进程必须等待;
  • 让权等待:进入临界区的进程,不能在临界区内长时间阻塞等待某事件,使其它进程在临界区外无限期等待;
    不能限制进程的并发数量和执行进度。

二、信号量

信号量实现互斥的基本原理

  • 两个或多个进程通过传递信号进行合作,可以迫使进程在某个位置暂时停止执行(阻塞等待),直到它收到一个可以“向前推进”的信号(被唤醒);
  • 将实现信号灯作用的变量称为信号量,常定义为记录型变量s,其一个域为整型,另一个域为队列,其元素为等待该信号量的阻塞进程(FIFO)。
  • 信号量定义:

    type semaphore=record
    count: integer;
    queue: list of process
    end;
    var s:semaphore;

定义对信号量的两个原子操作——P和V

P(wait)

wait(s)
s.count :=s.count-1;
if s.count<0 then
begin
进程阻塞;
进程进入s.queue队列;
end;

V(signal)

signal(s)
s.count :=s.count+1;
if s.count ≤0 then
begin
唤醒队首进程;
将进程从s.queue阻塞队列中移出;
end;

需要注意的是,每个信号量在使用前必须初始化

三、使用信号量来实现互斥

1.基本思想

将每个共享变量(或者一组相关的共享变量)与一个信号量s(初始为1)联系起来,然后用P和V操作将相应的临界区包围起来。

2.几个概念

  • 二元信号量:用这种方式来保护共享变量的信号量叫做二元信号量,取值总是0或者1.
  • 互斥锁:以提供互斥为目的的二元信号量
  • 加锁:对一个互斥锁执行P操作
  • 解锁;对一个互斥锁执行V操作
  • 计数信号量:被用作一组可用资源的计数器的信号量
  • 禁止区:由于信号量的不变性,没有实际可能的轨迹能够包含禁止区中的状态。

3.wait(s)/signal(s)的应用

  • 进程进入临界区之前,首先执行wait(s)原语,若s.count<0,则进程调用阻塞原语,将自己阻塞,并插入到s.queue队列排队;
  • 注意,阻塞进程不会占用处理机时间,不是“忙等”。直到某个从临界区退出的进程执行signal(s)原语,唤醒它;
  • 一旦其它某个进程执行了signal(s)原语中的s.count+1操作后,发现s.count ≤0,即阻塞队列中还有被阻塞进程,则调用唤醒原语,把s.queue中第一个进程修改为就绪状态,送就绪队列,准备执行临界区代码。

以及

  • wait操作用于申请资源(或使用权),进程执行wait原语时,可能会阻塞自己;
  • signal操作用于释放资源(或归还资源使用权),进程执行signal原语时,有责任唤醒一个阻塞进程。

三、利用信号量来调度共享资源

也就是说,信号量有两个作用:

  • 实现互斥
  • 调度共享资源

信号量分为:互斥信号量和资源信号量。

  • 互斥信号量用于申请或释放资源的使用权,常初始化为1;

  • 资源信号量用于申请或归还资源,可以初始化为大于1的正整数,表示系统中某类资源的可用个数。

1.信号量的物理意义

  • s.count >0表示还可执行wait(s)而不会阻塞的进程数(可用资源数)。每执行一次wait(s)操作,就意味着请求分配一个单位的资源。
  • 当s.count ≤0时,表示已无资源可用,因此请求该资源的进程被阻塞。此时,s.count的绝对值等于该信号量阻塞队列中的等待进程数。执行一次signal操作,就意味着释放一个单位的资源。若s.count<0,表示s.queue队列中还有被阻塞的进程,需要唤醒该队列中的第一个进程,将它转移到就绪队列中。

2.常见问题

这里的常见问题有生产者-消费者问题,和读者-写者问题,都是操作系统课程中详细讲述过的,不再赘述。

他并发问题

一、线程安全性

一个线程是安全的,当且仅当被多个并发线程反复的调用时,它会一直产生正确的结果。

四个不相交的线程不安全函数类以及应对措施:

  • 不保护共享变量的函数——用P和V这样的同步操作保护共享变量
  • 保持跨越多个调用的状态的函数——重写,不用任何static数据。
  • 返回指向静态变量的指针的函数——①重写;②使用加锁-拷贝技术。
  • 调用线程不安全函数的函数——参考之前三种

二、可重入性

当它们被多个线程调用时,不会引用任何共享数据。

1.显式可重入的:

所有函数参数都是传值传递,没有指针,并且所有的数据引用都是本地的自动栈变量,没有引用静态或全剧变量。

2.隐式可重入的:

调用线程小心的传递指向非共享数据的指针。

三、在线程化的程序中使用已存在的库函数

一句话,就是使用线程不安全函数的可重入版本,名字以_r为后缀结尾。

四、竞争

1.竞争发生的原因:

一个程序的正确性依赖于一个线程要在另一个线程到达y点之前到达它的控制流中的x点。也就是说,程序员假定线程会按照某种特殊的轨迹穿过执行状态空间,忘了一条准则规定:线程化的程序必须对任何可行的轨迹线都正确工作。

2.消除方法:

动态的为每个整数ID分配一个独立的块,并且传递给线程例程一个指向这个块的指针

五、死锁:

一组线程被阻塞了,等待一个永远也不会为真的条件。

解决死锁的方法

a.不让死锁发生:

b.让死锁发生:

 

 

参考资料:

1. 教材:第十一章《网络编程》

2. 教材:第十二章《并发编程》

 

posted on 2015-12-06 22:35  20135223  阅读(170)  评论(1编辑  收藏  举报