操作系统-4-进程管理(一)

一、进程的基本概念

    1 程序的顺序执行与并发执行

      (1)前驱图

        概念:前驱图是一个有向无循环图,记为DAG,可用于描述进程之间执行的前后关系。无循环关系可实现顺序执行。

           结点:一个程序段、进程或一条语句;
           有向边:两个结点之间的前趋关系;
           重量:结点所含有的程序量或执行时间;
           直接前驱、直接后继、开始结点、终止结点

          

          以上前趋图,存在的前趋关系:P1→P2,P1→P3,P1→P4,P2→P5,P3→P5,P4→P6,P4→P7,P5→P8,P6→P8,P7→P9,P8→P9;
          或表示为:P={P1,P2,P3,P4,P5,P6,P7,P8,P9} →={(P1,P2),(P1,P3),(P1,P4), (P2,P5),(P3,P5),(P4,P6), (P4,P7),(P5,P8),(P6,P8), (P7,P9),(P8,P9)}

          注意:前趋图中必须不存在循环。如下图不是前趋图:

            

      (2)程序的顺序执行

          程序的顺序执行如图:

            

          在计算机系统中只有一个程序在运行,这个程序独占系统中所有资源,其执行不受外界影响。一道程序执行完后另一道才能开始。

          特征:顺序性:一个程序开始执行必须要等到前一个程序已执行完成。
             封闭性:程序运行时独占计算机资源,资源的状态只能由本程序修改。程序一旦开始执行,其计算结果不受外界因素影响。
             可再现性:程序的结果与它的执行速度无关(即与时间无关),只要给定相同的输入,一定会得到相同的结果。
          程序顺序执行处理器利用率举例:

             

      (3)程序的并发执行

          概念:所谓程序的并发执行是指:若干个程序同时在系统中执行,这些程序的执行在时间上是重叠的,一个程序的执行尚未结束,另一个程序的执行已经开始。

              
          特征:间断性
             失去程序的封闭性:程序在并发执行时,是多个程序共享系统中的资源,因此这些资源的状态将由多个程序来改变。
             不可再现性
    2 进程的定义

      定义:进程是可并发执行的程序在一个数据集合上的运行过程。进程是指进程实体的运行过程。

      性质:进程是一个程序与其数据一道通过处理机的执行所发生的活动。进程是指进程实体的运行过程,是系统进行资源分配和调度的独立单位

      进程同程序的比较:程序是指令的有序集合,其本身没有任何运行的含义,是一个静态的概念。而进程是程序在处理机上的一次执行过程,它是一个动态的概念。

               程序是静态的,进程是动态的;

               程序可以作为一种软件资料长期存在,而进程是有一定生命期的。程序是永久的,进程是暂时的;

               进程更能真实地描述并发,而程序不能;

               进程是由程序和数据、进程控制块PCB三部分组成的;

               进程具有创建其他进程的功能,而程序没有;

               同一程序同时运行于若干个数据集合上,它将属于若干个不同的进程。也就是说同一程序可以对应多个进程 ;
    3 进程的特征

      结构性:由程序(段)、数据(段)、进程控制块(PCB)三部分组成;
      动态性:进程是程序的执行过程;
      并发性:多个进程可同存于内存中,能在一段时间内同时运行;
      独立性:独立运行的基本单位,独立获得资源和调度的基本单位;
      异步性:各进程按各自独立的不可预知的速度向前推进。
    4 进程的状态及转换

      概念:不同系统设置的进程状态数目不同,进程有三种基本状态,进程在生命消亡前处于且仅处于三种基本状态之一。
      进程的三种基本状态:

        就绪状态(Ready):存在于处理机调度队列中的所有进程,它们已经准备就绪,一旦得到CPU,就立即可以运行。这些进程所处的状态为就绪状态。
                    就绪队列:处于就绪状态的进程按一定的策略排队,同一时刻可有多个就绪队列。

        运行状态(Running):正在运行的进程所处的状态为运行状态。单处理机系统只有一个进程处于该状态,多处理机系统有多个进程处于运行状态
        等待/阻塞/睡眠/封锁状态(Wait/Blocked):若一进程正在等待某一事件发生(如等待输入输出工作完成),

                         这时,即使给它CPU,它也无法运行,称该进程处于等待状态(阻塞、 睡眠、封锁状态)。
                                阻塞队列:根据阻塞原因可以设置多个队列。

        进程的状态变迁图:

             

            如果系统中有N个进程,运行的进程最多1个,最少1个;就绪进程最多N-1个最少1个;等待进程最多N-2个,最少0个;

      进程的五状态模型

        

        新建态:对应进程刚被创建的状态。为一个新进程创建必要的管理信息,它并没有被提交执行,而是在等待操作系统完成创建进程的必要操作。

        终止态:等待操作系统进行善后,然后,退出主存。
            进入终止态的进程不再执行,但依然临时保留在系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后,系统将删除该进程。
        进程状态转换的具体原因:NULL→新建态:创建一个子进程。
                      新建态→就绪态:系统完成了进程创建操作,且当前系统的性能和内存的容量均允许。
                      运行态→终止态:一个进程到达自然结束点,或出现了无法克服的错误,或被操作系统所终结,或被其他有终止权的进程所终结。
                    终止态→NULL:完成善后操作。
                    就绪态→终止态:某些操作系统允许父进程终结子进程。
                    等待态→终止态:某些操作系统允许父进程终结子进程。

      进程的七状态模型

         

         挂起就绪态(ready suspend):进程具备运行条件但目前在二级存储器中,当它被对换到主存才能被调度执行。
         挂起等待态(blocked suspend):进程正在等待某一个事件且在二级存储器中。

         引入挂起状态的原因:终端用户的请求:挂起某些可疑进程。
                   父进程请求:父进程需挂起某子进程。
                   负荷调节的需要:实时系统中挂起某些不重要的进程。
                   操作系统的需要:OS挂起某些进程,以便检查资源的使用情况等。

         具有挂起状态的状态转换:等待态→挂起等待态:当前不存在就绪进程,至少一个等待态进程将被对换出去成为挂起等待态;
                     挂起等待态→挂起就绪态:引起进程等待的事件发生之后,相应的挂起等待态进程将转换为挂起就绪态。

                     挂起就绪态→就绪态:内存中没有就绪态进程,或挂起就绪态进程具有比就绪态进程更高的优先级,将把挂起就绪态进程转换成就绪态。
                     就绪态→挂起就绪态:系统根据当前资源状况和性能要求,决定把就绪态进程对换出去成为挂起就绪态。

         挂起进程具有如下特征:该进程不能立即被执行。
                    挂起进程可能会等待事件,但所等待事件是独立于挂起条件的,事件结束并不能导致进程具备执行条件。
                    进程进入挂起状态是由于操作系统、父进程或进程本身阻止它的运行。
                    结束进程挂起状态的命令只能通过操作系统或父进程发出。
    5 进程控制块(PCB)

      概念:为了描述一个进程和其它进程以及系统资源的关系,为了刻画一个进程在各个不同时期所处的状态,采用了一个与进程相联系的数据结构,称为进程控制块。
         PCB是OS中最重要的记录型数据结构。
      功能:将一个不能独立运行的程序变成一个可以独立运行的基本单位,一个能与其他进程并发执行的进程。

      特征:OS利用PCB来对并发执行的进程进行控制和管理,PCB是OS感知进程存在的唯一标志。
         进程与PCB是一一对应的。
         PCB随进程创建而建立,随进程结束而回收。
         PCB应常驻内存。

      内容:

         进程描述信息:进程标识符(process ID):唯一,通常是一个整数
                进程名:通常基于可执行文件名(不唯一)
                用户标识符(user ID):进程组关系

         进程控制信息:当前状态
                优先级(priority)
                代码执行入口地址
                程序的外存地址
                运行统计信息(执行时间、页面调度)
                进程间同步和通信;阻塞原因
                进程的队列指针
                进程的消息队列指针

         所拥有的资源和使用情况:虚拟地址空间的现状、打开文件列表
         CPU现场保护信息:寄存器值(通用、程序计数器PC、状态字PSW,地址包括栈指针)、指向赋予该进程的段/页表的指针

      PCB表组织方式:系统把所有PCB组织在一起,并把它们放在内存的固定区域,就构成了PCB表。
                      PCB表的大小决定了系统中最多可同时存在的进程个数,称为系统的并发度。 

              链接结构:相同状态的进程PCB组成一个链表,不同状态对应多个不同的链表。就绪链表、阻塞链表

                   

              索引结构:对具有相同状态的进程,分别设置各自的PCB索引表,表明PCB在PCB表中的地址。

                   

二、进程控制

    1.概念:进程控制指对系统中的所有进程实施管理。
            如:创建一个新进程;
                  终止一个已完成的进程;
                  终止一个因某事件而使其无法运行下去的进程;
                  进程运行中状态的转换
                  …
        进程控制一般由OS的内核来实现。
    2.OS的内核的功能:不同OS的内核包括功能不同,但都包括:支撑功能
                                  中断处理:内核最基本的功能。如:系统调用 进程调度等
                                时钟管理:
                                原语操作:实现进程通信和控制。
                                资源管理功能:进程管理、存储器管理、设备管理
    3.原语

        概念:由多条指令组成,是一种特殊的系统功能调用,它可以完成一个特定的功能。
        特点:执行时不可中断
           不可并发
           在管态下执行,常驻内存

        常用的进程控制原语:创建原语 Create
                  终止原语 Destroy
                  阻塞原语Block、唤醒原语Wakeup
                  挂起原语Suspend、激活原语Active

    4.进程的创建流程:申请空白PCB
              为新进程分配资源  如内存
              初始化PCB  
              将新进程插入就绪队列
    5.进程的终止流程:根据被终止进程的标识符,从PCB集合中检索出该进程的PCB;
              若被终止进程处于执行状态,应立即终止执行,并置调度标志为真,调度其他进程;
              结束该进程所有子孙进程的执行,以防止成为不可控进程;
              将进程所拥有的资源交给父进程或系统进程;
              释放PCB 。
    6.进程终止的事件:正常结束
                异常结束:越界错误、保护错、特权指令错、非法指令错、I/0故障、运行超时、等待超时、算术运算错等
              外界干预: 操作员或OS干预;父进程请求;父进程终止,子孙进程被终止。
    7.进程的阻塞与唤醒:

        阻塞:当一个进程所期待的某一事件尚未出现时,该进程调用阻塞原语将自己阻塞。进程阻塞是进程自身的一种主动行为。

        唤醒:处于阻塞状态的进程是绝不可能叫醒它自己的,必须由它的合作进程用唤醒原语唤醒它。

        进程阻塞或唤醒的原因:请求系统服务:如请求打印机
                   启动某种操作:如I/O操作
                   新数据还未到达:合作进程之间需要数据传递
                   无新工作可做:如发送进程发送完数据后
    8.进程的挂起与激活:

        挂起:当出现了引起进程挂起的事件时,系统利用挂起原语将指定进程或处于阻塞状态的进程挂起。
        激活:当发生激活进程的事件时,系统利用激活原语将指定进程激活。

        进程挂起的事件:用户进程请求将自己挂起;
                父进程请求挂起某个子进程;
                系统利用挂起原语将指定进程或阻塞态进程挂起
        进程激活的事件:父进程请求激活某进程;
                用户进程请求激活某进程;

三、线程

    定义:是进程中的一个实体,是被系统独立调度的基本单位。

    1 引入线程概述

      引入进程的目的是为了使多个程序更好的并发执行,改善资源利用率、提高系统效率。
      引入线程则是为了减少并发执行时所付出的时空开销,使并发粒度更细、并发性更好。

      

      进程的两个属性:进程是一个资源分配的基本单位。进程是一个可独立调度和分派的基本单位。

      从进程方面解释引入线程:进程作为一个资源拥有者,在创建、撤消、切换中,系统必须为之付出较大时空开销。

            所以系统中进程的数量不宜过多,进程切换的频率不宜过高,但这也就限制了并发程度的进一步提高。
            将进程的上述两个属性分开,线程作为调度的基本单位,不同时作为独立分配资源的单位;
            线程会被频繁调度和切换。进程作为拥有资源的单位,不进行频繁切换。线程因而产生。
      特征:结构性:TCB:标识、现场信息(寄存器、PC、栈指针)、调度信息(状态、优先级)
                   数据块:过程参数、数据、系统与用户堆栈
         并发性:同一进程中的各线程在同一主存空间,可以共享进程中的所有资源(数据、设备、文件),线程间通信方便。
         共享性:同一进程的各线程
         动态性:有生命期,有状态变化,可创建子线程
      性质:在引入线程的OS中,线程是进程中的一个实体,是被系统独立调度和分派的基本单位。
         线程自己基本不拥有系统资源,只拥有少量必不可少的资源:程序计数器PC、一组寄存器、栈。
         线程可与同属一个进程的其它线程共享进程所拥有的全部资源。
         一个线程可以创建和撤消另一个线程;同一进程中的多个线程之间可以并发执行。
         系统调度的基本单位是线程而不是进程,每当创建一个进程时,至少要同时为该进程创建一个线程,否则该进程无法被调度执行。
      单线程进程的内存布局和运行:
          
      管理和执行相分离的进程模型:
           

      引入线程的好处:创建一个新线程花费时间少
              线程的终止时间比进程短;
              同进程内的线程切换时间比进程短;
              因为同一进程内的线程共享内存和文件,因此它们之间相互通信无须调用内核
              适合多处理机系统

      线程的属性:轻型实体:基本不拥有资源
            独立调度的基本单位
            可以并发执行
            共享进程资源

      线程的状态:线程状态:运行、就绪和阻塞三种状态。线程的状态转换类似于进程。
            挂起状态对线程是没有意义的,如果进程挂起后被对换出主存,则它的所有线程因共享了进程的地址空间,也必须全部对换出去。
            线程的两种阻塞方式:阻塞进程方式:对某些线程实现机制,当线程被阻塞时,所在进程也转换为阻塞态,即使这个进程存在另一个处于就绪态的线程。
                      阻塞线程方式:如果存在另外一个处于就绪态的线程,则调度该线程进入运行状态,否则进程才转换为阻塞态。
      线程的管理:线程包:多线程技术利用线程包(库)提供线程原语集来支持多线程运行
               线程包(库)可分成两种:用户空间中运行的线程包(库)
                           内核中运行的线程包(库)
            线程包(库)提供一组API,支持应用程序创建、调度、撤销和管理线程的运行。如:创建、撤销、改变优先级等。
            有的操作系统直接支持多线程,而有的操作系统不支持多线程。

 

    2 线程与进程的比较

      概述:线程具有进程的许多特征,在引入线程的OS中,每一进程都拥有至少一个线程。

      (1)调度:传统OS中,拥有资源、独立调度的基本单位是进程;引入线程的系统中,线程是调度和分派的基本单位,而进程是拥有资源的基本单位。
        在同一个进程内线程切换不会产生进程切换,由一个进程内的线程切换到另一个进程内的线程时,将会引起进程切换。

      (2)并发性:在引入线程的系统中,进程之间可并发,同一进程内的各线程之间也能并发执行。因而系统具有更好的并发性。

      (3)拥有资源:无论是传统OS,还是引入线程的OS,进程都是拥有资源的独立单位,线程一般不拥有系统资源,但它可以访问隶属进程的资源。
        即一个进程的所有资源可供进程内的所有线程共享。

      (4)系统开销:进程创建和撤消的开销远大于线程创建和撤消的开销,进程切换时,当前进程的CPU环境要保存,新进程的CPU环境要设置,

        线程切换时只须保存和设置少量寄存器,并不涉及存储管理方面的操作,因此进程切换的开销远大于线程切换的开销。
            同一进程内的各线程由于它们拥有相同的地址空间,它们之间的同步和通信的实现也比较容易。

      进程与线程的关系:

          

    3 用户级线程和内核级线程

      OS对线程的实现机制:从实现的角度看,线程可分为三种:用户级线程ULT(User Level Thread)如: JAVA,Informix
                                  核心级线程KLT (Kernal Level Thread)如:Win2k/XP、OS/2
                                  混合式线程  如:Solaris
      内核级线程KLT:依赖于内核,即无论是用户进程中的线程,还是系统进程中的线程,它们的创建、撤消、切换都由内核实现。Windows NT和OS/2支持内核线程;
               性质:所有线程管理由核心完成
                  核心维护进程和线程的上下文
                  线程之间的切换需要核心支持
                  以线程为基础进行调度
                  时间片分配给线程,所以多线程的进程获得更多CPU时间。
                  一个线程发起系统调用而阻塞,不会影响其他线程的运行。
              优点:对多处理器,核心可同时调度同一进程的多个线程;
                 阻塞是在线程一级完成。即进程中的一个线程被阻塞了,内核能调度同一进程的其它线程占有处理器运行。
              缺点:应用程序线程在用户态运行,线程管理与调度是在核心态,同一进程内的线程频繁切换时,调用内核,线程切换时要做模式切换,导致速度下降

      用户级线程ULT:这种线程的创建、撤消和切换,都不用系统调用来实现,ULT与内核无关。

              应用进程利用线程库提供创建、同步、调度和管理线程的函数来控制用户线程。

              性质:由应用程序完成所有线程的管理:通过线程库(用户空间):一组管理线程的函数
                                线程库提供一个线程运行管理系统(运行系统)
                 核心不知道线程的存在
                 线程切换不需要核心态特权
                 调度是应用程序特定的
                 用户线程调度算法可针对应用优化;
              线程库:线程包(库)提供一组API,支持应用程序创建、调度、撤销和管理线程的运行。
                  作用:创建、撤消线程
                     在线程之间传递消息和数据
                     调度线程执行
                     保护和恢复线程上下文
                  线程库可分成两种:用户空间中运行的线程包(库)
                           内核中运行的线程包(库)。
                  线程库实质上是多线程应用程序的开发和运行支撑环境。每个线程库应提供给用户级的API编程使用。
                  多线程的操作系统和语言都提供了线程库,支持应用程序创建、调度、和管理用户级线程的运行。
              优点:线程切换是线程库在用户态进行,不调用核心
                 调度是应用程序特定的:可以选择最好的算法
                 ULT可运行在任何操作系统上(只需要线程库),可在一个不支持线程的OS上实现
              缺点:线程执行系统调用时,不仅该线程被阻塞,且进程内的所有线程会被阻塞(KLT不会)。
                 纯ULT中,多线程应用不能利用多重处理的优点。内核给一个进程仅分配一个CPU(不知道进程中有线程),进程中仅有一个线程能执行。

                 (即同一进程中的两个线程不能同时运行于两个处理器上)
      用户级和核心级线程区别图:

          

 进程同步、管程机制、进程通信等内容请阅读操作系统-5-进程管理(二)

posted @ 2020-04-16 21:30  我只是一个码农  阅读(894)  评论(0编辑  收藏  举报