Linux多进程开发（1）：进程概述、进程状态转换

进程概述

01 程序和进程

程序是包含一系列信息的文件，这些信息描述了如何在运行时创建一个进程

二进制格式标识：每个程序文件都包含用于描述可执行文件格式的元信息。内核利用此信息来解释文件中的其他信息。(ELF可执行连接格式)
机器语言指令：对程序算法进行编码。
程序入口地址：标识程序开始执行时的起始指令位置。
数据：程序文件包含的变量初始值和程序使用的字面量值(比如字符串)。
符号表及重定位表:描述程序中函数和变量的位置及名称。这些表格有多重用途，其中包括调试和运行时的符号解析(动态链接)。
共享库和动态链接信息：程序文件所包含的一些字段，列出了程序运行时需要使用的共享库，以及加载共享库的动态连接器的路径名。
其他信息：程序文件还包含许多其他信息，用以描述如何创建进程。

进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元，在传统的操作系统中，进程既是基本的分配单元，也是基本的执行单元。

可以用一个程序来创建多个进程，进程是由内核定义的抽象实体，并为该实体分配用以执行程序的各项系统资源。从内核的角度看，进程由用户内存空间和一系列内核数据结构组成，其中用户内存空间包含了程序代码及代码所使用的变量，而内核数据结构则用于维护进程状态信息。记录在内核数据结构中的信息包括许多与进程相关的标识号(IDs)、虛拟内存表、打开文件的描述符表、信号传递及处理的有关信息、进程资源使用及限制、当前工作目录和大量的其他信息。

02 单道、多道程序设计

单道程序，即在计算机内存中只允许一个的程序运行。
多道程序设计技术是在计算机内存中同时存放几道相互独立的程序，使它们在管理程序控制下，相互穿插运行，两个或两个以上程序在计算机系统中同处于开始到结束之
间的状态，这些程序共享计算机系统资源。引入多道程序设计技术的根本目的是为了提高CPU的利用率。
对于一个单CPU系统来说，程序同时处于运行状态只是一种宏观上的概念，他们虽然都已经开始运行，但就微观而言，任意时刻，CPU上运行的程序只有一个。
在多道程序设计模型中，多个进程轮流使用CPU。而当下常见CPU为纳秒级，1秒可以执行大约10亿条指令。由于人眼的反应速度是毫秒级，所以看似同时在运行。

03 时间片

时间片(timeslice)又称为“量子(quantum)”或“处理器片(processor slice)”是操作系统分配给每个正在运行的进程微观上的一段CPU时间。事实上，虽然一台计算机通常可能有多个CPU，但是同一个CPU永远不可能真正地同时运行多个任务。在只考虑一个CPU的情况下，这些进程“看起来像”同时运行的，实则是轮番穿插地运行，由于时间片通常很短(在Linux上为5ms~800ms)，用户不会感觉到。
时间片由操作系统内核的调度程序分配给每个进程。首先，内核会给每个进程分配相等的初始时间片，然后每个进程轮番地执行相应的时间，当所有进程都处于时间片耗尽的状态时，内核会重新为每个进程计算并分配时间片，如此往复。

04 并行和并发

并行(parallel)：指在同一时刻，有多条指令在多个处理器上同时执行。
并发(concurrency)：指在同一时刻只能有一条指令执行，但多个进程指令被快速的轮换执行，使得在宏观上具有多个进程同时执行的效果，但在微观上并不是同时执行的，只是把时间分成若干段，使多个进程快速交替的执行。

并发是两个队列交替使用一台咖啡机。并行是两个队列同时使用两台咖啡机。

05 进程控制块(PCB，也叫进程描述符表)

为了管理进程，内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个PCB(Processing Control Block)进程控制块，维护进程相关的信息，Linux内核的进程控制块是 task_struct 结构体。

在 /usr/src/linux-headers-xxx/include/linux/sched.h文件中可以查看 struct task_struct 结构体定义。其内部成员有很多，我们只需要掌握以下部分即可：
1.进程id：系统中每个进程有唯一的id，用pid_t 类型表示，其实就是一个非负整数
2.进程的状态：有就绪、运行、挂起、停止等状态
3.进程切换时需要保存和恢复的一些CPU寄存器
4.描述虚拟地址空间的信息
5.描沭控制终湍的信息
6.当前工作目录(Current Working Directory)
7.umask掩码
8.文件描述符表，包含很多指向file结构体的指针
9.和信号相关的信息
10.用户id和组id
11.会话(Session)和进程组
12.进程可以使用的资源上限(Resource Limit)。指令ulimit -a查看各种资源的上限

进程状态转换

01 进程的状态

进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中，进程状态分为三个基本状态，即就绪态，运行态，阻塞态。在五态模型中，进程分为新建态、就绪态，运行态，阻塞态，终止态。

三态模型：

就绪态：进程具备运行条件，等待系统分配处理器以便运行。当进程已分配到除CPU以外的所有必要资源后，只要再获得CPU，便可立即执行。在一个系统中处于就绪状态的进程可能有多个，通常将它们排成一个队列，称为就绪队列
运行态：进程占有处理器正在运行
阻塞态：又称为等待(wait)态或睡眠(sleep)态，指进程不具备运行条件，正在等待某个事件的完成。CPU资源已释放

五态模型：

新建态：进程刚被创建时的状态，没有分配资源，尚未进入就绪队列
终止态：进程完成任务到达正常结束点，或出现无法克服的错误而异常终止，或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行(用户区数据释放)，但依然保留在操作系统中等待善后(内核区数据还没有释放)。一旦其他进程完成了对终止态进程的信息抽取之后，操作系统将删除该进程。终止态也可以从就绪态和阻塞态到达。

02 进程相关命令

查看进程
ps aux / ajx
a：显示终端上的所有进程，包括其他用户的进程
u：显示进程的详细信息
x：显示没有控制终端的进程
j：列出与作业控制相关的信息
STAT参数意义

参数	意义
D	不可中断Uninterruptible (usually IO)
R	正在运行，或在队列中的进程
S(大写)	处于休眠状态
T	停止或被追踪
Z	僵尸进程
W	进入内存交换(从内核2. 6开始无效)
X	死掉的进程
<	高优先级
N	低优先级
s	包含子进程
+	位于前台的进程组

实时显示进程动态
top
可以在使用 top 命令时加上 -d 来指定显示信息更新的时间间隔，在 top 命令执行后，可以按以下按键对显示的结果进行排序：

选项	功能
M	根据内存使用量排序
P	根据CPU占有率排序
T	根据进程运行时间长短排序
U	根据用户名来筛选进程
K	输入指定的PID杀死进程

杀死进程
kill [-signal] pid
kill -1 列出所有信号
kill -SIGKILL 进程ID
kill -9 进程ID
killall name 根据进程名杀死进程
kill -l查看所有信号
-9其实就是9号信号SIGKILL，效果与-SIGKILL相同

./a.out & 后台运行程序

03 进程号和相关函数

每个进程都由进程号来标识，其类型为pid_t(整型)，进程号的范围：0~32767。进程号总是唯一的，但可以重用。当一个进程终止后，其进程号就可以再次使用。
任何进程(除 init 进程)都是由另一个进程创建，该进程称为被创建进程的父进程，对应的进程号称为父进程号(PPID)
进程组是一个或多个进程的集合。他们之间相互关联，进程组可以接收同一终端的各种信号，关联的进程有一个进程组号(PGID) 。默认情况下，当前的进程号会当做当前的进程组号。
进程号和进程组相关函数:
pid_t getpid(void);
pid_t getppid(void);
pid_t getpgid(pid_t pid);

进程创建

01 进程创建

系统允许一个进程创建新进程，新进程即为子进程，子进程还可以创建新的子进程，形成进程树结构模型。

pid_t fork(void);
/*
创建一个子进程，实质上是复制一份当前进程，指令 man 2 fork 查看详情
头文件：#include <sys/types.h>
       #include <unistd.h>
返回值:
    成功：父进程中返回子进程ID，子进程中返回0
    失败：返回-1
失败的两个主要原因：
    1.当前系统的进程数已经达到了系统规定的上限，这时errno的值被设置为EAGAIN
    2.系统内存不足，这时errno的值被设置为ENOMEM
*/

02 父子进程虚拟地址空间

当调用fork()后会将父进程拷贝一份给子进程，他们除了fork()的返回值、pid、ppid等不同外其他都相同。
Linux的fork()使用是通过写时拷贝(copy-on-write) 实现。写时拷贝是种可以推迟甚至避免拷贝数据的技术。内核此时并不复制整个进程的地址空间，而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间，从而使各个进行拥有各自的地址空间。也就是说，资源的复制是在需要写入的时候才会进行，在此之前，只有以只读方式共享。
注意：fork之后父子进程共享文件，fork产生的子进程与父进程相同的文件文件描述符指向相同的文件表，引用计数增加，共享文件偏移指针。

父子进程之间的关系：

区别：
1.fork()函数的返回值不同。父进程中：返回的子进程的ID；子进程中：返回0
2.pcb中的一些数据：当前进程的id、当前的进程的父进程的id、信号集
共同点：
某些状态下：子进程刚被创建出来，还没有执行任何的写数据的操作
用户区的数据相同，文件描述符表相同
父子进程对变量是不是共享的?
刚开始的时候，是一样的，共享的。如果修改了数据，不共享了。
读时共享(子进程被创建，两个进程没有做任何的写的操作)，写时拷贝

03 GDB多进程调试

使用GDB调试的时候，GDB默认只能跟踪一个进程，可以在fork函数调用之前，通过指令设置GDB调试工具跟踪父进程或者是跟踪子进程，默认跟踪父进程。

设置调试父进程或者子进程：set follow-fork-mode [parent (默认) | child]
设置调试模式：set detach-on-fork [on | off]
默认为on，表示调试当前进程的时候，其它的进程继续运行，如果为off，调试当前进程的时候，其它进程被GDB挂起。
查看调试的进程: info inferiors
切换当前调试的进程: inferior id
使进程脱离GDB 调试: detach inferiors id

exec函数族

01 exec函数族介绍

exec函数族的作用是根据指定的文件名找到可执行文件，并用它来取代调用进程的内容，换句话说，就是在调思进程内部执行一个可执行文件。
exec函数族的函数执行成功后不会返回，因为调用进程的实体，包括代码段，数据段和堆栈等都已经被新的内容取代，只留下进程ID等一些表面上的信息仍保持原样，颇有些神似“三十六计”中的“金蝉脱壳”。看上去还是旧的躯壳，却已经注入了新的灵魂。只有调用失败了，它们才会返回-1，从原程序的调用点接着往下执行。

02 exec函数族作用图解

03 exec函数族

// 指令 man 3 exec 查看详情

int execl(const char *path, const char *arg, ...);   //常用

#include <unistd. h>
/*
参数：
    path：需要指定的执行的文件的路径或者名称，推荐使用绝对路径
    arg：是执行可执行文件所需要的参数列表
        第一个参数一般没有什么作用，为了方便，一般写的是执行的程序名
        从第二个参数开始往后，就是程序执行所需要的的参数列表。
        参数最后必须以NULL结束(哨兵)
返回值：
    只有当调用失败，才会有返回值，返回-1，并且设置errno
    如果调用成功，没有返回值。因为此时当前进程已经被替换成目标进程了，之前的进程用户区数据已经没了，拿不到返回值
*/

//示例，调用shell命令ps，后面跟上参数aux，并且以NULL结尾，表示参数结。
execl("/bin/ps", "ps", "aux", NULL);        //注意，此时当前进程运行到这行函数后，后面的内容都不会被执行，而是转为执行目标文件，后面的exec函数族函数相同


int execlp(const char *file, const char *arg, ...);   //常用
/*
会到环境变量中查找指定的可执行文件，如果找到了就执行，找不到就执行不成功
参数：
    file：需要执行的可执行文件的文件名。只需要文件名即可，但是需要执行的文件能够通过系统环境变量找到
    arg：是执行可执行文件所需要的参数列表
        第一个参数一般没有什么作用，为了方便，一般写的是执行的程序名
        从第二个参数开始往后，就是程序执行所需要的的参数列表。
        参数最后必须以NULL结束(哨兵)
返回值：
    只有当调用失败，才会有返回值，返回-1，并且设置errno
    如果调用成功，没有返回值。因为此时当前进程已经被替换成目标进程了，之前的进程用户区数据已经没了，拿不到返回值
*/

//示例，调用shell命令ps，后面跟上参数aux，并且以NULL结尾，表示参数结束
execl("ps", "ps", "aux", NULL);


//下面的这些函数不常用，参数path与file的含义与上面相同
//char *const argv[]代表传入的是参数数组，例如 char *argv[] = {"ps", "aux", NULL}，然后将argv作为参数传入函数，注意还是要用NULL结尾。
//char *const envp[]代表传入的是环境变量参数数组
int execle(const char *path, const char *arg, ..., char *const envp[]);

int execv(const char *path, char *const argv[]);

int execvp(const char *file, char *const argv[]);

int execvpe(const char *file, char *const argv[], char *const envp[]);

int execve(const char *filename, char *const argv[]，char *const envp[]);
/*
函数名中除exec的后缀的含义
l (list)          参数地址列表， 以空指针结尾
v (vector)        存有各参数地址的指针数组的地址
p (path)          按PATH环境变量指定的目录搜索可执行文件
e (environment)   存有环境变量字符串地址的指针数组的地址
*/

进程控制

01 进程退出

//进程退出的两个函数
#include <stdlib.h>
void exit(int status);   //标准C库函数
//status参数：是进程退出时的一个状态信息。父进程回收子进程资源的时候可以获取到。

#include <unistd.h>     
void _exit (int status);   //linux系统函数

exit函数比_exit函数多了调用退出处理函数、刷新I/O缓冲关闭文件描述符的操作，因此多使用exit函数。我们可以看到无论是exit函数还是_exit函数，后面都是要进行_exit()系统调用。

printf("hello\n");
printf(world);

在上面的两行代码后调用exit函数与_exit函数有什么区别？exit函数“hello”和“world”都会输出，调用_exit函数只会输出“hello”。这是因为printf有缓冲区，\n有刷新缓冲区的功能，第一个“hello”会直接输出，但是第二个“world”不会直接输出，而是在缓冲区内，当调用exit函数时，刷新缓冲区，“world”输出，而调用_exit函数，不会刷新缓冲区，而是直接结束进程，所以也就不会输出缓冲区内的内容。

02 孤儿进程

父进程运行结束，但子进程还在运行(未运行结束)，这样的子进程就称为孤儿进程(Orphan Process) 。
每当出现一个孤儿进程的时候，内核就把孤儿进程的父进程设置为init ，而init进程会循环地wait()它的已经退出的子进程。这样，当一个孤儿结束其生命周期的时候，init进程就会回收它的资源。因此孤儿进程并不会有什么危害。

有一个程序test.c代码如下

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main()
{
    int pid = fork();
    if(pid > 0)
    {
        printf("i am father, pid : %d", getpid());
    }
    else
    {
        printf("i am child, pid : %d", getpid());
    }
    return 0;
}

编译后运行结果如下图，为什么中间会出现一次“[root@Edu01 linux]#”？

这是因为父进程比子进程先结束，子进程成了孤儿进程，由于父进程的父进程就是当前终端，当父进程结束后，当前终端的进程回收了父进程的资源后就知道我要回到终端了，所以出现了一次“[root@Edu01 linux]#”。那为什么子进程知道要在当前终端输出内容？这是因为子进程是父进程复制的，内核区数据与父进程有一样的地方，所以能够找到当前终端去输出。

03 僵尸进程

每个进程结束之后，都会释放自己地址空间中的用户区数据，内核区的PCB没有办法自己释放掉，需要父进程去释放。
进程终止时，父进程尚未回收，子进程残留资源(PCB)存放于内核中，变成僵尸(Zombie)进程。
僵尸进程不能被kill -9杀死。
这样就会导致一个问题，如果父进程不调用wait() 或waitpid() 的话，那么保留的那段信息就不会释放，其进程号就会一直被占用，但是系统所能使用的进程号是有限的，如果大量的产生僵尸进程，将因为没有可用的进程号而导致系统不能产生新的进程，此即为僵尸进程的危害，应当避免。
僵尸进程解决办法：
（1）改写父进程，在子进程死后要为它收尸。具体做法是接管SIGCHLD信号。子进程死后，会发送SIGCHLD信号给父进程，父进程收到此信号后，执行 waitpid()函数为子进程收尸。这是基于这样的原理：就算父进程没有调用wait，内核也会向它发送SIGCHLD消息，尽管对的默认处理是忽略，如果想响应这个消息，可以设置一个处理函数。
（2）把父进程杀掉。父进程死后，僵尸进程成为"孤儿进程"，过继给1号进程init，init始终会负责清理僵尸进程．它产生的所有僵尸进程也跟着消失。
（3）杀父进程不行的话，就尝试关闭相应终端
（4）重启系统，这也是最常用到方法之一。

04 进程回收

在每个进程退出的时候，内核释放该进程所有的资源、包括打开的文件、占用的内存等。但是仍然为其保留一定的信息，这些信息主要主要指进程控制块PCB的信息(包括进程号、退出状态、运行时间等)。
父进程可以通过调用wait或waitpid得到它的退出状态同时彻底清除掉这个进程。wait()和waitpid() 函数的功能一样，区别在于，wait() 函数会阻塞，waitpid()默认会阻塞，但可以设置不阻塞，waitpid() 还可以指定等待哪个子进程结束。
注意：一次wait或waitpid调用只能清理一个子进程，清理多个子进程应使用循环。

05 退出信息相关宏函数

WIFEXITED(status) 非0，进程正常退出
WEXITSTATUS(status)如果上宏为真，获取进程退出的状态(exit的参数)
WIFSIGNALED(status) 非0，进程异常终止
WTERMSIG(status) 如果上宏为真，获取使进程终止的信号编号
WIFSTOPPED(status) 非0，进程处于暂停状态
WSTOPSIG(status) 如果上宏为真，获取使进程暂停的信号的编号
WIFCONTINUED(status) 非0，进程暂停后已经继续运行

wait函数

pid_t wait(int *wstatus);
功能：等待任意一个子进程结束，如果任意一个子进程结束了，此函数会回收子进程的资源。指令 man 2 wait 查看详情
头文件： #include <sys/types.h>
        #include <sys/wait.h>
参数：int *wstatus。进程退出时的状态信息，传入的是一个int类型的地址，是传出参数。
返回值：
    成功：返回被回收的子进程的id
    失败：-1 (所有的子进程都结束或调用函数失败)
调用wait函数的进程会被挂起(阻塞)，直到它的一个子进程退出或者收到一个不能被忽略的信号时才被唤醒(继续往下执行)
如果没有子进程了，函数立刻返回，返回-1；如果子进程都已经结束了，也会立即返回，返回-1

waitpid函数

pid_t waitpid(pid_t pid, int *wstatus, int options);
功能：回收指定进程号的子进程，可以设置是否阻塞。指令 man 2 waitpid 查看详情
头文件： #include <sys/types.h>
        #include <sys/wait.h>
参数：
    pid：
        pid > 0 ：回收进程号为pid的子进程
        pid = 0 ：回收当前进程组的所有子进程，一般父进程产生的子进程也不会给其他进程组，所以有时0也代表回收所有子进程
        pid = -1 ：回收所有的子进程，相当于wait()，常用
        pid < -1 ：pid的绝对值代表某个进程组的id，回收该进程组中的所有子进程
    int *wstatus：进程退出时的状态信息，传入的是一个int类型的地址，是传出参数。
    options：设置阻塞或者非阻塞
        0 ：阻塞
        WNOHANG ：非阻塞
返回值：
> 0 ：返回子进程的id
= 0 ：只有options=WNOHANG时才会返回0，表示还有子进程活着
= -1 ：出现错误，或者没有子进程了

posted @ 2022-09-15 00:25 小肉包i 阅读(69) 评论(0) 收藏举报

刷新页面返回顶部