fork、父进程和子进程

进程

什么是进程？进程是一个运行中的程序实体，拥有独立的堆栈、内存空间和逻辑控制流。

这是标准的进程概念。让我们通过操作系统的fork函数看看这个抽象的概念是怎么在进程的实现中体现出来的。

构成要素

创建一个进程，需要进程体、进程表和数据空间。

进程体在C代码中对应一个函数，编译成二进制代码后就是一组指令。

进程表用来记录进程的进程ID、进程名称、寄存器快照空间。简单说，当中断发生时，会保存此刻CPU的状态，然后记录到进程表中。

进程表的作用就是用来存储进程快照。

进程堆栈的作用是什么？存储进程中函数的参数，存储进程运行过程中的局部数据。

数据空间呢？先看一段简单的代码。

char *f(int a, int b);

int main(int argc, char **argv)
{
  	f(5, 6);
  
  	return 0;
}

char *f(int a, int b)
{
  	int c = a + b;
  	char *str = "Hello, World!";
  	return str;
}

两个参数a和b存储在进程的堆栈中。
指针char *str指向的内存中的数据STR存储在进程的数据空间中。

为什么STR不是存储在进程的堆栈中呢？

函数f的返回值是STR的内存地址。执行这段代码，我们会发现：调用函数f能正确获得STR。

试想一下，假如STR存储在进程的堆栈中，当f执行结束后，堆栈中的数据会被清空，我们调用函数f是不能正确获得STR的。

STR存储在进程的数据空间中，存储在进程堆栈中的只是存储STR的内存空间的内存地址。

fork

进程A调用fork新建进程B，A是B的父进程，B是A的子进程。

fork执行结束后，如果能成功创建B进程，B进程的数据空间、堆栈和进程表和A进程的这些要素完全相同。

差异

B进程毕竟是不同于A进程的独立进程，所以：

B进程的数据空间中的数据和A进程的数据空间的数据一致，但是，两个进程的数据空间却是不同的内存空间。
B进程表中，指向LDT的选择子和A进程表中的LDT选择子不同。
B进程表中的进程ID和A进程表中的进程ID不同。

堆栈

猜猜看，子进程的堆栈是在进程表中还是在数据空间中？

回答是：在进程的数据空间中。

在前面，我们虽然把堆栈和数据空间分开说，那是为了强调两个要素在保存数据时的差异。堆栈中的数据随时变化，例如，进程中的一个函数执行结束，堆栈中的数据就会发生变化。

进程的数据空间呢？我以为，当进程结束执行的时候，进程的数据空间中的数据才会消失。这是我的猜测，暂时不知道怎么去验证。

认为堆栈保存在数据空间中的依据是什么？因为寄存器ss中的选择子指向的描述符描述的那段内存空间就是数据空间。

进程的ds、es、ss的选择子相同，指向相同的数据空间。

LDT、GDT和LDT选择子

每个进程都有一个LDT。LDT存储在进程的进程表中。

在进程的进程表中，有一个LDT选择子。根据LDT选择子，能从GDT中找到指向LDT的描述符。

有点绕。连起来再说一次：通过进程表中的LDT选择子，从GDT中找到指向LDT的描述符，根据描述符找到LDT，LDT也在进程表中。

我的收获

进程的堆栈存储在进程的数据空间中。
堆栈是动态变化的，例如进程中的一个函数执行结束。堆栈中的数据容易消失，所以不能函数的返回值不能是指向堆栈的内存地址。
在函数中创建字符串变量、结构体变量，数据存储在进程的数据空间中，存储在堆栈中的只是数据的内存地址。
每个进程的堆栈栈顶可以是相同的。我的操作系统在初始化进程时，之所以使用不同的堆栈栈顶，是因为我的操作系统没有开启虚拟内存地址，使用的是相同的内存空间。如果使用相同的堆栈栈顶，不同进程的堆栈会相互覆盖。
fork的实现：
1. 子进程复制父进程的进程表，但是要使用不同的LDT选择子。
2. 子进程要复制父进程的数据空间，同时要修改子进程的LDT。

posted @ 2021-07-23 21:44 东小夫阅读(879) 评论(0) 收藏举报

刷新页面返回顶部

fork、父进程和子进程

进程

构成要素

fork

差异

堆栈

LDT、GDT和LDT选择子

我的收获

公告