2020-2021-1 20209323《Linux内核原理与分析》第七周作业

这个作业属于哪个课程 2020-2021-1 Linux内核原理与分析
这个作业要求在哪里 2020-2021-1Linux内核原理与分析第七周作业
这个作业的目标 进程的描述和进程的创建
作业正文 本博客链接

进程的描述

1、操作系统内核实现操作系统的三大管理功能

  • 进程管理(进程,最核心,用进程控制块PCB描述进程)
  • 内存管理(虚拟内存)
  • 文件系统(文件)

2、Linux内核描述进程

在Linux内中用一个数据结构struct task_struct来描述进程,以下是其数据结构的一部分:

struct task_struct { 
 volatile long state;        //进程状态
 void *stack;                // 指定进程内核堆栈
 pid_t pid;                  //进程标识符
 unsigned int rt_priority;   //实时优先级
 unsigned int policy;        //调度策略
 struct files_struct *files; //系统打开文件
 ...
}

3、Linux内核管理的进程状态转换

  当使用fork()系统调用来创建一个新进程时,新进程的状态TASK_RUNNING(就绪态,但是没有运行)。当调度器选择这个新创建的进程运行时,新创建的进程就切换到运行态,它也是TASK_RUNNING。在Linux内核中,当进程是TASK_RUNNING状态时,它是可运行的,也就是就绪态,是否在运行取决于它有没有获得CPU的控制权,也就是说这个进程有没有在CPU中去实际执行,如果实际执行了,那进程状态就是运行态;如果被内核调度出去了,在等待队列里就是就绪态。对于一个正在运行的进程,调用用户态库函数exit()会陷入内核执行该内核函数do_exit(),也就是终止进程,那么会进入TASK_ZOMBIE状态,即进程的终止状态。TASK_ZOMBIE状态一般叫作僵尸进程,Linux内核会在适当的时候把僵尸进程给处理掉,处理掉之后进程描述符被释放了,该进程才从Linux中消失。一个正在运行的进程在等待特定的事件或资源时会进入阻塞态,阻塞态有两种:TASK_INTERRUPTIBLE和TASK_UNINTERRUPTIBLE,前者可以被信号和wake_up()唤醒的,后者只能被wake_up()唤醒。

4、进程的双向链表

 struct list_head tasks 把所有的进程用双向链表链起来,这个数据结构十分重要。下图为进程的双向链表示意图:

进程的创建

1、0号进程的初始化

  从上图的双向链表示意图中可见,init_task为双向链表的第一个节点。init_task为第一个进程(0号进程)的进程描述符结构体变量,它的初始化是通过硬编码方式固定下来的。除此之外,所有的其他进程的初始化都是通过do_fork复制父进程的方式初始化的。

2、进程之间的父子、兄弟关系

  进程描述符通过struct list_head tasks双向链表来管理所有进程,但涉及将进程之间的父子、兄弟关系记录管理起来,需要用进程描述符struct task_struct数据结构表示。此数据结构记录了当前进程的父进程real_parent、parent,记录当前进程的子进程的是双向链表 struct list_head children;记录当前进程的兄弟进程的是双向链表 struct list_head sibling。

struct task_struct __rcu *real_parent;//当前进程的父进程
struct task_struct __rcu *parent;
struct list_head children;//当前进程的子进程
struct list_head sibling;//当前进程的兄弟进程
#每一个进程是一些进程组的成员之一,进程组都有一个进程组长(group leader)。进程组的所有 IO 输入输出都会引导到进程组长进程那里去。
#当一个进程被创建时,父进程的进程组长也看作是子进程的进程组长。系统初始化的时候,init 进程既是它自己的进程组长,同时也是其他所有进程的进程组长。
struct task_struct *group_leader;

3、保存进程上下文中CPU相关的一些状态信息的数据结构

 struct thread_struct thread ,此结构体主要保存进程上下文中CPU相关的状态。其中,最重要的是sp和ip。sp用来保存进程上下文中ESP寄存器的状态,ip用来保存进程上下文中EIP寄存器的状态。

4、进程的状态过程分析

  • fork,vfork,clone 都是通过do_fork()函数创建进程

  • fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程

  • fork()函数最大的特点就是被调用一次,返回两次

  利用fork()系统调用来创建新进程,把当前进程的描述符等相关进程资源复制一份,从而产生一个子进程,并根据子进程的需要对复制的进程描述符做一些修改,然后把创建好的子进程放入运行队列。在进程调度时,新创建的子进程处于就绪状态有机会被调度执行。

 #include <stdio.h>
 #include <stdlib.h>
 #include <unistd.h>
 int main(int argc, char * argv[])
 {
     int pid;
     /* fork another process */
     pid = fork();
     if (pid < 0) 
     { 
         /* error occurred */
         fprintf(stderr,"Fork Failed!");
         exit(-1);
     } 
     else if (pid == 0) 
     {
         /* child process */
         printf("This is Child Process!\n");
     } 
     else 
     {  
         /* parent process  */
         printf("This is Parent Process!\n");
         /* parent will wait for the child to complete*/
         wait(NULL);
         printf("Child Complete!\n");
     }
 }

  上面的代码中,else if(pid == 0)和else两段代码都被执行了,原因是因为fork系统调用把当前进程复制了一个子进程,即一个进程变成两个进程,两个进程执行相同的一段代码,但由于父进程和子进程的返回值可能不同,所以输出的信息可能不同,父进程并没有打破if else的条件分支的结构,且父子进程的执行顺序并不确定。

5、进程创建过程中的重要函数或数据结构

  • do_fork():主要完成调用copy_process()复制父进程信息、获得pid、调用wake_up_new_task将子进程加入调度器队列等待获得分配CPU资源运行、通过clone_flags标志做一些辅助工作。
  • copy_process():主要完成调用dup_task_struct复制当前进程(父进程)描述符task_struct、信息检查、初始化、把进程状态设置为TASK_RUNNING(就绪态)、采用写时复制技术逐一复制所有其他进程资源、调用copy_thread初始化子进程内核栈、设置子进程pid等。
  • dup_task_struct():复制当前进程(父进程)描述符task_struct和copy_thread初始化子进程内核栈。
  • thread_info:小型的进程描述符,占据连续的两个页框,通过task指针指向进程描述符。内核栈有高地址到低地址增长,thread_info结构有低地址到高地址增长。
  • copy_thread():完成内核栈关键信息的初始化。如果创建的是内核线程,则子进程开始执行的起点是ret_from_kernel_thread;如果创建的是用户态进程,则子进程开始执行的起点是ret_from_fork。

通过实验跟踪分析进程创建的过程

实验方法与上次实验类似,首先删除并克隆一份新的menu,然后将test.c覆盖掉,因为之前用过test.c可能会有影响。进入menu执行make rootfs,命令如下:

cd LinuxKernel
rm -rf menu
git clone https://github.com/mengning/menu.git
cd menu
make rootfs

设置断点,随后用GDB调试

b sys_clone
b do_fork
b dup_task_struct
b copy_process
b copy_thread
b ret_from_fork

总结

  创建一个进程是复制当前进程的信息,就是fork一个进程,这样就创建了一个新进程,因为父进程和子进程的绝大部分信息是完全一致的,但是有些信息是不能一样的,你如pid的值和内核堆栈。还有将新进程连接到各种链表中,要保存进程执行到哪个位置,有一个thread数据结构记录ip和sp等信息也不能一样,否则将会发生问题。父进程创建一个子进程,应该会有一个地方复制了父进程的进程描述符Task_struct结构体变量,并有很多地方来修改复制出来的进程描述符结构体变量。因为父子进程各自都有很多自己独立的个性,子进程应该有很多地方修改内核堆栈里的信息,因为内核兑换赞里的很多数据是从父进程复制来的,而fork系统调用在父子进程中分别返回到用户态,父子进程的内核堆栈中可能某些信息也不完全一样。还有thread,根据子进程复制的父进程的内核堆栈的状况,肯定要设定好EIP和ESP寄存器,即设定好子进程开始执行的位置,复制父进程的资源不需要修改进程资源,父子进程是共享内存存储空间的。

posted @ 2020-11-19 19:53  qingyu_sun  阅读(144)  评论(0编辑  收藏  举报