2020-2021-1 20209317《Linux内核原理与分析》第七周作业

《linux内核原理与分析》第七周作业


这个作业属于哪个课程	2020-2021-1 Linux内核原理与分析
这个作业要求在哪里	2020-2021-1Linux内核原理与分析第七周作业
这个作业的目标	了解linux中进程是如何被创建的以及进程在内核中是如何被描述的
作业正文	本博客链接

《linux内核原理与分析》第七周作业
一、实验相关
- 1、跟踪分析进程创建的完整过程
- 2、分析fork执行过程
二、学习收获

一、实验相关

1、跟踪分析进程创建的完整过程

首先给MenuOS添加一个fork命令，该命令调用了linux内核中的fork系统调用，添加后结果如下：

然后使用gdb跟踪fork系统调用的执行过程，如下图：

执行如下代码添加断点：

b sys_clone
b do_fork
b dup_task_struct
b copy_process
b copy_thread
b ret_from_fork

如图可以看到fork函数的执行过程，首先执行sys_clone函数，这个函数是宏命令，无法查看具体内容
接下来依次执行执行do_fork函数、dup_task_struct函数、copy_process函数、copy_thread函数、ret_from_fork函数，其函数体实现如下图：

2、分析fork执行过程

通过linux-3.18.6/kernel/fork.c中的fork函数代码，可以看出，fork、vfork和clone都可以创建一个新进程，而且都是通过do_fork函数来创建进程的。
查看源码中的do_fork函数，函数有5个参数：

clone_flags：子进程创建相关标志，通过此标志可以对父进程的资源进行有选择的复制
stack_start：子进程用户态堆栈的地址
regs：指向pt_regs结构体的指针
stack_size：用户态站的大小，通常是不必要的，被设置为0
parent_tidptr和child_tidptr：父进程子进程用户台下的pid地址

do_fork主要完成了调用copy_process复制父进程信息、获得pid、调用wake_ip_new_task将子进程加入调度器队列等待获得分配CPU资源运行、通过clone_flags标志做一些辅助工作，其中copy_process是创建一个进程内容的主要代码。接下来分析copy_process函数是如何复制父进程的。
copy_process函数主要完成了调用dup_task_struct复制当前进程（父进程）描述符task_struct、信息检查、初始化、把进程状态设置为TASK_RUNNING（此时子进程置为就绪态）、采用写时复制技术之一复制所有其他进程资源、调用copy_thread初始化子进程内核栈、设置子进程pid等。其中最关键的就是dup_task_struct复制当前进程描述符task_struct和copy_thread初始化子进程内核栈。
duo_task_struct函数中位子进程分配好了内核栈，copy_thread真正完成内核栈关键信息的初始化。
这些工作都完成后，如果创建的是内核线程则从ret_from_kernel_thread执行返回，如果是用户态进程，则从ret_from_frok返回。

二、学习收获

1、操作系统原理中进程状态与实际内核中运行状态的不同

在操作系统原理中，会将进程分为创建、就绪、执行、阻塞、终结五个状态，但通过本章的学习，发现在实际的linux内核中，进程创建之后就处于就绪态，内核讲就绪态与运行态的进程状态都表示为TASK_RUNNING，就绪态和运行态的区别就是是否占用CPU，占用CPU的就绪态进程就是运行态。在内核中，阻塞态也细分为不同的阻塞状态，TASK_INTERRUPIBLE和TASK_UNINTERRUPTIBLE是其中的两个状态，两者的区别是前一个可以被信号和wake_up唤醒，而后者只能被wake_up唤醒。

2、linux进程状态学习

经过查阅资料，了解到linux中进程有以下状态

R (TASK_RUNNING)，可执行状态。只有在该状态的进程才可能在CPU上运行。而同一时刻可能有多个进程处于可执行状态，这些进程的task_struct结构（进程控制块）被放入对应CPU的可执行队列中（一个进程最多只能出现在一个CPU的可执行队列中）。进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。很多操作系统教科书将正在CPU上执行的进程定义为RUNNING状态、而将可执行但是尚未被调度执行的进程定义为READY状态，这两种状态在linux下统一为 TASK_RUNNING状态。
S (TASK_INTERRUPTIBLE)，可中断的睡眠状态。处于这个状态的进程因为等待某某事件的发生（比如等待socket连接、等待信号量），而被挂起。这些进程的task_struct结构被放入对应事件的等待队列中。当这些事件发生时（由外部中断触发、或由其他进程触发），对应的等待队列中的一个或多个进程将被唤醒。
D (TASK_UNINTERRUPTIBLE)，不可中断的睡眠状态。与TASK_INTERRUPTIBLE状态类似，进程处于睡眠状态，但是此刻进程是不可中断的。不可中断，指的并不是CPU不响应外部硬件的中断，而是指进程不响应异步信号。
T (TASK_STOPPED or TASK_TRACED)，暂停状态或跟踪状态。向进程发送一个SIGSTOP信号，它就会因响应该信号而进入TASK_STOPPED状态（除非该进程本身处于TASK_UNINTERRUPTIBLE状态而不响应信号）。（SIGSTOP与SIGKILL信号一样，是非常强制的。不允许用户进程通过signal系列的系统调用重新设置对应的信号处理函数。）向进程发送一个SIGCONT信号，可以让其从TASK_STOPPED状态恢复到TASK_RUNNING状态。
Z (TASK_DEAD - EXIT_ZOMBIE)，退出状态，进程成为僵尸进程。进程在退出的过程中，处于TASK_DEAD状态。在这个退出过程中，进程占有的所有资源将被回收，除了task_struct结构（以及少数资源）以外。于是进程就只剩下task_struct这么个空壳，故称为僵尸。
X (TASK_DEAD - EXIT_DEAD)，退出状态，进程即将被销毁。而进程在退出过程中也可能不会保留它的task_struct。比如这个进程是多线程程序中被detach过的进程（进程？线程？参见《linux线程浅析》）。或者父进程通过设置SIGCHLD信号的handler为SIG_IGN，显式的忽略了SIGCHLD信号。（这是posix的规定，尽管子进程的退出信号可以被设置为SIGCHLD以外的其他信号。）此时，进程将被置于EXIT_DEAD退出状态，这意味着接下来的代码立即就会将该进程彻底释放。所以EXIT_DEAD状态是非常短暂的，几乎不可能通过ps命令捕捉到。

3、进程状态切换

一个进程在运行期间，不断地从一种状态转换到另一种状态，它可以多次处于就绪状态和执行状态，也可以多次处于阻塞状态。
　(1) 就绪→执行
处于就绪状态的进程，当进程调度程序为之分配了处理机后，该进程便由就绪状态转变成执行状态。
　(2) 执行→就绪
处于执行状态的进程在其执行过程中，因分配给它的一个时间片已用完而不得不让出处理机，于是进程从执行状态转变成就绪状态。
　(3) 执行→阻塞
正在执行的进程因等待某种事件发生而无法继续执行时，便从执行状态变成阻塞状态。
　(4) 阻塞→就绪
处于阻塞状态的进程，若其等待的事件已经发生，于是进程由阻塞状态转变为就绪状态。
具体的状态转换如下图：

4、进程的pid和tgid

每个进程都有自己的pid，每个线程都有自己的线程id（pthread_t类型)，但这是在用户空间的层面。而在内核层面中，线程其实也是进程。为了更好地区分这些概念，我们用任务task来指代内核中的进程概念，而依旧用进程来指定用户空间层面的进程。所以当说起task的时候，指的是内核层面，而当说起进程的时候，指的就是用户空间层面的。
回到刚才说的地方，每个线程都是一个task，所以每个线程都有自己的一份struct task_sruct，而且每个线程都有自己独特的pid。那内核通过什么来知道这个线程属于哪个进程呢？答案是task_sruct.tgid。是的，一个进程就是一个线程组，所以每个进程的所有线程都有着相同的tgid。
当程序开始运行时，只有一个主线程，这个主线程的tgid就等于pid。而当其他线程被创建的时候，就继承了主线程的tgid。这样，内核就可以通过tgid知道某个task属于哪个线程组，也就知道属于哪个进程了。当我们用ps命令或者getpid()等接口查询进程id时，内核返回给我们的也正是这个tgid。

posted @ 2020-11-17 21:26 20209317李明帅阅读(134) 评论(0) 收藏举报

刷新页面返回顶部

20209317李明帅