Linux内核分析——进程的描述和进程的创建

　　　　　　　　　　　　　　进程的描述和进程的创建

一、进程的描述

（一）进程控制块PCB——task_struct

1、操作系统的三大管理功能包括：

　　（1）进程管理

　　（2）内存管理

　　（3）文件系统

2、PCB task_struct中包含：

　　（1）进程状态

　　（2）进程打开的文件

　　（3）进程优先级信息

3、通过唯一的进程标识PID来区别每个进程。

4、进程控制块PCB——task_struct

5、进程状态

　　（1）创建新进程后实际的状态是TASK_RUNNING，就绪但是没有运行，调度器选择一个task之后进入运行态，也叫TASK_RUNNING。

　　（2）当进程是TASK_RUNNING时，代表这个进程是可运行的，至于它有没有真的在运行，取决于它有没有获得cpu的控制权，即有没有在cpu上实际的运行。

　　（3）一个正在进行的进程调用do_exit()，进入TASK_ZOMBIE，进程被终止，“僵尸进程”。

　　（4）等待特定时间或者资源的时候，进入阻塞态，如果条件满足就进入就绪态，被选择后进入运行态。

6、理解task_struct数据结构

　　（1）进程的标示pid

　　（2）为了对给定类型的进程进行有效的搜索，内核维护了几个进程链表。

　　（3）所有进程链表struct list_head tasks

7、CPU相关的状态

二、进程的创建

（一）进程的创建概览及fork一个进程的用户态代码

1、fork一个子进程的代码：

#include <stdio.h>

#include <stdlib.h>

#include <unistd.h>

int main(int argc, char * argv[])

{

int pid;

/* fork another process */

pid = fork();

if (pid < 0)

{

/* error occurred */

fprintf(stderr,"Fork Failed!");

exit(-1);

}

else if (pid == 0)

{

/* child process */

printf("This is Child Process!\n");

}

else

{

/* parent process */

printf("This is Parent Process!\n");

/* parent will wait for the child to complete*/

wait(NULL);

printf("Child Complete!\n");

}

　　（1）fork()系统调用从内核返回两次：一次回到父进程，另一次回到新产生的子进程。

　　（2）fork()实际上是由clone()系统调用实现的。

（二）理解进程创建过程复杂代码的方法

1、调用fork的过程：

（三）创建一个新进程在内核中的执行过程

fork、vfork和clone三个系统调用都可以创建一个新进程，而且都是通过调用do_fork来实现进程的创建；
Linux通过复制父进程来创建一个新进程，那么这就给我们理解这一个过程提供一个想象的框架：

复制一个PCB——task_struct

err = arch_dup_task_struct(tsk, orig);

要给新进程分配一个新的内核堆栈

ti = alloc_thread_info_node(tsk, node);
tsk->stack = ti;
setup_thread_stack(tsk, orig); //这里只是复制thread_info，而非复制内核堆栈

要修改复制过来的进程数据，比如pid、进程链表等等都要改改吧，见copy_process内部。

从用户态的代码看fork();函数返回了两次，即在父子进程中各返回一次，父进程从系统调用中返回比较容易理解，子进程从系统调用中返回，那它在系统调用处理过程中的哪里开始执行的呢？这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题，这是在哪里设定的？copy_thread in copy_process

*childregs = *current_pt_regs(); //复制内核堆栈
childregs->ax = 0; //为什么子进程的fork返回0，这里就是原因！
p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶
p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址

新进程执行起点：return_from_fork，只复制了内核堆栈一部分，int指令和save_all压到内核栈的内容，参数、系统调用号等都进行压栈。

（四）使用gdb跟踪创建新进程的过程

1、准备工作：

　　rm menu -rf

　　git clone http://github.com/mengning/menu.git //更新Menu

　　cd menu

　　mv test_fork.c test.c //把test.c覆盖掉

　　make rootfs

2、进行gdb调试：

　　qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S

　　gdb

　　file linux-3.18.6/vmlinux

　　target remote:1234

　　// 设置断点

　　b sys_clone //因为fork实际上是执行的clone

　　b do_fork

　　b dup_task_struct

　　b copy_process

　　b copy_thread

　　b ret_from_fork

　　tsk->stack = ti; //把内核堆栈的地址赋给它

　　sturct pt_regs *childregs = task_pg_regs(p); //把内核堆栈压栈的空间地址找到，初始化。

　　*childregs = *current_pt_regs();

　　childregs->ax = 0; //把当前进程的内核堆栈的压的寄存器赋值到子进程中来。

　　p->thread.ip = (unsigned long) ret_from_fork; //设置子进程被调度的ip，即子进程的起点

　　jmp syscall_exit; //这之后就跟踪不到了。

三、总结

　　进程就是处于执行期的程序；进程就是正在执行的程序代码的实时结果；进程是处于执行期的程序以及相关的资源的总称。

进程在创建它的时刻开始存活。在Linux系统中，这通常是调用fork()系统的结果。fork()系统调用从内核返回两次：一次回到父进程，另一次回到新产生的子进程。它实际上是由clone()系统调用实现的。

posted @ 2016-04-03 13:18 20135235马悦阅读(444) 评论(0) 收藏举报

刷新页面返回顶部

Linux内核分析——进程的描述和进程的创建

公告