Linux进程启动过程简析

Posted on 2015-04-12 02:49 闪之剑圣阅读(3017) 评论(0) 收藏举报

朱宇轲 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

今天，我们将通过阅读linux的内核代码来对linux系统中进程的创建过程进行简单的分析。

大家都知道，linux通过进程控制块PCB来对进程进行控制和管理，它存放了进程的数据。在linux中，PCB的代码如下（当然是节选的==）：

struct task_struct {
    volatile long state;//进程状态    
    void *stack;//进程堆栈指针
    atomic_t usage;
    unsigned int flags;
    unsigned int ptrace;
...
    //一些记录优先级的变量
    int prio, static_prio, normal_prio;
    unsigned int rt_priority;
    const struct sched_class *sched_class;
    struct sched_entity se;
    struct sched_rt_entity rt;
...
    //进程链表
    struct list_head tasks;
#ifdef CONFIG_SMP
    struct plist_node pushable_tasks;
    struct rb_node pushable_dl_tasks;
#endif
    //pid号
    pid_t pid;
    pid_t tgid;
...
    //父进程以及子进程
    struct task_struct __rcu *real_parent;
    struct task_struct __rcu *parent; 

    struct list_head children;    
    struct list_head sibling;
    struct task_struct *group_leader;
...
};

　　可以看到，PCB中记录了进程的ID号、优先级、状态、与其他进程关系等信息，操作系统由此对进程进行管理。

　　需要注意的是，在操作系统内核的具体实现中，是将当前的进程全部存入到一个循环链表中来进行管理的。如下图所示：

具体的实验则是利用gdb调试进程创建的函数，实验截图如下：

此次我们在6个函数（or 系统调用）处设置了断点：

1.sys_clone
2.do_fork
3.dup_task_struct
4.copy_process
5.copy_thread
6.ret_from_fork

在实验楼所使用的虚拟系统中，进程创建的底层函数是sys_clone，而sys_clone实际上调用的是do_fork，因此可以说do_fork才是真正实现了创建进程细节的函数。

long do_fork(unsigned long clone_flags,
          unsigned long stack_start,
          unsigned long stack_size,
          int __user *parent_tidptr,
          int __user *child_tidptr)
{
    struct task_struct *p;
    int trace = 0;
    long nr;

    ......

    p = copy_process(clone_flags, stack_start, stack_size,
             child_tidptr, NULL, trace);
    ......
}

　在这个函数里，p是记录了新的进程的PCB的变量，通过copy_process,系统将父进程的PCB拷贝并修改到子进程中。

copy_process函数则是首先利用dup_task_struct将父进程的PCB全盘拷贝，之后再具体修改与父进程不同的子部分。

static struct task_struct *copy_process(unsigned long clone_flags,
                    unsigned long stack_start,
                    unsigned long stack_size,
                    int __user *child_tidptr,
                     struct pid *pid,
                    int trace)
{
    int retval;
    struct task_struct *p;

    //拷贝父进程的PCB
    p = dup_task_struct(current);
    if (!p)
        goto fork_out;

    //修改具体的部分结构
    p->flags &= ~(PF_SUPERPRIV | PF_WQ_WORKER);
    p->flags |= PF_FORKNOEXEC;
    INIT_LIST_HEAD(&p->children);
    INIT_LIST_HEAD(&p->sibling);
    rcu_copy_process(p);
    p->vfork_done = NULL;
    spin_lock_init(&p->alloc_lock);
...
retval=copy_thread(clone_flags,stack_start,stack_size,p);
}

　　需要注意的是，在copy_process函数中有一个copy_thread函数，在它的函数实现中，将创建的子进程的栈底空间找到，并根据此修改了子进程的ip和sp数据：sp指向栈底，而ip指向ret_from_fork段。那ret_from_fork段又是什么呢，它其实就是下面一段代码：

ENTRY(ret_from_fork)
    CFI_STARTPROC
    pushl_cfi %eax
    call schedule_tail
    GET_THREAD_INFO(%ebp)
    popl_cfi %eax
    pushl_cfi $0x0202        # Reset kernel eflags
    popfl_cfi
    jmp syscall_exit
    CFI_ENDPROC
END(ret_from_fork)

　　可以看到，它最终跳转到了syscall_exit，而syscall_exit就是我们上次分析的中断处理程序sys_call中的代码。这样，sp指向的实际是我们触发终端后存储的上下文的那块儿堆栈，ip则指向syscall_eixt，当新的进程创建时，它会首先执行syscall_exit处的代码，不久就会遇到Restore_All，恢复上下文环境，新的进程得以执行。

总结：

　　在linux内核中，创建新的进程时，基本思路是复制父进程的PCB给子进程，如果有不同的数据再进行调整。同时，将子进程执行的第一条命令指向中断恢复的代码，从而实现创建新进程的效果。

刷新页面返回顶部

八叶一刀·无仞剑

导航

公告

Linux进程启动过程简析