理解进程调度时机跟踪分析进程调度与进程切换的过程

“平安的祝福 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ”

1.理解Linux系统中进程调度的时机,看都是哪里调用了schedule()

  • 进程上下文包含了进程执行需要的所有信息

    • 用户地址空间: 包括程序代码,数据,用户堆栈等

    • 控制信息 :进程描述符,内核堆栈等

    • 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同)

  • Linux系统的一般执行过程

    最一般的情况:正在运行的用户态进程X切换到运行用户态进程Y的过程

    1. 正在运行的用户态进程X

    2. 发生中断——save cs:eip/esp/eflags(current) to kernel stack,then load cs:eip(entry of a specific ISR) and ss:esp(point to kernel stack).

    3. SAVE_ALL //保存现场

    4. 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换

    5. 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)

    6. restore_all //恢复现场
    7. iret - pop cs:eip/ss:esp/eflags from kernel stack

    8. 继续运行用户态进程Y

  •  

  • 几种特殊情况

    通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;

  • 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,与最一般的情况略简略;

  • 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;

  • 加载一个新的可执行程序后返回到用户态的情况,如execve;

2.分析一个schedule()函数

  • schedule()函数选择一个新的进程来运行,并调用context_switch进行上下文的切换,这个宏调用switch_to来进行关键上下文切换

        schedule() --> context_switch() --> switch_to  --> __switch_to()

    • next = pick_next_task(rq, prev);//进程调度算法都封装这个函数内部
    • context_switch(rq, prev, next);//进程上下文切换
    • switch_to利用了prev和next两个参数:prev指向当前进程,next指向被调度的进程

    • #define switch_to(prev, next, last)                    \
      do {                                    \
          /*                                \
           * Context-switching clobbers all registers, so we clobber    \
           * them explicitly, via unused output variables.        \
           * (EAX and EBP is not listed because EBP is saved/restored    \
           * explicitly for wchan access and EAX is the return value of    \
           * __switch_to())                        \
           */                                \
          unsigned long ebx, ecx, edx, esi, edi;                \
                                          \
          asm volatile("pushfl\n\t"        /* save    flags */    \
                   "pushl %%ebp\n\t"        /* save    EBP   */    \
                   "movl %%esp,%[prev_sp]\n\t"    /* save    ESP   */ \
                   "movl %[next_sp],%%esp\n\t"    /* restore ESP   */ \
                   "movl $1f,%[prev_ip]\n\t"    /* save    EIP   */    \
                   "pushl %[next_ip]\n\t"    /* restore EIP   */    \
                   __switch_canary                    \
                   "jmp __switch_to\n"    /* regparm call  */    \
      /*
      这里,如果之前B也被switch_to出去过,那么[next_ip]里存的就是下面这个1f的标号,但如果进程B刚刚被创建,之前没有被 switch_to出去过,
      那么[next_ip]里存的将是ret_ftom_fork(参看copy_thread()函数)。
      这就是这里为什么不用 call __switch_to而用jmp,因为call会导致自动把下面这句话的地址(也就是1:)压栈,
      然后__switch_to()就必然只能ret到这 里,而无法根据需要ret到ret_from_fork。
      
          另外请注意,这里__switch_to()返回时,将返回值prev_A又写入了%eax,这就使得在switch_to宏里面eax寄存器始终保存的 是prev_A的内容,或者,
      更准确的说,是指向A进程描述符的“指针”。
      */ "1:\t" \ "popl %%ebp\n\t" /* restore EBP */ \//如果从__switch_to()返回后从这里继续运行,那么说明在此之前B肯定被switch_to调出过,因此此前肯定备份了ebp_B和flags_B,这里执行恢复操作。 "popfl\n" /* restore flags */ \ \ /* output parameters */ \ : [prev_sp] "=m" (prev->thread.sp), \ [prev_ip] "=m" (prev->thread.ip), \ "=a" (last), \ \ /* clobbered output registers: */ \ "=b" (ebx), "=c" (ecx), "=d" (edx), \ "=S" (esi), "=D" (edi) \ \ __switch_canary_oparam \ \ /* input parameters: */ \ : [next_sp] "m" (next->thread.sp), \ [next_ip] "m" (next->thread.ip), \ \ /* regparm parameters for __switch_to(): */ \ [prev] "a" (prev), \ [next] "d" (next) \ \ __switch_canary_iparam \ \ : /* reloaded segment registers */ \ "memory"); \ } while (0)

       

这里面,schedule是主调度函数,涉及到一些调度算法,这里不讨论。当schedule()需要暂停A进程的执行而继续B进程的执行时,就发生了进 程之间的切换。进程切换主要有两部分:1、切换全局页表项;2、切换内核堆栈和硬件上下文。这个切换工作由context_switch()完成。其中 switch_to和__switch_to()主要完成第二部分。更详细的,__switch_to()主要完成硬件上下文切换,switch_to主 要完成内核堆栈切换。

    阅读switch_to时请注意:这是一个宏,不是函数,它的参数prev, next, last不是值拷贝,而是它的调用者context_switch()的局部变量。局部变量是通过%ebp寄存器来索引的,也就是通过n(%ebp),n是编译时决定的,在不同的进程的同一段代码中,同一局部变量的n是相同的。在switch_to中,发生了堆栈的切换,即ebp发生了改变,所以要格外留意在任一时刻的局部变量属于哪一个进程。关于__switch_to()这个函数的调用,并不是通过普通的call来实现,而是直接jmp,函数参数也并不是通过堆栈来传递,而是通过寄存器来传递。

 

注意:

    这些代码是所有进程共用的,代码本身不属于某一个特定的进程,所以判定当前在哪一个进程不是通过看执行的代码是哪个进程的,而是通过esp指向哪个进程的 堆栈来判定的。所以,对于上面图中的切换点也可以这样理解,在这一点处,esp指向了其它进程的堆栈,当前进程即被挂起,等待若干时间,当esp指针再次 指回这个进程的堆栈时,这个进程又重新开始运行。

 3.实验

设置断点

进入schedule

进入context_switch

进入switch_to

参考文献

http://www.cnblogs.com/visayafan/archive/2011/12/10/2283660.html

posted @ 2015-04-25 12:38  pingandezhufu  阅读(373)  评论(0编辑  收藏  举报