2019-2020-1 20199319《Linux内核原理与分析》第九周作业

进程的切换和系统的一般执行过程

进程调度的时机

1、中断:起到切出进程指令流的作用。中断处理程序是与进程无关的内核指令流。中断类型:

  • 硬中断:可屏蔽中断和不可屏蔽中断。高电平说明有中断请求。
  • 软中断/异常:
    • 故障:出问题,但可以恢复到当前指令,如除零错误。
    • 退出:不可恢复的严重故障,只能退出。如连续发生故障。

2、Linux内核通过schedule函数实现进程调度,调用schedule函数的时候就是进程调度的时机。进程调度时机如下:

  • 用户进程通过特定的系统调用主动让出CPU;
  • 中断处理程序在内核返回用户态是进行调度;
  • 内核线程主动调用schedule函数让出CPU;
  • 中断处理程序主动调用schedule函数让出CPU。

调度策略与算法

1、Linux系统调度策略:

  • 对于实时进程,Linux采用FIFO(先进先出)或Round Robin(时间片轮转)的调度策略;对于其他进程,Linux采用CFS调度器,核心思想是“完全公平”。
  • SCHED_FIFO和SCHED_RR:实时进程的调度类,实时进程的优先级是静态设定的,始终大于普通进程的优先级;
  • SCHED_NORMAL:普通进程的调度类,同一进程在本身优先级不变的情况下分到的CPU时间占比会根据系统负载变化而发生变化。

2、进程上下文包含了进程执行需要的所有信息:

  • 用户地址空间:包括程序代码,数据,用户堆栈等;
  • 控制信息:进程描述符,内核堆栈等;
  • 硬件上下文,相关寄存器的值。

3、Linux系统的一般执行过程:正在运行的用户态进程X切换到运行用户态进程Y的过程。

  • 正在运行的用户态进程X。
  • 发生中断——save cs:eip/esp/eflags(当前进程CPU的状态压入用户态进程X的内核堆栈)——load cs:eipss:esp(加载中断服务例程和内核堆栈)。
  • 进入中断处理进程,首先SAVE_ALL,保存现场。
  • 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换。
  • 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)。
  • restore_all 恢复进程X的执行状态。
  • iret - pop cs:eip/ss:esp/eflags from kernel stack,
  • 继续运行用户态进程Y。从Y进程的内核堆栈中弹出②中硬件完成的堆栈内容。

4、几种特殊情况:

  • 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;
  • 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,比 最一般的情况略简略;
  • 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork一个子进程时;
  • 加载一个新的可执行程序后返回到用户态的情况,如execve系统调用加载新的可执行程序;

进程调度相关源代码跟踪和分析

配置运行MenuOS系统

重新克隆一个menu,然后重新编译内核。

配置gdb远程调试和设置断点

打开调试模式,另打开一个窗口进行gdb远程调试,配置gdb远程调试并设置断点。

使用gdb跟踪分析schedule()函数

按c执行,停在schedule函数断点处。

按c继续执行到pick_next_task断点处:在这里根据某种调度策略和调度算法选择了下一个进程来切换。

按c继续执行到context_switch断点处,用来实现进程的切换。

按s单步调试进入switch_to函数内部,这里差不多按了几十下s吧!switch_to是context_switch函数中进行进程关键上下文切换的函数。

关键代码分析

context_switch关键代码部分

static inline void context_switch(struct rq *rq, struct task_struct *prev, struct task_struct *next)
{
    ...
    arch_start_context_switch(prev);

    if (unlikely(!mm)) {    //如果被切换进来的进程的mm为空切换,内核线程mm为空
        next->active_mm = oldmm;  //将共享切换出去的进程的active_mm
        atomic_inc(&oldmm->mm_count);  //有一个进程共享,所有引用计数加一
        enter_lazy_tlb(oldmm, next);  //将per cpu变量cpu_tlbstate状态设为LAZY
    } else   //普通mm不为空,则调用switch_mm切换地址空间
        switch_mm(oldmm, mm, next);
...
    //这里切换寄存器状态和栈 
    switch_to(prev, next, prev);

switch_to关键代码部分

#define switch_to(prev, next, last)
do {
    /*
     * Context-switching clobbers all registers, so we clobber
     * them explicitly, via unused output variables.
     * (EAX and EBP is not listed because EBP is saved/restored
     * explicitly for wchan access and EAX is the return value of
     * __switch_to())
     */
    unsigned long ebx, ecx, edx, esi, edi;

    asm volatile(
             "pushfl\n\t"  //保存当前进程flags
             "pushl %%ebp\n\t"  //当前进程堆栈基址压栈
             "movl %%esp,%[prev_sp]\n\t"  //保存ESP,将当前堆栈栈顶保存起来
             "movl %[next_sp],%%esp\n\t"  //更新ESP,将下一栈顶保存到ESP中
                     // 完成内核堆栈的切换
             "movl $1f,%[prev_ip]\n\t"    //保存当前进程的EIP
             "pushl %[next_ip]\n\t"       //将next进程起点压入堆栈,即next进程的栈顶为起点
             __switch_canary              //next_ip一般为$1f,对于新创建的子进程是ret_from_fork      
             "jmp __switch_to\n"    //prve进程中,设置next进程堆栈,jmp与call不同,是通过寄存器传递参数(call通过堆栈),所以ret时弹出的是之前压入栈顶的next进程起点
             //完成EIP的切换
             "1:\t"            //next进程开始执行       
             "popl %%ebp\n\t"  //restore EBP
             "popfl\n"         //restore flags

             //输出量
             : [prev_sp] "=m" (prev->thread.sp),   //保存当前进程的esp
               [prev_ip] "=m" (prev->thread.ip),     //保存当前进仓的eip
               "=a" (last),

               //要破坏的寄存器
               "=b" (ebx), "=c" (ecx), "=d" (edx),
               "=S" (esi), "=D" (edi)

               __switch_canary_oparam

              //输入量
             : [next_sp]  "m" (next->thread.sp),   //next进程的内核堆栈栈顶地址,即esp
               [next_ip]  "m" (next->thread.ip),     //next进程的eip

               // regparm parameters for __switch_to(): 
               [prev]     "a" (prev),
               [next]     "d" (next)

               __switch_canary_iparam

             : //重新加载段寄存器
            "memory");
} while (0)

总结

要点:

  • 中断处理过程直接调用schedule(),或者当内核返回用户态时根据need_resched标志调用schedule()。
  • 内核线程是一个特殊的进程,只有内核态没有用户态,可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度(内核线程可以直接访问内核函数,所以不会发生系统调用)。
  • 内核线程作为一类的特殊的进程可以主动调用schedule函数让出CPU,也可以被动调度。
    用户态进程无法实现主动调度,仅能在中断处理过程中进行调度。
posted @ 2019-11-16 11:32  1993Fxn  阅读(155)  评论(0编辑  收藏  举报