一个简单的时间片轮转多道程序内核代码分析

学号尾号:155

基于ubuntu kylin 18.10虚拟机

原创作品转载请注明出处https://github.com/mengning/linuxkernel/


实验准备

apt-get install qemu #安装qemu
ln -s /usr/bin/qemu-system-i386 /usr/bin/qemu #链接两个目录
wget https://www.kernel.org/pub/linux/kernel/v3.x/linux-3.9.4.tar.xz # 获取Linux Kernel 3.9.4的源代码
wget https://raw.github.com/mengning/mykernel/master/mykernel_for_linux3.9.4sc.patch # 获取 mykernel_for_linux3.9.4sc.patch
xz -d linux-3.9.4.tar.xz
tar -xvf linux-3.9.4.tar
cd linux-3.9.4
patch -p1 < ../mykernel_for_linux3.9.4sc.patch
make allnoconfig
make

在执行make命令时出现了以下问题:

这个问题是由于gcc的版本太高导致的,执行以下两条命令即可解决:

apt-get install gcc-4.8 #安装gcc4.8
update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100 #将gcc-4.8设置为默认版本

如下所示,执行以上命令后便可以正常编译了

再执行如下命令启动mykernel

qemu -kernel arch/x86/boot/bzImage

如图所示,mykernel启动成功了!


代码分析

cd mykernel/

在该目录中,我们可以看到两个.c文件:

//mymain.c
/*
 *  linux/mykernel/mymain.c
 *
 *  Kernel internal my_start_kernel
 *
 *  Copyright (C) 2013  Mengning
 *
 */
#include <linux/types.h>
#include <linux/module.h>
#include <linux/proc_fs.h>
#include <linux/kernel.h>
#include <linux/syscalls.h>
#include <linux/stackprotector.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/delay.h>
#include <linux/ioport.h>
#include <linux/init.h>
#include <linux/initrd.h>
#include <linux/bootmem.h>
#include <linux/acpi.h>
#include <linux/tty.h>
#include <linux/percpu.h>
#include <linux/kmod.h>
#include <linux/vmalloc.h>
#include <linux/kernel_stat.h>
#include <linux/start_kernel.h>
#include <linux/security.h>
#include <linux/smp.h>
#include <linux/profile.h>
#include <linux/rcupdate.h>
#include <linux/moduleparam.h>
#include <linux/kallsyms.h>
#include <linux/writeback.h>
#include <linux/cpu.h>
#include <linux/cpuset.h>
#include <linux/cgroup.h>
#include <linux/efi.h>
#include <linux/tick.h>
#include <linux/interrupt.h>
#include <linux/taskstats_kern.h>
#include <linux/delayacct.h>
#include <linux/unistd.h>
#include <linux/rmap.h>
#include <linux/mempolicy.h>
#include <linux/key.h>
#include <linux/buffer_head.h>
#include <linux/page_cgroup.h>
#include <linux/debug_locks.h>
#include <linux/debugobjects.h>
#include <linux/lockdep.h>
#include <linux/kmemleak.h>
#include <linux/pid_namespace.h>
#include <linux/device.h>
#include <linux/kthread.h>
#include <linux/sched.h>
#include <linux/signal.h>
#include <linux/idr.h>
#include <linux/kgdb.h>
#include <linux/ftrace.h>
#include <linux/async.h>
#include <linux/kmemcheck.h>
#include <linux/sfi.h>
#include <linux/shmem_fs.h>
#include <linux/slab.h>
#include <linux/perf_event.h>
#include <linux/file.h>
#include <linux/ptrace.h>
#include <linux/blkdev.h>
#include <linux/elevator.h>

#include <asm/io.h>
#include <asm/bugs.h>
#include <asm/setup.h>
#include <asm/sections.h>
#include <asm/cacheflush.h>

#ifdef CONFIG_X86_LOCAL_APIC
#include <asm/smp.h>
#endif

void __init my_start_kernel(void)
{
    int i = 0;
    while(1)
    {
        i++;
        if(i%100000 == 0)
            printk(KERN_NOTICE "my_start_kernel here  %d \n",i);
            
    }
}
//myinterrupt.c
/*
 *  linux/mykernel/myinterrupt.c
 *
 *  Kernel internal my_timer_handler
 *
 *  Copyright (C) 2013  Mengning
 *
 */
#include <linux/kernel_stat.h>
#include <linux/export.h>
#include <linux/interrupt.h>
#include <linux/percpu.h>
#include <linux/init.h>
#include <linux/mm.h>
#include <linux/swap.h>
#include <linux/pid_namespace.h>
#include <linux/notifier.h>
#include <linux/thread_info.h>
#include <linux/time.h>
#include <linux/jiffies.h>
#include <linux/posix-timers.h>
#include <linux/cpu.h>
#include <linux/syscalls.h>
#include <linux/delay.h>
#include <linux/tick.h>
#include <linux/kallsyms.h>
#include <linux/irq_work.h>
#include <linux/sched.h>
#include <linux/sched/sysctl.h>
#include <linux/slab.h>

#include <asm/uaccess.h>
#include <asm/unistd.h>
#include <asm/div64.h>
#include <asm/timex.h>
#include <asm/io.h>

#define CREATE_TRACE_POINTS
#include <trace/events/timer.h>

/*
 * Called by timer interrupt.
 */
void my_timer_handler(void)
{
	printk(KERN_NOTICE "\n>>>>>>>>>>>>>>>>>my_timer_handler here<<<<<<<<<<<<<<<<<<\n\n");
}

由上图的运行结果我们可以发现,内核启动后会调用mymain.c,然后周期性地调用myinterrupt.c。


了解了内核是如何工作后,接下来将时间片轮转的代码加入进去。代码可以在mykernel中找到,包含mymain.c、myinterrupt.c、mypcb.h。将这三个文件下载下来后放入mykernel目录中覆盖即可。然后重新编译内核代码:

make allnoconfig
make

加入时间片轮转的代码后,运行结果如图所示:

可以看到已经实现了进程切换。

首先对mypcb.h文件的内容进行分析

struct Thread {
    unsigned long       ip;
    unsigned long       sp;
};

Thread结构体定义了两个变量,其中ip表示当前指令位置,sp表示栈顶位置

typedef struct PCB{
    int pid;
    volatile long state;    /* -1 unrunnable, 0 runnable, >0 stopped */
    unsigned long stack[KERNEL_STACK_SIZE];
    /* CPU-specific state of this task */
    struct Thread thread;
    unsigned long   task_entry;
    struct PCB *next;
}tPCB;

PCB结构体定义了一个进程块,pid表示进程id,state表示进程状态(-1表示不能运行 0表示可运行 -1表示停止),next表示指向下一个进程块的指针。


下面分析mymain.c

tPCB task[MAX_TASK_NUM];
tPCB * my_current_task = NULL;
volatile int my_need_sched = 0;

在文件的开头定义了三个变量,task是一个进程数组,用于存储创建的所有进程;my_current_task是一个指向当前进程的指针;my_need_sched是一个标志当前进程是否需要被调度的变量。

void __init my_start_kernel(void)
{
    int pid = 0;
    int i;
    /* Initialize process 0*/
    task[pid].pid = pid;
    task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
    task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
    task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
    task[pid].next = &task[pid];
    /*fork more process */
    for(i=1;i<MAX_TASK_NUM;i++)
    {
        memcpy(&task[i],&task[0],sizeof(tPCB));
        task[i].pid = i;
    //*(&task[i].stack[KERNEL_STACK_SIZE-1] - 1) = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
    task[i].thread.sp = (unsigned long)(&task[i].stack[KERNEL_STACK_SIZE-1]);
        task[i].next = task[i-1].next;
        task[i-1].next = &task[i];
    }
    /* start process 0 by task[0] */
    pid = 0;
    my_current_task = &task[pid];
    asm volatile(
        "movl %1,%%esp\n\t"     /* set task[pid].thread.sp to esp */
        "pushl %1\n\t"          /* push ebp */
        "pushl %0\n\t"          /* push task[pid].thread.ip */
        "ret\n\t"               /* pop task[pid].thread.ip to eip */
        : 
        : "c" (task[pid].thread.ip),"d" (task[pid].thread.sp)   /* input c or d mean %ecx/%edx*/
    );
} 

在内核启动后,便会调用my_start_kernel函数。该函数的执行步骤如下:

  1. 初始化第一个进程:0号进程
    • 将pid置为0
    • 将进程状态置为runnable
    • 将进程的任务入口和线程的指令指针指向my_process函数
    • 将线程的sp指针指向栈的末尾
    • 将该进程的next指针指向自身(因为当前只有一个进程)
  2. 接着开启一个循环,创建四个进程,每个进程中线程的sp都指向其栈的末尾,然后将创建的进程块用一个单循环链表连接起来。
  3. 接着开始启动0号进程,这段汇编代码便是启动进程的代码。首先将0号进程的sp放入esp,然后将sp、ip入栈,然后将ip出栈(即my_process函数的地址),然后开始执行my_process函数。
void my_process(void)
{    
    while(1)
    {
        i++;
        if(i%10000000 == 0)
        {
            printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
            if(my_need_sched == 1)
            {
                my_need_sched = 0;
                my_schedule();
            }
            printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
        }     
    }
}

my_process()函数是一个死循环,循环输出当前进程的进程号,并且如果需要调度的标志位为1,便执行my_schedule()函数进行进程调度。


下面分析my_interrupt.c

void my_timer_handler(void)
{
#if 1
    if(time_count%1000 == 0 && my_need_sched != 1)
    {
        printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
        my_need_sched = 1;
    } 
    time_count ++ ;  
#endif
    return;     
}

首先分析my_timer_handler()函数,该函数用于响应时钟中断,当系统发生中断时,该函数会被调用,将my_need_sched标志位置为1,这样my_process()函数便会调用my_schedule()函数进行进程的切换。

void my_schedule(void)
{
    tPCB * next;
    tPCB * prev;
    if(my_current_task == NULL 
        || my_current_task->next == NULL)
    {
        return;
    }
    printk(KERN_NOTICE ">>>my_schedule<<<\n");
    /* schedule */
    next = my_current_task->next;
    prev = my_current_task;
    if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
    {        
        my_current_task = next; 
        printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);  
        /* switch to next process */
        asm volatile(   
            "pushl %%ebp\n\t"       /* save ebp */
            "movl %%esp,%0\n\t"     /* save esp */
            "movl %2,%%esp\n\t"     /* restore  esp */
            "movl $1f,%1\n\t"       /* save eip */ 
            "pushl %3\n\t" 
            "ret\n\t"               /* restore  eip */
            "1:\t"                  /* next process start here */
            "popl %%ebp\n\t"
            : "=m" (prev->thread.sp),"=m" (prev->thread.ip)
            : "m" (next->thread.sp),"m" (next->thread.ip)
        ); 
    }  
    return; 
}

该函数用于进程的切换。

  1. 首先判断当前进程是否存在或当前进程的next指针是否不为空,若next所指为空或当前进程不存在,则进程无法切换,直接返回。
  2. 创建指向进程块的next指针和prev指针,其中next指针指向下一个进程块,prev指针指向当前进程块。
  3. 判断next指针指向的进程是否是runnable状态,若是则开始进行进程切换
    • 将my_current_task变量指向next指针指向的进程块
    • 输出当前进程的进程号和下一个进程的进程号,向用户表明切换对象
    • 执行进程切换的汇编代码
      • 将ebp入栈
      • 将esp存入当前进程的sp(栈顶指针)
      • 将下一个进程的sp指针存入esp
      • 将下一个进程的ip入栈
      • 将下一个进程的ip出栈赋给eip
      • 将ebp出栈
  4. 该函数执行完毕后,继续执行my_process()函数

总结

经过这次进程调度的代码分析,了解到了操作系统进程调度的工作方式:在内核启动时,会创建一个0号进程,这是最初的进程,之后的进程都由这个0号进程创建,当发生时钟中断时,会保护现场和恢复现场,进行进程的切换。

在此特别感谢孟宁老师提供的参考代码

posted on 2019-03-12 20:10  jlc0118  阅读(289)  评论(0编辑  收藏  举报