深入理解系统调用
一 实验要求
- 找一个系统调用,系统调用号为学号最后2位相同的系统调用,我的学号87.
- 通过汇编指令触发该系统调用
- 通过gdb跟踪该系统调用的内核处理过程
- 重点阅读分析系统调用入口的保存现场、恢复现场和系统调用返回,以及重点关注系统调用过程中内核堆栈状态的变化
二 环境配置
安装开发工具
sudo apt install build-essential
sudo apt install qemu # install QEMU
sudo apt install libncurses5-dev bison flex libssl-dev libelf-dev
下载内核源码
sudo apt install axel axel -n 20 https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/ linux-5.4.34.tar.xz xz -d linux-5.4.34.tar.xz tar -xvf linux-5.4.34.tar cd linux-5.4.34
配置内核选项
make defconfig #Default configuration is based on 'x86_64_defconfig' make menuconfig #打开debug相关选项 Kernel hacking ---> Compile-time checks and compiler options ---> [*] Compile the kernel with debug info [*] Provide GDB scripts for kernel debugging [*] Kernel debugging #关闭KASLR,否则会导致打断点失败 Processor type and features ----> [] Randomize the address of the kernel image (KASLR)
编译和运行内核
make -j$(nproc)
# 测试一下内核能不能正常加载运行,因为没有文件系统最终会kernel panic
qemu-system-x86_64 -kernel arch/x86/boot/bzImage
制作根文件系统
axel -n 20 https://busybox.net/downloads/busybox-1.31.1.tar.bz2 tar -jxvf busybox-1.31.1.tar.bz2 cd busybox-1.31.1 make menuconfig #记得要编译成静态链接,不⽤动态链接库。 Settings ---> [*] Build static binary (no shared libs) #然后编译安装,默认会安装到源码⽬录下的 _install ⽬录中。 make -j$(nproc) && make install
制作内存根文件系统镜像
mkdir rootfs cd rootfs cp ../busybox-1.31.1/_install/* ./ -rf mkdir dev proc sys home sudo cp -a /dev/{null,console,tty,tty1,tty2,tty3,tty4} dev/
准备init脚本文件放在根文件系统跟目录下(rootfs/init),添加如下内容到init文件
#!/bin/sh mount -t proc none /proc mount -t sysfs none /sys echo "Wellcome MyOS!" echo "--------------------" cd home /bin/sh
给init脚本添加可执行权限
chmod +x init
打包成内存根文件系统镜像
find . -print0 | cpio --null -ov --format=newc | gzip -9 > ../rootfs.cpio.gz
测试挂载根文件系统,看内核启动完成后是否执行init脚本
qemu-system-x86_64 -kernel linux-5.4.34/arch/x86/boot/bzImage -initrd rootfs.cpio.gz
运行结果如下所示
三 查看系统调用并编写调用汇编代码
打开/linux-5.4.34/arch/x86/entry/syscalls/syscall_64.tbl,找到自己学号后两位87对应的系统调用命令:unlink。
unlink的函数详细解释
功能描述: 从文件系统中删除一个名称。如果名称是文件的最后一个连接,并且没有其它进程将文件打开,名称对应的文件会实际被删除。 用法: #include int unlink(const char *pathname); 参数: pathname:指向需解除连接的文件名。 返回说明: 成功执行时,返回0。失败返回-1,errno被设为以下的某个值 EACCES:权能不足 EFAULT: 内存空间不可访问 EIO:发生输入输出错误 EISDIR:pathname索引的是目录 ELOOP :路径解析的过程中存在太多的符号连接 ENAMETOOLONG:路径名超出可允许的长度 ENOENT:路径名部分内容表示的目录不存在,或者是悬浮的连接 ENOMEM: 核心内存不足 ENOTDIR:路径名的部分内容不是目录 EPERM : 文件系统不支持文件或者目录的解除连接,也有可能是权限步允许 EROFS :文件系统只读
编写test_unlink.c程序,调用87号系统调用。
#include<stdio.h> int main(){ asm volatile( "movl $0x57,%eax\n\t"//使用EAX传递系统调用号87 "syscall\n\t"//系统调用 ); return 0; }
用gcc静态编译,生成可执行文件
gcc test_unlink.c -o test_unlink -static
执行可执行文件,输出
将代码放入rootfs/home目录下(注意路径要改成在qemu系统中存在的路径,否则之后运行无法成功修改路径),重新制作根文件系统
find . -print0 | cpio --null -ov --format=newc | gzip -9 > ../rootfs.cpio.gz
四 GDB调试与分析
纯命令行启动qemu
qemu-system-x86_64 -kernel linux-5.4.34/arch/x86/boot/bzImage -initrd rootfs.cpio.gz -S -s -nographic -append "console=ttyS0"
打开另一个终端,进入linux-5.4.34文件夹,输入
gdb vmlinux
在gdb中运行:
target remote:1234
b __x64_sys_unlink
运行编写好的调用系统调用的代码
./test_unlink
通过命令c来继续运行,通过n来实现gdb单步调试
c #continue n #Step Over
五 实验分析与总结
通过首先搭建内核调试环境,然后对于unlink进行了研究,最后通过程序和汇编代码结合gdb调试完成了87号系统调用的跟踪系统调用执行步骤、分析系统调用的过程包括保存现场、恢复现场、内核堆栈状态的变化等操作。
触发系统调用后,代码执行了/linux-5.4.34/arch/x86/entry/entry_64.S 目录下的ENTRY(entry_SYSCALL_64)入口,然后开始通过swapgs 和压栈动作保存现场:
然后跳转到了/linux-5.4.34/arch/x86/entry/common.c
目录下的 do_syscall_64
函数,在ax寄存器中获取到系统调用号,然后去执行系统调用
查看entry_syscall_64后续的代码,在完成执行现场的恢复,最后的两个popq出栈指令恢复原 rdi 和 rsp的内容,也就是完成了堆栈的切换