Linux内核分析(第七周)
可执行程序的装载
一、预处理、编译、链接和目标文件的格式
1.可执行程序怎么来的?
预处理:
gcc -E -o hello.cpp hello.c -m32
*负责把include的文件包含进来及宏替换
编译:
gcc -x cpp-output -S -o hello.s hello.cpp -m32
gcc -x assembler -c hello.s 0o hello.o -m32
hello.s 汇编代码
hello.o 二进制文件
链接:
gcc -o hello hello.o - -m32
2.目标文件的格式ELF
A.out COFF (PE+ELF)
三种类型:
可重定位文件
可执行文件
共享文件
Entry point address 程序的起点
3.静态链接的ELF
静态链接会将所有代码放在一个代码段
动态链接会有多个代码段
二、可执行程序,共享库,和动态链接
1.装载可执行程序程序之前的工作
执行环境:命令行+参数
*shell本身不限制命令行参数的个数
*shell会调用execve将命令行参数和环境参数传递给main函数
shell>execve>sys_exceve
*初始化新程序堆栈时拷贝进去
*先函数调用参数传递,再系统调用参数传递
2.装载时动态链接和示例
三、可执行程序的装载
1.相关关键问题分析
fork先返回父进程一次;再返回ret_from_fork开始执行然后返回用户态
sys_execve:
do_exceve>do_execve_common>exec_binprm
通过修改内核堆栈中EIP的值作为新程序的起点
2.sys_exceve的内部处理
对于静态链接的文件elf_entry是新程序执行的起点
3.gdb跟踪
new_ip是返回到用户态的第一条指令的地址
实验:
1、
静态链接
静态链接是在链接时将库的内容加入到可执行程序中的做法。因为要将所有需要的库文件放到同一个文件中,所以占用空间会比较大,但是执行效率非常高。
动态链接
动态链接是当需要某个头文件时动态的去库中去找,并不用像静态链接那样去提前全部加载进去。这样链接出来的文件相对来说空间较小,但是效率略逊于静态链接。
动态链接分装载时动态链接和运行时动态链接。两者在gcc下指令相同,但是使用方式略有不同。
Linux下的三种目标文件格式
1.可重定位文件( .o ):二进制代码和数据,由各个数据节(section)构成,从地址0开始。
2.可执行文件:可运行的二进制代码和数据。
3.共享目标文件( .so ):一种特殊类型的可重定位目标文件,动态加载链接。
Linux上,目标文件的格式称为可执行和可链接格式(ELF)
2.步骤
rm -rf menu
git clone https:///mengning/menu.git
cd menu
mv test_fork.c test.c
make rootfs
qemu -kernel linux-3.18.6/arch/x86/bootImage -initrdrootfs.img -s -S
打开gdb进行远程调试
gdb
file linux-3.18.6mlinux
target remote:1234
B sys_execve
B load_elf_binary
B start_thread
linux首先创建父进程,然后通过调用fork()系统调用创建一个新的进程,然后新的进程调用execve()系统调用执行指定的ELF文件。 主进程继续返回等待新进程执行结束,然后重新等待用户输入命令。execve()系统调用被定义在unistd.h。
对于ELF格式的可执行文件,按照格式要求加载到内存中相应的地址空间,如果是静态链接的就将文件头部标明的入口地址作为开始;如果是依赖动态链接库的可执行文件则需要将动态链接器ld的入口地址作为开始。