编译器的工作过程

简单的说，其实要理解cpp文件与头文件有什么不同之处，首先需要弄明白编译器的工作过程，一般说来编译器会做以下几个过程：

1.预处理阶段(也就是常说的切token)

2.词法与语法分析阶段

3.编译阶段，首先编译成纯汇编语句，再将之汇编成跟CPU相关的二进制码，生成各个目标文件 (.obj文件)

4.连接阶段，将各个目标文件中的各段代码进行绝对地址定位，生成跟特定平台相关的可执行文件，当然，最后还可以用objcopy生成纯二进制码，也就是去掉了文件格式信息。(生成.exe文件)

编译器在编译时是以cpp文件为单位进行的，也就是说如果你的项目中一个cpp文件都没有，那么你的项目将无法编译。连接器是以目标文件为单位，它将一个或多个目标文件进行函数与变量的重定位（确定每个函数和变量相对于程序起始位置的地址，这里还不是真正的内存的地址，真正内存的地址要等到程序载入器根据某个寄存器的地址确定），生成最终的可执行文件。在PC上的程序开发，一般都有一个main函数，这是各个编译器的约定。当然，你如果自己写连接器脚本的话，可以不用main函数作为程序入口！！！！

　　（main .c文件目标文件可执行文件）

有了这些基础知识，再言归正传，为了生成一个最终的可执行文件，就需要一些目标文件，也就是需要cpp文件，而这些cpp文件中又需要一个main函数作为可执行程序的入口，那么我们就从一个cpp文件入手，假定这个cpp文件内容如下：

main.c函数

#include <stdio.h>
#include "mytest.h"

int main(int argc,char **argv)
{ 
    test = 25;
    printf("test.................%d\n",test);
    return 0;
}

mytest.h头文件内容如下：

int test;

现在以这个例子来讲解编译器的工作：

1.预处理阶段：编译器以cpp文件作为一个单元，首先读这个cpp文件，发现第一句与第二句包含一个头文件，就会在所有搜索路径中寻找这两个头文件，找到之后，就会到相应头文件中再去处理宏、变量、函数声明、嵌套的头文件等，检测依赖关系，进行宏替换，看是否有重复定义与声明的情况发生，最后将那些文件中所有的东东全部扫描进这个当前的cpp文件中，形成一个中间"cpp文件"。

在这一步中相当于将那个头文件中的test变量扫描进了一个中间cpp文件，那么test变量就变成了这个文件中的一个全局变量。在stdio.h这个头文件中有一些函数的声明，这时也把这些函数的声明一股脑的扫描到了这个中间cpp文件中（只是扫描了函数的声明，并没有实现）。

2.编译阶段：此时就为这个中间cpp文件的所有变量、函数形参分配空间(原则上，在这里只能看到.h文件中函数、变量的声明，为变量和函数的形参等分配空间)，将各个函数编译成二进制码，按照特定目标文件格式生成目标文件，在这种格式的目标文件中进行各个全局变量、函数的符号描述(编译器维护一个符号描述表)，将这些二进制码按照一定的标准组织成一个目标文件。

此时的每一个cpp文件都被编译器编译成了一个目标文件，同时每个目标文件都有一张符号表，这张符号表中记录了这个cpp文件都用到了哪些变量，哪些函数，函数的参数是什么类型的，有几个参数。同时为变量和函数形参开辟了内存空间。所以这里编译器把你这个cpp用到的所有的东西都记录下来了，如果有重复定义或者没有定义的变量、函数等，编译器一下子就知道了。

3.连接阶段：将上一步成生的各个目标文件，根据一些参数，连接生成最终的可执行文件，主要的工作就是重定位各个目标文件的函数、变量等，相当于将个目标文件中的二进制码按一定的规范合到一个文件中。

posted @ 2014-09-29 11:28 stemon 阅读(1298) 评论(0) 收藏举报

刷新页面返回顶部

要知道，春天的道路依然充满泥泞！

编译器的工作过程