gcc 入门
原文地址:http://c.biancheng.net/view/2385.html
- 将C语言源程序预处理,生成
.i文件。 - 预处理后的.i文件编译成为汇编语言,生成
.s文件。 - 将汇编语言文件经过汇编,生成目标文件
.o文件。 - 将各个模块的
.o文件链接起来生成一个可执行程序文件。
GCC 编译流程如下图所示:

.i文件、.s文件、.o文件可以认为是中间文件或临时文件,如果使用 GCC 一次性完成C语言程序的编译,那么只能看到最终的可执行文件,这些中间文件都是看不到的,因为 GCC 已经经它们删除了。
GCC 是一个功能强大的编译器,其编译选项非常多,有些选项通常不会用到。
CCC 从最初的一个试验型的玩具发展到现在 Linux 环境下的标准编译器,其命令选项也从最开始的 4 个发展到了现在的上千个。本节只介绍常用的 GCC 编译选项。
gcc 常用选项汇总
gcc 是一个功能强大的编译器,其编译选项非常多。有些选项一般程序员根本不会用到。因此将所有的编译选项全部列出讲解是不明智的。下面只对一些 gcc 编译器的常 用选项进行详细的讲解,这些选项在实际编程过程中非常实用。gcc 的常用选项如下表所示。
| gcc编译选项 | 选项的意义 |
|---|---|
| -c | 编译、汇编指定的源文件,但是不进行链接 |
| -S | 编译指定的源文件,但是不进行汇编 |
| -E | 预处理指定的源文件,不进行编译 |
| -o [file1] [file2] | 将文件 file2 编译成可执行文件 file1 |
| -I directory | 指定 include 包含文件的搜索目录 |
| -g | 生成调试信息,该程序可以被调试器调试 |
注意:gcc 编译选项会区分大小写。因此-o选项和-O选项的效果是不一样的。前者表示源文件编译成为可执行文件,后者表示将源文件编译成为可执行文件并且进行一级优化。
由于篇幅限制,本节只介绍几个简单的选项,复杂的选项会在后面几节中详细讲解。
-S
将C语言源文件编译为汇编语言,但是并不汇编该程序。使用该选项,我们可以查看C语言代码对应的汇编代码。
-E 选项
-E选项将C语言源文件进行预处理,但是并不编译该程序。对于一般的预处理问题,可以使用这个选项进行查看,例如,宏的展开问题、文件的包含问题等。
-I 选项
由于指定包含的头文件的目录,这一点对于大型的代码组织来说是很有用的。
-g 选项
-g选项可生成能被 gdb 调试器所使用的调试信息。只有使用了该选项后生成的可执行文件,才带有程序中引用的符号表。这时 gdb 调试程序才能对该可执行程序进行调试。
还有另一个 GCC 选项,可以方便地一次获得全部的中间输出文件,这就是-save-temps。当使用该选项时,GCC
会正常地编译和链接,但是会把预处理器输出、汇编语言和对象文件全部存储在当前目录下。使用 -save-temps
选项所生成的中间文件,与对应的源文件具有相同的文件名,但文件扩展名分别为.i、.s和.o,分别表示为预处理输出、汇编语言输出和对象文件。
-c 参数
-c选项表示编译、汇编指定的源文件(也就是编译源文件),但是不进行链接。使用-c选项可以将每一个源文件编译成对应的目标文件。
目标文件是一种中间文件或者临时文件,如果不设置该选项,gcc 一般不会保留目标文件,可执行文件生成完成后就自动删除了。
下面实例演示了 gcc -c 选项的用法。
$gcc -c test1.c test2.c test3.c $ls -l *.o -rwxr--r-- 1 root 23 Feb 7 02:57 test1.o -rwxr--r-- 1 root 17 Feb 7 02:57 test2.o -rwxr--r-- 1 root 20 Feb 7 02:57 test3.o
如果不使用-c选项,则仅仅生成一个可执行文件,没有目标文件。
注意,使用-c选项表示只编译源文件,而不进行链接,因此,对于链接中的错误是无法发现的。
下面例子演示了 gcc 编译器在使用-c选项的时候不会发现链接错误。
1) 编写如下的两个源文件。
在 func.c 中定义了 func_a() 函数:
- #include <stdio.h>
- void func_a(){
- printf("FUNC_A\n");
- }
在 main.c 中调用了 func_a() 和 func_b() 函数:
- #include <stdio.h>
- int main(void)
- {
- func_a();
- func_b();
- return 0;
- }
func_b() 函数并没有定义,所以在链接时会产生错误(编译时不会产生错误)。
2) 使用-c选项编译两个源文件,如下所示:
$gcc -c func.c main.c
编译器没有输出任何错误信息。
3) 不使用-c选项编译两个源文件:
$gcc func.c main.c
会看到如下的报错信息:
/tmp/ccLlOhvh.o:在函数‘main’中:
main.c:(.text+0x14):对‘func_b’未定义的引用
collect2: 错误:ld 返回 1
由于没有找到 func_b() 函数的定义,所以发生了链接错误。
GCG -o选项用来指定输出文件,它的用法为:
[infile] -o [outfile]
[infile] 表示输入文件(也即要处理的文件),它可以是源文件,也可以是汇编文件或者是目标文件;[outfile] 表示输出文件(也即处理的结果),它可以是预处理文件、目标文件、可执行文件等。
[infile] 和 [outfile] 可以是一个文件,也可以是一组文件:
- 如果 [infile] 是一组文件,那么就表示有多个输入文件;
- 如果 [outfile] 是一组文件,那么就表示有多个输出文件。
如果不使用 -o 选项,那么将采用默认的输出文件,例如,把可执行文件作为输出文件,它的名字默认为 a.out。
GCC -o选项使用举例
1) 将源文件作为输入文件,将可执行文件作为输出文件,也即完整地编译整个程序:
$ gcc main.c func.c -o app.out
将 main.c 和 func.c 两个源文件编译成一个可执行文件,其名字为 app.out。如果不使用 -o 选项,那么将生成名字为 a.out 的可执行文件。
2) 将源文件作为输入文件,将目标文件作为输出文件,也即只编译不链接:
$ gcc -c main.c -o a.o
将源文件 main.c 编译为目标文件 a.o。如果不使用 -o 选项,那么将生成名为 main.o 的目标文件。
3) 将源文件作为输入文件,将预处理文件作为输出文件,也即只进行预处理操作:
$ gcc -E main.c -o demo.i
对源文件 main.c 进行预处理操作,并将结果放在 demo.i 文件中。如果不使用 -o 选项,那么将生成名为 main.i 的预处理文件。
4) 将目标文件作为输入文件,将可执行文件作为输出文件:
$ gcc -c func.c main.c
$ gcc func.o main.o -o app.out
第一条命令只编译不链接,将生成 func.o 和 main.o 两个目标文件。第二条命令将生成的两个目标文件生成最终的可执行文件 app.out。如果不使用 -o 选项,那么将生成名字为 a.out 的可执行文件。
在正常的情况下,GCC 不会保留预处理阶段的输出文件,也即
.i文件。然而,可以利用-E选项保留预处理器的输出文件,以用于诊断代码。-E选项指示 GCC 在预处理完毕之后即可停止。默认情况下,预处理器的输出会被导入到标准输出流(也就是显示器),可以利用
-o选项把它导入到某个输出文件:
$ gcc -E circle.c -o circle.i
表示把预处理的结果导出到 circle.i 文件。因为头文件可能相当大,如果源文件包括了多个头文件,那么它的预处理器输出可能会庞杂难读。使用
-C选项会很有帮助,这个选项可以阻止预处理器删除源文件和头文件中的注释:
$ gcc -E -C circle.c -o circle.c
注意,这里是大写的 -C,不是小写的 -c。小写的 -c 表示只编译不链接。
下面是 GCC 预处理器阶段常用的选项:
-Dname[=definition]
在处理源文件之前,先定义宏 name。宏 name 必须是在源文件和头文件中都没有被定义过的。将该选项搭配源代码中的#ifdef name命令使用,可以实现条件式编译。如果没有指定一个替换的值,该宏被定义为值 1。
-Uname
如果在命令行或 GCC 默认设置中定义过宏 name,则“取消”name 的定义。-D和-U选项会依据在命令行中出现的先后顺序进行处理。
-Idirectory[:directory[...]]
当通过 #include 命令把所需的头文件包括进源代码中时,除系统标准 include 目录之外,指定其他的目录对这些头文件进行搜索。-iquote directory[:directory[...]]
这是在最近 GCC 版本中新增的选项,它为在 #include 命令中采用引号而非尖括号指定的头文件指定搜索目录。-isystem directory[:directory[...]]
该选项在标准系统 include 目录以外为系统头文件指定搜索目录,且它指定的目录优先于标准系统 include 目录被搜索。在目录说明开头位置的等号,被视作系统根目录的占位符,可以使用--sysroot或-isysroot选项来修改它。
-isysroot directory
该选项指定搜索头文件时的系统根目录。例如,如果编译器通常在 /usr/include 目录及其子目录下搜索系统头文件,则该选项将引导到 directory/usr/include 及其子目录下进行搜索。
--sysroot选项,采用一个连字符替代 i,它为链接库搜索而不是头文件搜索指定系统根目录以外的目录。如果 isysroot 不可用,则 sysroot 既为头文件又为链接库搜索指定目录。
-I-
在较新版本的 GCC 中,该选项被-iquote替代。在旧版本中,该选项用于将命令行的所有-Idirectory选项分割为两组。所有在-I-左边加上-I选项的目录,被视为等同于采用-iquote选项;这指的是,它们只对 #include 命令中采用引号的头文件名进行搜索。所有在
-I-右边加上-I选项的目录,将对所有 #include 命令中的头文件名进行搜索,无论文件名是在引号还是尖括号中。而且,如果命令行中出现了
-I-,那么包括源文件本身的目录不再自动作为搜索头文件的目录。对于include目录而言,通常的搜索顺序是:
- 包含指定源文件的目录(对于在 #include 命令中以引号包括的文件名)。
-
采用
-iquote选项指定的目录,依照出现在命令行中的顺序进行搜索。只对 #include 命令中采用引号的头文件名进行搜索。 -
采用
-I选型指定的目录,依照出现在命令行中的顺序进行搜索。 - 采用环境变量 CPATH 指定的目录。
-
采用
-isystem选项指定的目录,依照出现在命令行中的顺序进行搜索。 - 采用环境变量 C_INCLUDE_PATH 指定的目录。
- 系统默认的 include 目录。
实际上,GCC 是一个适合多种 CPU 架构的编译器,不会把C程序语句直接翻译成目标机器的汇编语言,而是在输入语言和输出汇编语言之间,利用一个中间语言,称为 RegisterTransfer Language(简称 RTL,寄存器传输语言)。借助于这个抽象层,在任何背景下,编译器可以选择最经济的方式对给定的操作编码。通常情况下,GCC 把汇编语言输出存储到临时文件中,并且在汇编器执行完后立刻删除它们。但是可以使用
而且,在交互文件中针对目标机器的抽象描述,为编译器重新定向到新架构提供了一个结构化的方式。但是,从 GCC 用户角度来看,我们可以忽略这个中间步骤。
-S选项,让编译程序在生成汇编语言输出之后立刻停止。如果没有指定输出文件名,那么采用
-S选项的 GCC 编译过程会为每个被编译的输入文件生成以.s作为后缀的汇编语言文件。如下例所示:
$ gcc -S circle.c
编译器预处理 circle.c,将其翻译成汇编语言,并将结果存储在 circle.s 文件中。如果想把C语言变量的名称作为汇编语言语句中的注释,可以加上
-fverbose-asm选项:
$ gcc -S -fverbose-asm circle.c
链接器把多个二进制的目标文件(object file)链接成一个单独的可执行文件。在链接过程中,它必须把符号(变量名、函数名等一些列标识符)用对应的数据的内存地址(变量地址、函数地址等)替代,以完成程序中多个模块的外部引用。
而且,链接器也必须将程序中所用到的所有C标准库函数加入其中。对于链接器而言,链接库不过是一个具有许多目标文件的集合,它们在一个文件中以方便处理。
当把程序链接到一个链接库时,只会链接程序所用到的函数的目标文件。在已编译的目标文件之外,如果创建自己的链接库,可以使用 ar 命令。
标准库的大部分函数通常放在文件 libc.a 中(文件名后缀.a代表“achieve”,译为“获取”),或者放在用于共享的动态链接文件 libc.so 中(文件名后缀.so代表“share object”,译为“共享对象”)。这些链接库一般位于 /lib/ 或 /usr/lib/,或者位于 GCC 默认搜索的其他目录。
当使用 GCC 编译和链接程序时,GCC 默认会链接 libc.a 或者 libc.so,但是对于其他的库(例如非标准库、第三方库等),就需要手动添加。
令人惊讶的是,标准头文件 <math.h> 对应的数学库默认也不会被链接,如果没有手动将它添加进来,就会发生函数未定义错误。
GCC 的-l选项可以让我们手动添加链接库。下面我们编写一个数学程序 main.c,并使用到了 cos() 函数,它位于 <math.h> 头文件。
- #include <stdio.h> /* printf */
- #include <math.h> /* cos */
- #define PI 3.14159265
- int main ()
- {
- double param, result;
- param = 60.0;
- result = cos ( param * PI / 180.0 );
- printf ("The cosine of %f degrees is %f.\n", param, result );
- return 0;
- }
为了编译这个 main.c,必须使用-l选项,以链接数学库:
$ gcc main.c -o main.out -lm
数学库的文件名是 libm.a。前缀lib和后缀.a是标准的,m是基本名称,GCC 会在-l选项后紧跟着的基本名称的基础上自动添加这些前缀、后缀,本例中,基本名称为 m。
在支持动态链接的系统上,GCC 自动使用在 Darwin 上的共享链接库 libm.so 或 libm.dylib。
链接其它目录中的库
通常,GCC 会自动在标准库目录中搜索文件,例如 /usr/lib,如果想链接其它目录中的库,就得特别指明。有三种方式可以链接在 GCC 搜索路径以外的链接库,下面我们分别讲解。
1) 把链接库作为一般的目标文件,为 GCC 指定该链接库的完整路径与文件名。
例如,如果链接库名为 libm.a,并且位于 /usr/lib 目录,那么下面的命令会让 GCC 编译 main.c,然后将 libm.a 链接到 main.o:
$ gcc main.c -o main.out /usr/lib/libm.a
2) 使用-L选项,为 GCC 增加另一个搜索链接库的目录:
$ gcc main.c -o main.out -L/usr/lib -lm
可以使用多个-L选项,或者在一个-L选项内使用冒号分割的路径列表。
3) 把包括所需链接库的目录加到环境变量 LIBRARYPATH 中。
编译多个源代码文件会生成多个目标文件,每个目标文件都包含一个源文件的机器码和相关数据的符号表。除非使用-c选项指示 GCC 只编译不链接,否则 GCC 会使用临时文件作为目标文件输出:
$ gcc -c main.c
$ gcc -c func.c
这些命令会在当前目录中生成两个目标文件,分别是 main.o 和 func.o。把两个源文件名放在同一个 GCC 命令中,也可以获得同样的结果:
$ gcc -c main.c func.c
然而,实际上编译器通常每次只会被调用来完成一件小型任务。大的程序包含许多源文件,在开发期间必须被编译、测试、编辑,然后再编译,很少会有在创建中的修改行为会影响所有的源文件。为了节省时间,可以使用
make 控制创建过程,由它调用编译器重新编译,而且只编译比对应的最新源文件旧的那些目标文件。
一旦所有当前源文件都被编译为目标文件,就可以使用 GCC 来链接它们:
$ gcc main.o func.o -o app.out -lm
GCC 假设扩展名为.o的文件是要被链接的目标文件。
文件类型
编译器支持许多和C语言程序相关的扩展名,对它们的说明如下:
| 扩展名(后缀) | 说明 |
|---|---|
| .c | C程序源代码,在编译之前要先进行预处理。 |
| .i | C程序预处理输出,可以被编译。 |
| .h | C程序头文件。(为了节省时间,许多源文件会包含相同的头文件,GCC 允许事先编译好头文件,称为“预编译头文件”,它合适情况下自动被用于编译。) |
| .s | 汇编语言。 |
| .S | 有C命令的汇编语言,在汇编之前必须先进行预处理。 |
GCC 也支持以下扩展名:.ii、.cc、.cp、.cxx、.cpp、.CPP、.c++、.C、.hh、.H、.m、.mi、.f、.for、.FOR、.F、.fpp、.FPP、.r、.ads 和 .adb。这些文件类型涉及 C++、Objective-C、Fortran 或 Ada 等程序的编译。使用其他扩展名的文件会被视为对象文件,以作为链接之用。
如果使用其他命名惯例为输入文件命名,可以使用-x file_type选项来指示 GCC 应该如何对待这些文件。file_type 必须是下面其中之一:c、c-header、cpp-output、assembler(表示该文件包含汇编语言)、assembler-with-cpp 或 none。
在命令行中,-x后面所列的所有文件都会被视为所指定的类型。如果想改变类型,可以再次使用-x。如下例所示:
$ gcc -o bigprg mainpart.c -x assembler trickypart.asm -x c otherpart.c
可以在同一个命令行中多次使用-x选项,以指示不同类型的文件。-x none选项会全部取消这些指示,后续文件会按照 GCC 默认规则解释它们的扩展名。
混合输入类型
可以在 GCC 命令行中混合使用其他输入文件类型。如果编译器不能按照请求处理指定的文件,那么它会忽略它们。如下例所示:
$ gcc main.c func.o -o app.out -lm
借助于这个命令,假设指定的文件都存在,GCC 会编译和汇编 main.c,汇编 func.o,并且链接库文件 libm.a。
Linux 下动态链接库(shared object file,共享对象文件)的文件后缀为.so,它是一种特殊的目标文件(object file),可以在程序运行时被加载(链接)进来。使用动态链接库的优点是:程序的可执行文件更小,便于程序的模块化以及更新,同时,有效内存的使用效率更高。
GCC 生成动态链接库
如果想创建一个动态链接库,可以使用 GCC 的-shared选项。输入文件可以是源文件、汇编文件或者目标文件。
另外还得结合-fPIC选项。-fPIC
选项作用于编译阶段,告诉编译器产生与位置无关代码(Position-Independent
Code);这样一来,产生的代码中就没有绝对地址了,全部使用相对地址,所以代码可以被加载器加载到内存的任意位置,都可以正确的执行。这正是共享库所要求的,共享库被加载时,在内存的位置不是固定的。
例如,从源文件生成动态链接库:
$ gcc -fPIC -shared func.c -o libfunc.so
从目标文件生成动态链接库:
$ gcc -fPIC -c func.c -o func.o
$ gcc -shared func.o -o libfunc.so
-fPIC 选项作用于编译阶段,在生成目标文件时就得使用该选项,以生成位置无关的代码。
GCC 将动态链接库链接到可执行文件
如果希望将一个动态链接库链接到可执行文件,那么需要在命令行中列出动态链接库的名称,具体方式和普通的源文件、目标文件一样。请看下面的例子:
$ gcc main.c libfunc.so -o app.out
将 main.c 和 libfunc.so 一起编译成 app.out,当 app.out 运行时,会动态地加载链接库 libfunc.so。
当然,必须要确保程序在运行时可以找到这个动态链接库。你可以将链接库放到标准目录下,例如 /usr/lib,或者设置一个合适的环境变量,例如 LIBRARY_PATH。不同系统,具有不同的加载链接库的方法。

浙公网安备 33010602011771号