Fork me on GitHub

剖析gcc -v输出

 分析gcc -v的详细信息的意义

首先我们需要清楚一点,我们并不能完全弄清楚gcc -v的所有信息,因为毕竟我们并不是GCC编译器集合的实现者,对于这些信息,他们才是最清楚的。由于我们不能将所有的信息都搞清楚,所以我们只分析关键信息。虽然我们不能将所有信息都全部弄清楚,但是分析里面的关键信息还是非常有意义的,我们可以通过这些信息弄清楚很多事情,比如:

①通过这些信息,我就知道gcc其实最终还是调用ccp/cc1/as/collect2(或ld)等程序来实现编译的四个过程的。

②知道c的启动代码是怎么来的

③知道为什么在程序中调用printf、scanf、malloc等函数时,我们不需要主动链接这些函数的动态库,但是依然能够使用这些函数

 

gcc -v详细信息分析

源代码

#include <stdio.h>
#include <stdlib.h>

#define NUM 100

int main()
{
    #if 0
    printf("Test condition macro\n");
    #endif

    printf("Hello World\n");
    return 0;
}
View Code

gcc test.c -o test -v

[root@localhost ~]# gcc test.c -o test -v 
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/lto-wrapper
Target: x86_64-redhat-linux
Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --with-linker-hash-style=gnu --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-initfini-array --disable-libgcj --with-isl=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/isl-install --with-cloog=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/cloog-install --enable-gnu-indirect-function --with-tune=generic --with-arch_32=x86-64 --build=x86_64-redhat-linux
Thread model: posix
gcc version 4.8.5 20150623 (Red Hat 4.8.5-28) (GCC) 
COLLECT_GCC_OPTIONS='-o' 'test' '-v' '-mtune=generic' '-march=x86-64'
 /usr/libexec/gcc/x86_64-redhat-linux/4.8.5/cc1 -quiet -v test.c -quiet -dumpbase test.c -mtune=generic -march=x86-64 -auxbase test -version -o /tmp/cceAJij2.s
GNU C (GCC) version 4.8.5 20150623 (Red Hat 4.8.5-28) (x86_64-redhat-linux)
    compiled by GNU C version 4.8.5 20150623 (Red Hat 4.8.5-28), GMP version 6.0.0, MPFR version 3.1.1, MPC version 1.0.1
GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
ignoring nonexistent directory "/usr/lib/gcc/x86_64-redhat-linux/4.8.5/include-fixed"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../../x86_64-redhat-linux/include"
#include "..." search starts here:
#include <...> search starts here:
 /usr/lib/gcc/x86_64-redhat-linux/4.8.5/include
 /usr/local/include
 /usr/include
End of search list.
GNU C (GCC) version 4.8.5 20150623 (Red Hat 4.8.5-28) (x86_64-redhat-linux)
    compiled by GNU C version 4.8.5 20150623 (Red Hat 4.8.5-28), GMP version 6.0.0, MPFR version 3.1.1, MPC version 1.0.1
GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
Compiler executable checksum: 949efbe3007c23535d2d04d4c10b1f32
COLLECT_GCC_OPTIONS='-o' 'test' '-v' '-mtune=generic' '-march=x86-64'
 as -v --64 -o /tmp/ccL4wd1V.o /tmp/cceAJij2.s
GNU assembler version 2.27 (x86_64-redhat-linux) using BFD version version 2.27-27.base.el7
COMPILER_PATH=/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/:/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/:/usr/libexec/gcc/x86_64-redhat-linux/:/usr/lib/gcc/x86_64-redhat-linux/4.8.5/:/usr/lib/gcc/x86_64-redhat-linux/
LIBRARY_PATH=/usr/lib/gcc/x86_64-redhat-linux/4.8.5/:/usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../../lib64/:/lib/../lib64/:/usr/lib/../lib64/:/usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../:/lib/:/usr/lib/
COLLECT_GCC_OPTIONS='-o' 'test' '-v' '-mtune=generic' '-march=x86-64'
 /usr/libexec/gcc/x86_64-redhat-linux/4.8.5/collect2 --build-id --no-add-needed --eh-frame-hdr --hash-style=gnu -m elf_x86_64 -dynamic-linker /lib64/ld-linux-x86-64.so.2 -o test /usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../../lib64/crt1.o /usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../../lib64/crti.o /usr/lib/gcc/x86_64-redhat-linux/4.8.5/crtbegin.o -L/usr/lib/gcc/x86_64-redhat-linux/4.8.5 -L/usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../../lib64 -L/lib/../lib64 -L/usr/lib/../lib64 -L/usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../.. /tmp/ccL4wd1V.o -lgcc --as-needed -lgcc_s --no-as-needed -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/x86_64-redhat-linux/4.8.5/crtend.o /usr/lib/gcc/x86_64-redhat-linux/4.8.5/../../../../lib64/crtn.o
[root@localhost ~]# 
View Code

Using built-in specs.               //编译链接详细信息
COLLECT_GCC=gcc                  //编译时所调用的总调度程序

Target: x86_64-linux-gnu           //gcc编译得到的可执行文件的运行环境,cpu:64位x86, OS:linux, gnu:gcc的开发组织

Configured with: ../configure --prefix=/usr         //gcc配置信息

gcc配置信息

什么是gcc配置信息

gcc也是一个程序,也是被别人开发出来的,应该是c/c++语言写的。编写gcc这个编译器程序的人,在编译gcc时所给的信息就是配置信息,这些信息会决定编译gcc哪些代码,不编译哪些代码,最终得到针对某个环境(OS/CPU)的gcc可执行程序。

gcc程序如何面对众多环境的

gnu开发的gcc可以面对很多的环境,比如windows x86环境,Linux x86环境,Linux arm环境。编写gcc的人,为了让程序能够应对各种环境(OS、cpu),gcc程序里面会包含应对各个环境的代码,如果你想得到针对某个环境gcc可执行程序,就必须只编译针对该环境的代码,其它代码不编译。

如何选择只编译gcc程序针对某个环境的代码

通过条件编译来选择,就可以在预编译阶段决定你要保留哪些代码,放弃哪些代码,编译时只编译你保留的代码。

比如

gcc.c
                                    
#define X86_LINUX
                                    
                                    
#ifdef X86_LINUX
针对x86、Linux环境的代码。
#endif
                                    
                                    
#ifdef ARM_LINUX
针对arm、Linux环境的代码。
#endif
                                
                                
#ifdef X86_WINDOWS
针对X86、windows环境的代码。
#endif
View Code

通过条件编译所需的宏,就能让条件编译保留和编译只针对某个环境的代码。但是由于c条件编译使用的宏实在是太多了,所以我们不可能自己一个一个的定义这些宏,所以就需要通过配置信息自动生成需要的宏。

配置信息保存在哪里呢?

配置信息保存在配置文件中,我们配置信息时,其实就是修改配置文件中的内容。运行配置文件时,根据配置信息的要求,会自动生成需要的宏定义,并把这些宏定义保存到相应的.h(头文件)中。再将.h给c/c++程序,预处理时,条件编译根据.h中定义的宏定义,就能决定保留和编译哪些代码。编译时就只编译保留的代码,最后就得到了针对某个环境的gcc可执行程序,不过这些配置信息会保留gcc中,gcc -v时会显示出来。

Configured with: ../configure  

这句话仅仅只是向我们表明,gcc的配置信息其实是来源于这个文件,这个配置文件并不在我的电脑上,而是在gcc开发者的电脑上,编译gcc时gcc开发者会去设置这个配置文件。

--prefix=/usr  

路径固定前缀,也就是说gcc所使用到的路径都是/usr打头的,换句话说gcc所用到的文件,都在这个/usr目录下。

--with-bugurl=http://bugzilla.redhat.com/bugzilla  

gcc bug报告说明书:如果你发现了gcc的bug,需要按照README.Bugs说明书的要求来提交gcc的bug

--enable-languages  

gcc编译器集合所支持的语言,不过想要编译java等其它语言,需要下载相应的插件

--libdir=/usr/lib  

GCC编译器集合“自带库”所在目录

--enable-java-awt=gtk   

使用gcc编译带界面的java程序,图形界面底层调用的是ubuntu的gtk基础图形库。gcc可以编译java,但是java程序运行需要相应的运行环境(最起码要有个java虚拟机jvm)以下信息描述的就是java的运行环境

--with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre 
--enable-java-home 
--with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 
--with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 
--with-arch-directory=amd64 
--with-ecj-jar=/usr/share/java/eclipse-ecj.jar 
--enable-objc-gc 
View Code

gcc基本选项:

-march=x86-64:intel 64位 x86 cpu  

-mtune=generic:

编译得到的机器指令,属于通用指令集(同款的不同型号的cpu都支持的指令集)。如果需要指定某型号cpu的特殊指令集时,就不能写成generic,而要写特殊指令集名称COLLECT_GCC_OPTIONS='-o' 'helloworld' '-v' '-mtune=generic' '-march=x86-64'

crt1.o、crti.o、crtbegin.o:

用于生成程序的“启动代码”,这三个.o是由GCC编译器集合提供的(由GCC开发者编写的),crt就是c/c++ run time的意思,翻译为中文就是“运行时环境”。

启动代码的作用:搭建c/c++的运行环境

crt1.o:汇编写的。

①里面的_start是整个程序的开始(入口)

②main函数是由crt1.o调用

③c/c++函数运行所需要的栈,是由crt1.o建立的

crti.o:在调用main之前,实现c的一些初始化工作,比如全局变量初始化

crtbegin.o:在调用main之前,实现c++的一些初始化,比如调用全局构造函数,创建全局对象

crtend.o、crtn.o:

用于生成扫尾代码,程序运行结束时,做一些扫尾工作,这两个.o也是由gcc开发者编写的,为了方便描述,我们往往将扫尾代码认为是启动代码的一部分。

crtend.o:扫尾做什么?比如调用c++析构函数,释放全局对象的空间

crtn.o:扫尾做什么?比如,接收main函数的返回值并处理

①如果程序是裸机运行的,返回值到扫尾代码这里就结束了,裸机时返回值的意义不大

②如果程序是基于OS运行的,扫尾代码会将返回值交给OS  

头文件包含

包含""所指定的头文件:到程序员自己指定的路径下去搜索

#include "..." search starts here:

包含<>所指定的头文件:到系统指定的路径下去找

#include <...> search starts here:
/usr/lib/gcc/x86_64-linux-gnu/5/include
/usr/local/include
/usr/lib/gcc/x86_64-linux-gnu/5/include-fixed
/usr/include/x86_64-linux-gnu
/usr/include
End of search list.

汇编

由于as的路径已经被加入到了环境变量中,因此调用as时,并不需要指定as的路径。生成xxx.s汇编文件是一个临时文件,/tmp目录专门用于存放Linux系统所生成的临时文件,一旦编译得到了可执行文件,这个xxx.s将会别删除

链接

collect2为链接器,由于collect2的路径没有加入环境变量,因此需要我们自己指明collect2所在的路径。

/usr/lib/gcc/x86_64-linux-gnu/5/collect2

collect2的选项和参数
...

给程序指定动态链接器:程序运行起来后,用于加载动态库
-dynamic-linker /lib64/ld-linux-x86-64.so.2

最终生成的可执行文件

 
posted @ 2018-08-03 00:17  克拉默与矩阵  阅读(9692)  评论(0编辑  收藏  举报