存储类、生命周期、作用域、链接域

Linux下c内存映像

大方向分为

应用空间 + 内核空间

他俩内存空间布局差不多。这里重点回顾分析应用空间布局，应用空间分为：代码段 + 数据段(静态数据段+动态数据段)

代码段

为啥是只读的

代码段在编译时就定好了，在程序的运行过程中，不能在代码段去开辟空间，以及释放空间。

包含哪几部分

ELF头、段头部表、init节

参考：剖析可执行文件ELF组成

.text

指令节，也叫代码节，所有函数中的指令都放在了.text节中。能够与指令直接弄在一起的常量，也随指令一起放在了.text中。

.rodata

常量节，无法直接和指令放在一起的常量，就放在.rodata中。

数据段

静态数据段

为啥是只读的（为啥是静态的）

代码段在编译时就定好了，在程序的运行过程中，不能在代码段去开辟空间，以及释放空间。也不能随意释放已有变量的空间，像这种在编译阶段完成了变量空间安排的情况，就是静态的。

包含哪几部分

.bss

未初始化的静态变量的空间，都开辟于.bss中。

.data

初始化了的静态变量的空间，都开辟于.data。

动态数据段

为什么称为动态的？

变量空间的开辟和释放不是在编译阶段决定的，而是在程序的运行过程中完成的，这就是动态的含义。

包含哪几部分

堆（手动区）

程序在运行的过程中，通过调用malloc函数来开辟空间，以及调用free来释放空间。之所以叫手动的，是因为我们在编写程序时，必须亲自动写调用malloc和free函数的代码。

栈（自动区）

函数运行时自动从栈中开辟空间，函数运行结束时又会自动释放开辟的空间，开辟和释放的过程，完全是自动完成的。从栈里面开辟空间就是压栈，释放空间其实就是弹栈。

存储类

什么是存储类

存储类的全称叫“存储类型”，存储类就是用来说明“常量、变量和函数”的存储位置的，比如自动局部变量在栈中，存储位置为栈，那么它的存储类就是栈。

细说存储类

函数指令

存储类为.text，因为函数指令都是存放在.text中的。函数指令的存储类是固定的，所以函数指令的存储位置是固定不变的。

常量

常量的存储类也是固定的，要么是.text，要么是.rodata。

①当常量比较小时，小到能够和指令放在一起的话，就会和指令一起直接放在.text中。此时常量的存储类为.text。

②常量比较大时，大到无法直接成为指令放在一部分，此时就需要单独的存在.rodata中，此时常量的存储类就为.rodata

全局变量

①初始化了的全局变量，存储类为.data。

②未初始化的全局变量，存储类为.bss

全局变量的存储类也是固定的，要么在.data中要么在.bss。.data、.bss合称为静态数据段，或者静态数据区，所以全局变量的存储类可统称为“静态数据段”。

局部变量

局部变量的存储类不是固定，根据修饰的auto、static、register关键字的不同，存储类不同。

(1)自动局部变量与 auto关键字

fun()
{
    auto int a; //等价于int a，auto可以省略不写
}

View Code

①auto为局部变量的存储类关键字，auto只对局部变量有效。如果不写auto的话，默认就是auto的，所以我们平常定义的局部变量，默认都是auto修饰的。

②auto就是automatic自动的意思，以auto int a为例，auto就表示a的空间是自动开辟、自动释放的，我们知道只有栈才满足自动开辟自动释放的特点，因此auto就表示a的存储类为“栈”。正因为自动开辟、自动释放的特点，auto修饰的局部变量，我们就称为“自动局部变量”。

疑问：怎么感觉auto这个关键字是多余的？

答：auto这个关键字对于我们程序员来说确实是多余的，既然auto可以省略，那我们就不会傻到去把auto写上，auto在C程序中几乎看不到，因为没有那个程序员是傻子。其实这个auto关键字主要是给编译器用的，因为编译器必须通过这个关键字来识别“栈”这个存储类，就算auto被省略了，但是在编译时会被自动加，用以标记局部变量是“栈”这种存储类。

(2)静态局部变量与 staitc关键字

fun()
{
    static int a=100; //static不能省，省了就默认是自动局部变量
    static int b;        //未初始化的静态局部变量
}

View Code

static有两种用法

第一种：修饰局部变量　　当static修饰局部变量时，static用于标记局部变量的存储类。

第二种：修饰函数和全局变量　　与链接域有关

static对应的存储类

初始化了的静态局部变量，存储类为.data。比如例子中的a就被初始化了，所以a的存储类为.data。

未初始化的静态局部变量，在.bss中。比如例子中的b就没有被初始化，所以b的存储类为.bss。

.data和.bss合称为静态数据段，所以静态局部变量的存储类合称为静态数据段。

静态变量

由于全局变量与静态局部变量的存储类都是静态数据段，因此我们就将全局变量和静态局部变量统称为静态变量。

(3)寄存器局部变量与 register关键字

int fun()
{
    register int a=100; //register不能省略，省略了就变为了默认的自动局部变量    
}

View Code

回顾CPU对存储器的访问

存储容量：寄存器 < 1级cache < 2级cache < ... < 内存 < 外存

CPU访问时的访问速度：寄存器>1级cache > 2级cache > ... > 内存 > 外存

以上情况，是由各存储器的材质和制作工艺来决定的。

register为寄存器的意思。使用register修饰局部变量后，局部变量的存储类就为寄存器，也就是说此时局部变量的空间开辟于寄存器中。register修饰的局部变量，我们就称为寄存器局部变量。

疑问：将局部变量的存储类设为register有什么好处？

答：cpu访问寄存器的速度远远> 访问内存的速度，所以如果你希望cpu能够更快速的访问局部变量的话，我们就可以使用register修饰，让局部变量的空间在寄存器中。　　

测试代码

#include <stdio.h>
#include <time.h>             //time函数所需的头文件
int main(void)
{
    register int a = 0;     //寄存器局部变量
    int b = 0;                         //自动局部变量(栈)
    int old_time = 0;                                     
    old_time = time(NULL);                //记录循环开始时的时刻
    for(a=0; a<1000000000; a++);     //循环累加a的值，实现延时
    printf("%ld\n", time(NULL)-old_time); //延时时间 = 结束时刻-其实时刻
        old_time = time(NULL);                 //起始时刻
    for(b=0; b<1000000000; b++);     //延时
    printf("%ld\n", time(NULL)-old_time); //延时时间
    return 0;
}

View Code

疑问：什么时候可以使用“寄存器局部变量”？

答：

（a）如果某个局部变量的访问速度要求很高的，我们就可以使用regster来修饰。

（b）如果程序中某个局部变量的使用频次非常高，此时为了提高访问效率，我们也可以使用register修饰。

register令人糊涂的地方

①第一个令人糊涂的地方：虽然写了register，但不一定有效。如果cpu的寄存器数量很少，比如intel cpu的寄存器数量相对ARM CPU来说就偏少，所以很有可能出现寄存器不够用的情况，如果编译器编译时发现寄存器不够用了，编译器就会将register自动改为auto。说白了就是虽然是register修饰的，但是最终能不能起作用不一定，看编译器。

②就算你不写register，以优化方式编译时，编译器也可能会帮你自动改为register，这里说的是可能会。gcc编译指定Onum优化等级时，其实是我们给了编译器优化权限。这样当编译器觉得代码不够好时，就会进行优化。不过编译器也不是一定会优化为register，因为如果编译器发现寄存器数量不足的话，此时b的存储类就还是auto。

我们应该如何对待register

①明白它的用途，如果你在别人的代码中看到了这个关键字，你要明白这是什么意思。

②在我们自己的程序中，不建议使用。因为这个关键字并不能一定管用，到底管不管用取决于编译器的处理，带有不确定性，因此不建议使用，而且现在确实也用的少了。

形参

一般情况下形参的默认存储类为栈，所以形参空间默认就是开辟于栈中。

疑问：auto、static能不能修饰形参？

不能，这两个关键字不能用于修饰形参，对于形参来说默认的存储类就是栈，不需要auto来说明。

疑问：register能不能修饰形参？

可以，此时存储类为寄存器，所以形参的存储类就两种：

默认：栈

register修饰：寄存器。

ARM下的一个特殊情况

ARM cpu的寄存器特别丰富，为了能够提高效率，编译器在编译针对ARM的c程序时，如果函数的形参小于4个的话，形参的存储类默认会定为register。只有当形参数量超过5个时，第5个以后的形参的存储类才默认为栈。如果编译器编译的是针对Intel CPU的程序的话，由于Intel cpu的寄存器数量相对比较少，所以函数形参的存储类默认都是栈，如果在程序中人为指定为register的话，存储类有可能会是寄存器。

能否使用auto、static、register修饰全局变量

auto和register

全局变量的存储类是固定的，为静态数据区，如果使用auto和register修饰全局变量的话，其实是在尝试使用auto和register将全局变量的存储类改为栈和寄存器，显然这是不行的，这会导致编译出错。

staitc

可以，使用static修饰全局变量时，static与存储类半毛钱关系都没有，static修饰全局变量时只与与链接域有关。

指令、常量、变量的生命周期

什么是生命周期

生命周期，指的就是空间从诞生到消亡。诞生即从内存中开辟出空间。消亡即释放空间。只有在生命周期这段时间内，空间才是有效的，在生命周期外的时间，空间是无效的，不能访问。

指令和常量的生命周期

指令在.text中，常量要么在.text中，要么在.rodata中。指令和常量的生命周期为整个程序运行期间。

.data、.bss变量的生命周期

全局变量和静态局部变量的存储类为.data或者.bss，所以.data、.bss变量指的就是全局变量和静态局部变量，.data、.bss变量的生命周期也为整个程序运行期间。也就是说程序一开始运行时变量空间就存在，直到到整个程序运行结束.data和.bss被释放时，.data和.bss中的全局变量和静态局部变量才会被释放。

int i = 0; //i一直有效，直到程序运行结束
int fun()
{
    static int fnum = 0; //fnum一直有效，直到程序结束，每次调用fun函数时，累加的都是同一个fnum
    printf("%d\n", fnum++);
}
            
int main(void)
{
    for(i=0; i<5; i++)
    {
        fun();
    }
}

View Code

栈变量的生命周期 　　

形参和自动局部变量的存储类为栈，所以栈变量指的就是形参和自动局部变量。定义形参和自动局部变量的代码，编译后会变成代码块的压栈、弹栈指令。

栈变量的生命周期 = 从push指令开辟空间到 pop指令释放空间期间。代码块开始运行时执行push，代码块运行结束时执行pop，因此栈变量的生命周期约等于代码块的生命周期。

疑问：register变量的生命周期？

认为与栈变量相同。

堆变量的生命周期

malloc成功后，堆变量的生命周期开始，调用free将空间释放后，生命周期结束。所以堆变量的生命周期 == malloc 到 free之间的时间。

疑问：如果忘了free怎么办呢？

答：程序运行结束时整个堆会释放，堆中忘了free的堆变量空间自然也会被释放，但是一定要在程序运行时就free，不要等到程序运行结束再释放。

变量和函数的作用域

什么作用域

就是变量和函数起作用的范围，只要在这个范围内，你就可以访问该变量和函数。分为3种

（1）局部变量的代码块作用域

（2）函数和全局变量的本文件作用域

（3）跨文件作用域 —— 链接域，与链接有关

局部变量的代码模块作用域

简单理解就是{}括起来的就是代码块，不要把代码块等价为函数，因为if、for、while等同样有{}这个东西。代码块作用域的范围，从定义处到代码块结束。

int main(void)
{
    int a; //a的代码块作用域：从定义位置开始到main函数的}。
    {
        int b; //b的代码块作用域：定义位置开始到内部}。
        ...
    }
                        
    ...
}

View Code

int b所在的内部{}实际上才是真正的代码块，只不过在广义上我们将所有带{}的都理解为代码块，当然结构体类型定义除外，虽然结构体类型的定义有{}，但不是代码块。

struct student
{               //这个不是代码块
    int num;
    ...
};

View Code

形参的作用域

形参的作用域也是代码块作用域，不过有些特殊的地方需要说明下。

int fun(int n, int buf[][n]) 
{
    ...
}
                            
int main(void)
{
    int buf[3][4] = {{1,2,3,4}, {5,6,7,8}, {9,10,11,12}};
                        
    fun(4, buf);
                    
}

View Code

n的作用域：定义位置开始，到参数列表末尾，再到fun的}

buf[][n]的作用域：定义位置开始，到参数列表末尾，再到fun的}

由于n的作用域覆盖了buf，所以才能在buf中使用n，如果反过来的话fun(int buf[][n]，int n)，编译时会提示buf中的n无法识别，因为buf不在n的作用域内。

函数和全局变量的本文件作用域

本文件作用域的有效范围

从定义位置开始到文件结束。

int main(void)               //main的本文件作用域：从定义位置到文件末尾
{
    fun(g_var1, g_var2);
    return 0;
}
                
int g_var1 = 100;                 //g_var的本文件作用域：从定义位置到文件末尾
int g_var2;
                
int fun(int a)                //fun的本文件作用域：从定义位置到文件末尾
{
    int var;                    
    return var +a;
}

View Code

通过声明改变本文件作用域

在上面的例子中，如果我们想在main函数中使用g_var1、g_var2、fun的话怎么办？

①方法1　　挪到main的前面去。

②方法2　　在main前面进行声明，通过声明将作用域提前。

int g_var1;  
int g_var1; 
int g_var1; 
int g_var1;                     
int g_var2;
int g_var2;
int g_var2;
                
int fun(int a);
                    
int main(void)           
{
    fun(g_var1, g_var2);
}
                    
int g_var1 = 100;                    
int g_var2;
                    
int fun(int a)                
{
    int var;                
    return var +a;
}

View Code

定义与声明的关系

参考：强弱符号关系

声明全局变量的特殊例子

int g_var1;
                    
int main(void)           
{
    extern int g_var1; //声明  
    g_var1 = 100;
}
                    
int fun(int a)                
{
    int var;                    
    return var +a;
}
                    
int g_var1 = 100;

View Code

main函数中extern int g_var1这种的生命方式表示，g_var1只在main函数内有效，对后面的fun无效。

extern可以省略吗？

不能省，省了g_var1就变成main的自动局部变量了，extern表示这个全局变量来自于函数外部。假如你只想在main中使用g_var1，不想让g_var1的作用域覆盖到fun函数，就可以使用这种方法，不过这种声明方式用的确实不多，但是在有些源码中可能会看见，这里需要了解下。同样的，函数也可以进行类似的声明。

int main(void)           
{
    extern int fun(int a); //fun的声明。
    fun(g_var1, g_var2);
}
                    
int fun(int a)                
{
    int var;                    
    return var +a;
}

View Code

局部变量有声明吗？

局部变量没有声明一说，以下做法时错误的。

int main(void)
{
    int a; //声明：错误用法
    a = a + 1;
    int a = 100;
}

View Code

说白了就是，对于局部变量来说，变量符号只能有一个，不允许同名符号重复出现。

同一个.c中，变量同名的问题

全局变量

（a）如果同名变量都是强符号，这会导致变量重复定义，编译时会报错。

（b）如果同名的是弱符号，它只会改变符号的作用域，除此外没有影响

局部变量

不允许存在同名符号。

链接域与 extern、static关键字

链接时主要做两件事

符号解析

1）对全局符号进行符号统一
2）将符号的引用与符号的定义关联起来

地址重定位

链接域 ———— 跨文件作用域

回顾代码块作用域

形参和局部变量的作用域就是代码块作用域，对于形参和局部变量来说，不允许出现同名符号，所以不存在需要统一同名符号的情况。而且代码块作用域只局限在代码块内，与其它文件没有任何关系，所以与链接无关。

回顾本文件作用域

在单个.c中，全局变量和函数的作用域就是本文件作用域，由于允许对全局变量和函数进行声明，所以在单个.c中存在同名符号的问题，编译时需要进行同名符号的统一，统一规则就是强弱符号的统一规则。由于本文件作用域只与当前文件有关，与其它文件无关，因此也与链接无关。

跨文件作用域与 extern关键字

为什么需要跨文件作用域

对于全局变量和函数来说，有时不仅仅只希望在本文件可以被使用，还希望在其它的文件中也能被使用，此时作用域就必须跨越到其它文件中，这就所谓的涉及跨文件作用域。跨文件作用域说白了就是将作用域延伸到到其它文件中。跨文件作用域涉及到多个文件，由于多文件最后要被链接到一起，与链接有关，所以我们也将跨文件作用域称为链接域。

如何实现跨文件的作用域

只要满足两个条件即可。

①将定义标记为extern。extern表示定义的符号是一个全局符号，由于是全局符号，因此对于其它文件来说这个符号是可见的。

②在其它文件中进行声明，声明也需要标记为extern。extern表示声明的符号也是一个全局符号，对于其它文件也是可见的。

正是因为extern将符号标记为了全局可见，在链接阶段才能对全局符号进行“符号统一”。

例子

a.c

extern int a;    
extern int fun();
int main(void)   
{                
                
                 
}

View Code

b.c

int a = 100; //全局符号，extern可以省略
                
int fun()
{
    printf("helloworld\n");
}

View Code

extern可以省略，省略后默认就是extern的，与auto有点像。对于几乎所有的编译器来说，都认可在定义时将extern省略，但是对于声明来说，有些编译其允许省略extern，但是有些就不允许，我们目前使用的gcc就允许声明时省略extern。不过为了保证不出错，经常的做法是，定义时省略extern，但是声明时必须保留extern。

由于全局符号的定义和声明是同名的，所以在链接阶段需要按照强弱符号的统一规则，对全局符号进行统一，声明作为弱符号最后会消失，虽然消失了，但是它却将“作用域跨”拓展到了其它文件中。从这里可以看出，想要实现跨文件作用域的话，必须使用声明这个弱符号来拓展作用域。

不过有一点需要注意，我们说全局变量和全局符号时，这两个全局的意思不相同。

全局变量的“全局”：指的是文件

全局符号的“全局”：指的是整个C工程项目

全局符号的重名问题与 static关键字

全局符号的重名问题

extern所修饰的符号是所有文件都可见的全局符号。如果在不同文件中存在同名强符号的话，全局符号符号统一时就会报错，但是大家要知道一旦C工程变得复杂之后，在不同的文件中，误定义同名的函数和全局变量的情况是无法避免的。为了避免同名全局强符号的错误，我们应该尽量使用static关键字来避免这个问题。

如何理解这句话？

如果只在.c定义，在其他.c extern引用，全局符号统一时就没问题。但现实情况是，有很多定义是在.h中，.h会被很多文件包含，所以如果不加static，全局符号统一时就会出现全局符号同名问题

static修饰函数和全局变量时的作用

将符号标记为本地符号。

什么是本地符号？

所谓本地符号，就是符号只在本文件内可见，其它文件不可见，链接阶段进行全局符号统一时，所有static修饰的本地符号在全局是不可见的，所以不参与链接阶段的符号统一，因此就算同名了也不会报错。

本地符号的作用域

static将符号变为本地符号，说白了就是关闭符号的链接域，或者说关闭符号的跨文件作用域，符号此时只剩下“本文件作用域”。为了最大化的防止重名问题，建议凡事只在本文件起作用，而其它文件根本用不到的函数和全局变量，统统使用static修饰，让符号在全局不可见，防止全局强符号的同名冲突。C中使用static来解决全局强符号的命名冲突，其实是非黑即白的解决方式，为了能够更加精细化的解决命名冲突问题，从c扩展得到c++时，C++引入了命名空间这一概念，当然这个就是属于C++的内容。

总结一下extern 和 static关键字

static

1）修饰局部变量　　与存储类有关，表示局部变量的存储类为静态数据段。

2）修饰全局变量　　与存储类无关，因为全局变量的存储类本来就是固定的静态数据段。static修饰全局变量，表示符号为本地符号，关闭链接域（跨文件作用域），让其在全局不可见。

3）修饰函数　　　　与修饰全局变量是一样的，将符号变为本地符号，关闭链接域，让其全局不可见。

extern

1）修饰函数、全局变量的定义和声明时　　表示符号是全局符号，将链接域（跨文件作用域）被打开，让其全局可见。

2）将函数体外的全局变量和函数，声明到函数内部

int main(void)
{
    extern int a;
    extern int fun();
                            
    a = a+1;
    fun();
}
                        
int a;
int fun()
{
                            
}