C/C++中extern关键字详解

引言

extern可以置于变量或者函数前,以标示变量或者函数的定义在别的文件中提示编译器遇到此变量和函数时在其他模块中寻找其定义。此外extern也可用来进行链接指定。

 

 

 

也就是说extern有两个作用:

一 . extern "C" void fun(int a, int b) 【指定编译规则

1.1 定义介绍

在C++中,导入C函数的关键字是extern,表达形式为extern “C”,extern "C"的主要作用:

  • 一是为了能够正确实现C++代码调用其他C语言代码
  • 二是会指示编译器这部分代码按C语言的编译规则进行编译,而不是C++的,即指示编译规则

编译区别:

  • C++支持函数重载,因此编译器编译函数的过程中会将函数的参数类型也加到编译后的代码中,而不仅仅是函数名;
  • C语言并不支持函数重载,因此编译C语言代码的函数时不会带上函数的参数类型,一般只包括函数名。
//extern "C" 示例
//在C++程序里边声明该函数,会指示编译器这部分代码按C语言的进行编译 
extern "C" int strcmp(const char *s1, const char *s2);  //在C++程序里边声明该函数 
extern "C"
{ 
    #include <string.h>//string.h里边包含了要调用的C函数的声明 
}  
//两种不同的语言,有着不同的编译规则,比如一个函数fun,可能C语言编译的时候为_fun,而C++则是__fun__

1.2 常见问题[编译器无法找到obj模块中的C函数定义]

       在C++环境下使用C函数的时候,常常会出现编译器无法找到obj模块中的C函数定义,从而导致链接失败的情况,应该如何解决这种情况呢?

       C++语言在编译的时候为了解决函数的多态问题,会将函数名和参数联合起来生成一个中间的函数名称,而C语言则不会,因此会造成链接时找不到对应函数的情况,此时C函数就需要用extern “C”进行链接指定,这告诉编译器,请保持我的名称,不要给我生成用于链接的中间函数名

//下面是一个标准的写法:
//在.h文件的头上
#ifdef __cplusplus
#if __cplusplus
extern "C"{
      #endif
      #endif /* __cplusplus */
    …
    …
    //.h文件结束的地方
 #ifdef __cplusplus
 #if __cplusplus
}
#endif
#endif /* __cplusplus */ 

二. extern 修饰变量或函数 声明变量或函数的全局作用域

它声明一个外部符号,以表示该变量或函数是定义在别的文件中的外部符号;对于创建者,它用在头文件中的一个声明之前或一个定义之前,显式说明该符号可以被其他文件使用(有些形式具有默认的外部链接,可以不用extern显式说明)

2.1 extern 变量声明

2.1.1 修饰变量定义介绍

当extern不与"C"在一起修饰变量时,如在头文件中: extern int g_Int; 它的作用就是声明全局变量的作用范围的关键字其声明的变量可以在本模块或其他模块中使用记住它是一个声明不是定义!也就是说B模块(编译单元)要是引用模块(编译单元)A中定义的全局变量或函数时,它只要包含A模块的头文件即可,在编译阶段,模块B虽然找不到该函数或变量,但它不会报错,它会在连接时从模块A生成的目标代码中找到此函数。

注意:这里需要的是“声明”,不是“定义”:

  • 必须使用extern关键字
  • 不能给变量赋初值
extern int a;//声明,正确用法

//下面的都是定义
int a;
int a = 0; 
extern int a =0;

2.1.2 修饰变量使用方法

一般正常使用中,推荐方法是 在.h中声明,在.cpp定义在其他模块中直接#include xx.h头文件,即可访问该变量。另外,不推荐在.h中一次性实现声明和定义(使用不规范可能会造成非法访问以及引起链接错误)。

所以,

// test1.h ,在.h中声明
    extern char g_str[]; // 声明全局变量g_str

// test1.cpp,在.cpp中定义
   #include "test1.h"
   char g_str[] = "123456"; // 定义全局变量g_str
   void fun1() { cout << g_str << endl; }


// test2.h | .cpp,其他模块中include引用test1.h,可直接访问全局变量
  #include "test1.h"
   void fun2()    { cout << g_str << endl;    }

2.2  extern 函数声明

常见extern放在函数的前面成为函数声明的一部分,那么,C语言的关键字extern在函数的声明中起什么作用?如果函数的声明中带有关键字extern,仅仅是暗示这个函数可能在别的源文件里定义,没有其它作用。即下述两个函数声明没有明显的区别

//看不出区别
extern int f(); 
int f();

当然,这样的用处还是有的,就是在程序中取代include “*.h”来声明函数,在一些复杂的项目中,我比较习惯在所有的函数声明前添加extern修饰,关于这样做的原因和利弊可见下面的这个例子:“用extern修饰的全局变量”

/(1) 在test1.h中有下列声明:
    #ifndef TEST1H
    #define TEST1H
    extern char g_str[]; // 声明全局变量g_str
    void fun1();
    #endif

    //(2) 在test1.cpp中
    #include "test1.h"
     char g_str[] = "123456"; // 定义全局变量g_str
     void fun1() { cout << g_str << endl; }

   //(3) 在test1.cpp中。以上是test1模块, 它的编译和连接都可以通过,如果我们还有test2模块也想使用g_str,只需要在原文件中引用就可以了
    #include "test1.h"
     void fun2()    { cout << g_str << endl;    }

//以上test1和test2可以同时编译连接通过,如果你感兴趣的话可以用ultraEdit打开test1.obj,你可以在里面找到"123456"这个字符串,
//但是你却不能在test2.obj里面找到,这是因为g_str是整个工程的全局变量,在内存中只存在一份,test2.obj这个编译单元不需要再有一份了,不然会在连接时报告重复定义这个错误!

   //(4) 有些人喜欢把全局变量的声明和定义放在一起,这样可以防止忘记了定义,如把上面test1.h改为
    extern char g_str[] = "123456"; // 这个时候相当于没有extern
    //然后把test1.cpp中的g_str的定义去掉,这个时候再编译连接test1和test2两个模块时,会报连接错误,这是因为你把全局变量g_str的定义放在了头文件之后,
//test1.cpp这个模块包含了test1.h所以定义了一次g_str,而test2.cpp也包含了test1.h所以再一次定义了g_str,这个时候连接器在连接test1和test2时发现两个g_str。
//如果你非要把g_str的定义放在test1.h中的话,那么就把test2的代码中#include "test1.h"去掉 换成:
extern char g_str[]; void fun2() { cout << g_str << endl; } // 这个时候编译器就知道g_str是引自于外部的一个编译模块了,不会在本模块中再重复定义一个出来,但是我想说这样做非常糟糕,
//因为你由于无法在test2.cpp中使用#include "test1.h",那么test1.h中声明的其他函数你也无法使用了,
// 除非也用都用extern修饰,这样的话你光声明的函数就要一大串,而且头文件的作用就是要给外部提供接口使用的,所以 请记住, 只在头文件中做声明,真理总是这么简单。

三、与关键字static/const区别

3.1 extern 和 static

  •      extern 表明该变量在别的地方已经定义过了,在这里要使用那个变量.
  •      static 表示静态的变量,分配内存的时候, 存储在静态区,不存储在栈上面.

    static 作用范围是内部连接的关系, 和extern有点相反.它和对象本身是分开存储的,extern也是分开存储的,但是extern可以被其他的对象用extern 引用,而static 不可以,只允许对象本身用它. 具体差别

  • 首先,static与extern是一对“水火不容”的家伙,也就是说extern和static不能同时修饰一个变量;
  • 其次,static修饰的全局变量声明与定义同时进行,也就是说当你在头文件中使用static声明了全局变量后,它也同时被定义了;
  • 最后,static修饰全局变量的作用域只能是本身的编译单元,也就是说它的“全局”只对本编译单元有效,其他编译单元则看不到它
 //(1) test1.h:
    #ifndef TEST1H
    #define TEST1H
    static char g_str[] = "123456";
    void fun1();
    #endif

 //(2) test1.cpp:
    #include "test1.h"
    void fun1()  {   cout << g_str << endl;  }
 
//(3) test2.cpp
    #include "test1.h"
    void fun2()  {   cout << g_str << endl;  }

以上两个编译单元可以连接成功, 当你打开test1.obj时,你可以在它里面找到字符串"123456",同时你也可以在test2.obj中找到它们,它们之所以可以连接成功而没有报重复定义的错误是因为虽然它们有相同的内容,但是存储的物理地址并不一样,就像是两个不同变量赋了相同的值一样,而这两个变量分别作用于它们各自的编译单元。 也许你比较较真,自己偷偷的跟踪调试上面的代码,结果你发现两个编译单元(test1,test2)的g_str的内存地址相同,于是你下结论static修饰的变量也可以作用于其他模块,但是我要告诉你,那是你的编译器在欺骗你,大多数编译器都对代码都有优化功能,以达到生成的目标程序更节省内存,执行效率更高,当编译器在连接各个编译单元的时候,它会把相同内容的内存只拷贝一份,比如上面的"123456", 位于两个编译单元中的变量都是同样的内容,那么在连接的时候它在内存中就只会存在一份了,如果你把上面的代码改成下面的样子,你马上就可以拆穿编译器的谎言:

 // (1) test1.cpp:
    #include "test1.h"
    void fun1()
    {
        g_str[0] = ''a'';
        cout << g_str << endl;
    }

  // (2) test2.cpp
    #include "test1.h"
    void fun2()  {  cout << g_str << endl;  }

  // (3) void main()     {
        fun1(); // a23456
        fun2(); // 123456
    }

    这个时候你在跟踪代码时,就会发现两个编译单元中的g_str地址并不相同,因为你在一处修改了它,所以编译器被强行的恢复内存的原貌,在内存中存在了两份拷贝给两个模块中的变量使用正是因为static有以上的特性,所以一般定义static全局变量时,都把它放在原文件中而不是头文件,这样就不会给其他模块造成不必要的信息污染,同样记住这个原则吧!

3.2 extern 和 const

   C++中const修饰的全局常量据有跟static相同的特性,即它们只能作用于本编译模块中,但是const可以与extern连用来声明该常量可以作用于其他编译模块中, 如extern const char g_str[];
    然后在原文件中别忘了定义:     const char g_str[] = "123456"; 

    所以当const单独使用时它就与static相同,而当与extern一起合作的时候,它的特性就跟extern的一样了!所以对const我没有什么可以过多的描述,我只是想提醒你,

     const char* g_str = "123456" 与 const char g_str[] ="123465"是不同的, 前面那个const 修饰的是char *而不是g_str,它的g_str并不是常量,它被看做是一个定义了的全局变量(可以被其他编译单元使用), 所以如果你像让char*g_str遵守const的全局常量的规则,最好这么定义const char* const g_str="123456".

 

 

总结及注意事项

  当函数提供方单方面修改函数原型时,如果使用方不知情继续沿用原来的extern申明,这样编译时编译器不会报错。但是在运行过程中,因为少了或者多了输入参数,往往会照成系统错误,为了解决这个情况,目前业界针对这种情况的处理没有一个很完美的方案,通常的做法是提供方在自己的xxx_pub.h中提供对外部接口的声明,然后调用方include该头文件,从而省去extern这一步。以避免这种错误。宝剑有双锋,对extern的应用,不同的场合应该选择不同的做法。

extern修饰变量 的作用

  • 假如a.h中有 int a=10; t1.cpp和t2.cpp同时include "a.h"则编译不成功,因为a重复定义;
  • 如果 a.h中是 static int a=10;则可以,因为t1和t2中的a只是名字相同,地址空间不同;
  • 如果a.h中是 extern int a; 并且在a.cpp中 int a=10; 则t1和t2中的a指向同一个地址空间。

造成LNK2005错误

重复定义全局变量。可能存在两种情况:
1.  对于一些初学编程的程序员,有时候会以为需要使用全局变量的地方就可以使用定义申明一下。其实这是错误的,全局变量是针对整个工程的。正确的应该是在一个CPP文件中定义如下:int g_Test;那么在使用的CPP文件中就应该使用:extern int g_Test即可,如果还是使用int g_Test,那么就会产生LNK2005错误,一般错误错误信息类似:AAA.obj error LNK2005 int book c?book@@3HA already defined in BBB.obj。切记的就是不能给变量赋值否则还是会有LNK2005错误。
这里需要的是“声明”,不是“定义”!根据C++标准的规定,一个变量是声明,必须同时满足两个条件:(1)声明必须使用extern关键字;(2)不能给变量赋初值


2.   对于那么编程不是那么严谨的程序员,总是在需要使用变量的文件中随意定义一个全局变量,并且对于变量名也不予考虑,这也往往容易造成变量名重复,而造成LNK2005错误。

https://www.cnblogs.com/yc_sunniwell/archive/2010/07/14/1777431.html

posted on 2021-08-24 11:16  斗战胜佛美猴王  阅读(973)  评论(0)    收藏  举报