符号修饰与函数签名、extern “C”

参考资料：

《程序员的自我修养》3.5.3以及3.5.4小节。

符号修饰的由来

20世纪70年代以前，编译器编译代码时产生的目标文件中，符号名与相应的变量和函数的名字是一样的，随着编程语言的发展，例如C语言，如果一个C语言程序要使用这些库的话，其自身就不能使用这些库中已经声明了的函数和变量的名字作为符号名，否则将会跟现有的目标文件发生名称冲突。

为了防止这类符号名冲突，各平台下的编程语言规定了各自的符号生成语法。如C在UNIX下在函数名和变量前加下划线作为符号名。这种给函数名增加特定符号来使其符号名唯一的方式就是符号修饰。

这种简单的符号修饰没有从根本上解决符号冲突的问题，比如同一种编程语言编写的目标文件之间还有可能产生符号冲突，当程序很大时，不同的部门之间也有可能会产生符号冲突，于是C++这类语言开始加上了命名空间（namespace)来解决多模块符号冲突问题。

为了支持C++拥有类、继承、虚机制、重载、命名空间等这些特性，人们发明了符号修饰修饰（或者称为符号改编），被修饰之前的函数名称以及其返回值和参数等信息，被称为函数签名。不同的编译器采用不同的名字修饰方法，因为导致由不同的编译器编译产生目标文件无法正常相互链接。

extern “C”

C++为了与C兼容，在符号的管理上，C++有一个用来声明或定一个C的符号的“extern ”C"”关键字用法：

extern "C" int add(int a, int b);
extern "C" int a;
// 或者
//extern "C"
//{
//    int add(int a, int b);
//    int a;
//};

注意：extern “C”中的C必须大写。

C++编译器会将在extern “C”的大括号内（或者后面的）代码当作C语言代码来处理。所以很明显，上面的代码就是为了将add函数和变量a声明成C的方式，因为有可能他们的定义是放在.c文件中的。

举例：

// c_code.h file in c_project project
#pragma once
int add(int a, int b);

// c_code.c file in c_project project
#include "c_code.h"
int  add(int a, int b)
{
    return a + b;
}

如果我们有一个main.c，代码如下

#include "c_code.h"
#include "stdio.h"
#include <conio.h>
int main(void)
{
    printf("%d + %d = %d\n", 3, 3, add(3,3));

    _getch();
    return 0;
}

编译链接运行都没错。那么现在我们把main.c文件重命名成main.cpp，代码不变，会发生链接错误： error LNK2019: unresolved external symbol "int __cdecl add(int,int)" (?add@@YAHHH@Z) referenced in function _main。这里的链接错误就是指没有找到符号“?add@@YAHHH@Z”。这个符号就是"int __cdecl add(int,int)"修饰后的符号名。

原因是C的符号修饰方式和C++的符号修饰方式不同，导致同样的声明会产生不同的符号名。这里main.cpp是一个cpp文件，会使用cpp的方式进行编译链接，而add的定义却是在.c文件里面，因而会链接不上。

接下来尝试使用extern “C”，让add函数在main.cpp中编译链接时，使用C的符号修饰方式，这里有两种方法：

extern "C" int add(int a, int b);        // 在这里声明add函数，不使用c_code.h头文件
int main(void)
{
    printf("%d + %d = %d\n", 3, 3, add(3,3));

    _getch();
    return 0;
}

extern "C"            // 显示的将c_code.h所有声明都使用C方式修饰
{
    #include "c_code.h"
}
#include "stdio.h"
#include <conio.h>
int main(void)
{
    printf("%d + %d = %d\n", 3, 3, add(3,3));

    _getch();
    return 0;
}

以上两种方式其实是一样的，这里因为c_code.h中只有一个函数，所以使用第一种方法也很简单，但是如果头文件中有很多函数声明，使用第二种方法就简单多了。

由于C++是对C语言的扩展，我们常常会需要使用C的库函数，这些库函数的定义都是用.c文件实现的，那么为了避免每次我们在使用库函数的时候，都去用extern “C”关键字修饰其头文件，这些标准库头文件中往往都包含了如下代码来解决这个问题。

// c_code.h file in c_project project
#pragma once

#ifdef __cplusplus
extern "C"{
#endif

    int add(int a, int b);

#ifdef __cplusplus
}
#endif

意思是，如果编译的时候发现__cplusplus宏已经定义，则给后面的函数声明都加上extern “C”，以用C方式修饰，否则不处理。而__cplusplus宏是C++编译器在编译C++程序时默认定义的宏（其实我们也可以自己在.cpp文件的顶部定义一个宏)，显然，在.cpp文件中包含这种头文件的时候，就会将这些个函数声明成用C方式修饰，而如果在.c文件中包含时，就不会加上extern “C”修饰。这就解释了为什么之前main.c能直接编译通过，而main.cpp不能的原因。

后记

其实这篇博文主要就为了介绍extern “C”的用法，在网上能搜到很多用法介绍，我也看了好几篇，但是就是感觉有种不是很透彻的感觉，于是就去找了这本参考书，看完之后就比较明了了。所以说，有些知识看起来很简单，但是如果不是很透彻理解的话，还是太容易忘记。

posted on 2012-11-16 18:43 好好单调阅读(975) 评论(0) 编辑收藏举报