函数调用的区别:_cdecl以及_stdcall

//本文转自于互联网

函数调用的几个概念:_stdcall,_cdecl....

    1、_stdcall是Pascal程序的缺省调用方式,通常用于Win32 Api中,函数采用从右到左的压栈方式,自己在退出时清空堆栈。VC将函数编译后会在函数名前面加上下划线前缀,在函数名后加上"@"和参数的字节数。

    2、C调用约定(即用__cdecl关键字说明)按从右至左的顺序压参数入栈,由调用者把参数弹出栈。对于传送参数的内存栈是由调用者来维护的(正因为如此,实现可变参数的函数只能使用该调用约定)。另外,在函数名修饰约定方面也有所不同。

    _cdecl是C和C++程序的缺省调用方式。每一个调用它的函数都包含清空堆栈的代码,所以产生的可执行文件大小会比调用_stdcall函数的大。函数采用从右到左的压栈方式。VC将函数编译后会在函数名前面加上下划线前缀。是MFC缺省调用约定。

    3、__fastcall调用约定是“人”如其名,它的主要特点就是快,因为它是通过寄存器来传送参数的(实际上,它用ECX和EDX传送前两个双字(DWORD)或更小的参数,剩下的参数仍旧自右向左压栈传送,被调用的函数在返回前清理传送参数的内存栈),在函数名修饰约定方面,它和前两者均不同。

    _fastcall方式的函数采用寄存器传递参数,VC将函数编译后会在函数名前面加上"@"前缀,在函数名后加上"@"和参数的字节数。   

    4、thiscall仅仅应用于“C++”成员函数。this指针存放于CX寄存器,参数从右到左压。thiscall不是关键词,因此不能被程序员指定。

    5、naked call采用1-4的调用约定时,如果必要的话,进入函数时编译器会产生代码来保存ESI,EDI,EBX,EBP寄存器,退出函数时则产生代码恢复这些寄存器的内容。naked call不产生这样的代码。naked call不是类型修饰符,故必须和_declspec共同使用。

    关键字 __cdecl和__fastcall可以直接加在要输出的函数前,也可以在编译环境的Setting...\C/C++ \Code Generation项选择。当加在输出函数前的关键字与编译环境中的选择不同时,直接加在输出函数前的关键字有效。它们对应的命令行参数分别为/Gz、 /Gd和/Gr。缺省状态为/Gd,即__cdecl。

    要完全模仿PASCAL调用约定首先必须使用__stdcall调用约定,至于函数名修饰约定,可以通过其它方法模仿。还有一个值得一提的是WINAPI 宏,Windows.h支持该宏,它可以将出函数翻译成适当的调用约定,在WIN32中,它被定义为__stdcall。使用WINAPI宏可以创建自己的APIs。

2)名字修饰约定

1、修饰名(Decoration name)

“C” 或者“C++”函数在内部(编译和链接)通过修饰名识别。修饰名是编译器在编译函数定义或者原型时生成的字符串。有些情况下使用函数的修饰名是必要的,如在模块定义文件里头指定输出“C++”重载函数、构造函数、析构函数,又如在汇编代码里调用“C””或“C++”函数等。

修饰名由函数名、类名、调用约定、返回类型、参数等共同决定。

2、名字修饰约定随调用约定和编译种类(C或C++)的不同而变化。函数名修饰约定随编译种类和调用约定的不同而不同,下面分别说明。

    a、C编译时函数名修饰约定规则:

__stdcall调用约定在输出函数名前加上一个下划线前缀,后面加上一个“@”符号和其参数的字节数,格式为_functionname@number

__cdecl调用约定仅在输出函数名前加上一个下划线前缀,格式为_functionname。
  
__fastcall调用约定在输出函数名前加上一个“@”符号,后面也是一个“@”符号和其参数的字节数,格式为@functionname@number。

    它们均不改变输出函数名中的字符大小写,这和PASCAL调用约定不同,PASCAL约定输出的函数名无任何修饰且全部大写。

    b、C++编译时函数名修饰约定规则:

__stdcall调用约定:
          1、以“?”标识函数名的开始,后跟函数名;
          2、函数名后面以mailto:“@@YG
”标识参数表的开始,后跟参数表;
          3、参数表以代号表示:
             X--void ,
             D--char,
             E--unsigned char,
             F--short,
             H--int,
             I--unsigned int,
             J--long,
             K--unsigned long,
             M--float,
             N--double,
             _N--bool,
             ....
             PA--表示指针,后面的代号表明指针类型,如果相同类型的指针连续出现,以“0”代替,一个“0”代表一次重复;
          4、参数表的第一项为该函数的返回值类型,其后依次为参数的数据类型,指针标识在其所指数据类型前;
          5、参数表后以mailto:“@Z
”标识整个名字的结束,如果该函数无参数,则以“Z”标识结束。

    其格式为mailto:“?functionname@@YG*****@Z ”或mailto:“?functionname@@YG*XZ ”,例如
          int Test1(char *var1,unsigned long)mailto:-----“?Test1@@YGHPADK@Z

          void Test2()                       mailto:-----“?Test2@@YGXXZ

__cdecl调用约定:
规则同上面的_stdcall调用约定,只是参数表的开始标识由上面的mailto:“@@YG
”变为mailto:“@@YA ”。

__fastcall调用约定:
规则同上面的_stdcall调用约定,只是参数表的开始标识由上面的mailto:“@@YG
”变为mailto:“@@YI ”。

    VC++对函数的省缺声明是"__cedcl",将只能被C/C++调用.

CB在输出函数声明时使用4种修饰符号
//__cdecl
cb的默认值,它会在输出函数名前加_,并保留此函数名不变,参数按照从右到左的顺序依次传递给栈,也可以写成_cdecl和cdecl形式。
//__fastcall
她修饰的函数的参数将尽肯呢感地使用寄存器来处理,其函数名前加@,参数按照从左到右的顺序压栈;
//__pascal
它说明的函数名使用Pascal格式的命名约定。这时函数名全部大写。参数按照从左到右的顺序压栈;
//__stdcall

在TURBO C中用修饰符cdecl说明的函数或不加说明的函数按照从右向左的顺序将参数压入堆栈,即给定调用函数(a,b,c)后,a最先进栈,然后是b和c。
在进行函数调用时,有几种调用方法,分为C式,Pascal式。在C和C++中C式调用是缺省的,除非特殊声明。二者是有区别的,下面我们用实例说明一下:


1. __cdecl :C和C++缺省调用方式
  例子:
void Input( int &m,int &n);/*相当于void __cdecl Input(int &m,int &n);*/
   以下是相应的汇编代码:
   00401068   lea         eax,[ebp-8] ;取[ebp-8]地址(ebp-8),存到eax
   0040106B   push        eax         ;然后压栈
   0040106C   lea         ecx,[ebp-4] ;取[ebp-4]地址(ebp-4),存到ecx
   0040106F   push        ecx         ;然后压栈
   00401070   call        @ILT+5(Input) (0040100a);然后调用Input函数
   00401075   add         esp,8       ;恢复栈
  
  从以上调用Input函数的过程可以看出:在调用此函数之前,首先压栈ebp-8,然后压栈ebp-4,然后调用函数Input,最后Input函数调用结束后,利用esp+8恢复栈。由此可见,在C语言调用中默认的函数修饰_cdecl,由主调用函数进行参数压栈并且恢复堆栈。
  下面看一下:地址ebp-8和ebp-4是什么?
  在VC的VIEW下选debug windows,然后选Registers,显示寄存器变量值,然后在选debug windows下面的Memory,输入ebp-8的值和ebp-4的值(或直接输入ebp-8和-4),看一下这两个地址实际存储的是什么值,实际上是变量 n 的地址(ebp-8),m的地址(ebp-4),由此可以看出:在主调用函数中进行实参的压栈并且顺序是从右到左。另外,由于实参是相应的变量的引用,也证明实际上引用传递的是变量的地址(类似指针)。
总结:在C或C++语言调用中默认的函数修饰_cdecl,由主调用函数进行参数压栈并且恢复堆栈,实参的压栈顺序是从右到左,最后由主调函数进行堆栈恢复。由于主调用函数管理堆栈,所以可以实现变参函数。另外,命名修饰方法是在函数前加一个下划线(_).

  2. WINAPI (实际上就是PASCAL,CALLBACK,_stdcall)
  例子:
void WINAPI Input( int &m,int &n);
看一下相应调用的汇编代码:
00401068   lea         eax,[ebp-8]
0040106B   push        eax
0040106C   lea         ecx,[ebp-4]
0040106F   push        ecx
00401070   call        @ILT+5(Input) (0040100a)
    从以上调用Input函数的过程可以看出:在调用此函数之前,首先压栈ebp-8,然后压栈ebp-4,然后调用函数Input,在调用函数Input之后,没有相应的堆栈恢复工作(为其它的函数调用,所以我没有列出)
    下面再列出Input函数本身的汇编代码:(实际此函数不大,但做汇编例子还是大了些,大家可以只看前和后,中间代码与此例子无关)

39: void WINAPI Input( int &m,int &n)
40:   {
00401110   push        ebp
00401111   mov         ebp,esp
00401113   sub         esp,48h
00401116   push        ebx
00401117   push        esi
00401118   push        edi
00401119   lea         edi,[ebp-48h]
0040111C   mov         ecx,12h
00401121   mov         eax,0CCCCCCCCh
00401126   rep stos    dword ptr [edi]
41:       int s,i;
42:
43:       while(1)
00401128   mov         eax,1
0040112D   test        eax,eax
0040112F   je          Input+0C1h (004011d1)
44:       {
45:       printf("\nPlease input the first number m:");
00401135   push        offset string "\nPlease input the first number m"... (004260b8)
0040113A   call        printf (00401530)
0040113F   add         esp,4
46:       scanf("%d",&m);
00401142   mov         ecx,dword ptr [ebp+8]
00401145   push        ecx
00401146   push        offset string "%d" (004260b4)
0040114B   call        scanf (004015f0)
00401150   add         esp,8
47:
48:       if ( m<1 ) continue;
00401153   mov         edx,dword ptr [ebp+8]
00401156   cmp         dword ptr [edx],1
00401159   jge         Input+4Dh (0040115d)
0040115B   jmp         Input+18h (00401128)
49:       printf("\nPlease input the first number n:");
0040115D   push        offset string "\nPlease input the first number n"... (0042608c)
00401162   call        printf (00401530)
00401167   add         esp,4
50:       scanf("%d",&n);
0040116A   mov         eax,dword ptr [ebp+0Ch]
0040116D   push        eax
0040116E   push        offset string "%d" (004260b4)
00401173   call        scanf (004015f0)
00401178   add         esp,8
51:
52:       if ( n<1 ) continue;
0040117B   mov         ecx,dword ptr [ebp+0Ch]
0040117E   cmp         dword ptr [ecx],1
00401181   jge         Input+75h (00401185)
00401183   jmp         Input+18h (00401128)
53:
54:       for(i=1,s=0;i<=n;i++)
00401185   mov         dword ptr [ebp-8],1
0040118C   mov         dword ptr [ebp-4],0
00401193   jmp         Input+8Eh (0040119e)
00401195   mov         edx,dword ptr [ebp-8]
00401198   add         edx,1
0040119B   mov         dword ptr [ebp-8],edx
0040119E   mov         eax,dword ptr [ebp+0Ch]
004011A1   mov         ecx,dword ptr [ebp-8]
004011A4   cmp         ecx,dword ptr [eax]
004011A6   jg          Input+0A3h (004011b3)
55:           s=s+i;
004011A8   mov         edx,dword ptr [ebp-4]
004011AB   add         edx,dword ptr [ebp-8]
004011AE   mov         dword ptr [ebp-4],edx
004011B1   jmp         Input+85h (00401195)
56:       if ( m >= s )
004011B3   mov         eax,dword ptr [ebp+8]
004011B6   mov         ecx,dword ptr [eax]
004011B8   cmp         ecx,dword ptr [ebp-4]
004011BB   jl          Input+0AFh (004011bf)
57:           break;
004011BD   jmp         Input+0C1h (004011d1)
58:       else
59:           printf(" m < n*(n+1)/2,Please input again!\n");
004011BF   push        offset string " m < n*(n+1)/2,Please input agai"... (00426060)
004011C4   call        printf (00401530)
004011C9   add         esp,4
60:       }
004011CC   jmp         Input+18h (00401128)
61:
62:   }
004011D1   pop         edi
004011D2   pop         esi
004011D3   pop         ebx
004011D4   add         esp,48h
004011D7   cmp         ebp,esp
004011D9   call        __chkesp (004015b0)
004011DE   mov         esp,ebp
004011E0   pop         ebp
004011E1   ret         8
最后,我们看到在函数末尾部分,有ret 8,明显是恢复堆栈,由于在32位C++中,变量地址为4个字节(int也为4个字节),所以弹栈两个地址即8个字节。
  由此可以看出:在主调用函数中负责压栈,在被调用函数中负责恢复堆栈。因此不能实现变参函数,因为被调函数不能事先知道弹栈数量,但在主调函数中是可以做到的,因为参数数量由主调函数确定。
  下面再看一下,ebp-8和ebp-4这两个地址实际存储的是什么值,ebp-8地址存储的是n 的值,ebp -4存储的是m的值。说明也是从右到左压栈,进行参数传递。

   总结:在主调用函数中负责压栈,在被调用函数中负责弹出堆栈中的参数,并且负责恢复堆栈。因此不能实现变参函数,参数传递是从右到左。另外,命名修饰方法是在函数前加一个下划线(_),在函数名后有符号(@),在@后面紧跟参数列表中的参数所占字节数(10进制),如:void Input(int &m,int &n),被修饰成:_Input@8
   对于大多数api函数以及窗口消息处理函数皆用 CALLBACK ,所以调用前,主调函数会先压栈,然后api函数自己恢复堆栈。
  
   如:
      push edx
      push edi
      push eax
      push ebx
      call getdlgitemtexta
   你可以想一下,这几个寄存器中存的都是什么?

下面是一份总结:

针对于C/C++用户,最常用的两个调用约定是_cdecl和_stdcall(也就是WINAPI,CALLBACK,PASCAL),他们在如下方面不同:

1. 默认支持:VC默认使用_cdecl。所以如果需要使用_stdcall,可采用两种方法:(1)可以在函数名前手工添加,只对单一函数有效 (2)直接修改工程属性(C/C++ > Advanced > Calling Convention)来一次性配置所有的函数
2. 功能不同:_cdecl可实现变长参数列表
3. 代码大小:_stdcall更小
4. 速度不同:_cdecl更快(代码更多当然意味着运行更快,有点像内联函数)

5. 谁负责恢复堆栈:
   _cdecl主调用函数进行参数压栈并且恢复堆栈;
   _stdcall主调用函数进行参数压栈,被调函数恢复堆栈;
   这也正是产生
   1. 不同代码大小的原因:如果使用_cdecl的函数多次调用同一函数,就要产生多份恢复码。
   2. 功能不同的原因:实现变长参数列表。一份恢复码只能将一种长度的参数表出栈,所以要对不同长度的参数表堆栈恢复,必须要有多份代码,所以变长参数必须有主调函数恢复(所以是_cdecl)。

6. 产生的函数名不同:具体见上面讨论(注意这与C++产生修饰名不同)
7. 使用范围:
   _stdcall:通常用于DLL的创建(以支持多语言调用);此外Win32 API函数皆用_stdcall(比如MessageBox),所以Win32程序中的自定义函数也做好使用_stdcall。
   _cdecl:非DLL的console程序。

 

posted on 2008-09-11 18:03  飞天舞者  阅读(2602)  评论(1编辑  收藏  举报

导航

For more information about me, feel free email to me winston.he@hotmail.com